首页 > 解决方案 > 熊猫读取具有不同数量字段的 csv 文件

问题描述

我通过检查特定时间戳的活动数据库进程的计数来分析数据库性能。一个例子如下:

CloseStatement,ClusterIndexScanVecOutJob<ScanRangePredicate>,ExecQidItab,ExecutePrepared,ExecuteStatement,NoAction,PrepareStatement,core/stat,timestamp

1,1,2,15,1,1,5,1,2020-03-30T18:15:24.378238

CloseCursor,ClusterIndexScanVecOutJob<ScanRangePredicate>,CommitTrans,ExecQidItab,ExecutePrepared,ExecuteStatement,JobParallelMgetSearch,NoAction,ParallelFor Job,PrepareStatement,SearchPartJob,core/stat,flushing,timestamp

1,1,1,6,16,1,2,1,9,2,5,1,1,2020-03-30T18:16:24.435657

第一行是数据库进程的名称,后面的行包含每个进程的编号。例如,在时间戳 2020-03-30T18:15:24.378238 有 1 个名为“CloseStatement”的数据库进程和 15 个“ExecutePrepared”进程

我正在尝试根据特定时间的进程计数来构建统计数据。从 pandas 的角度来看,每个实例的标题(CloseStatement、CloseCursor)都不同,而且它们也不统一。如何将其导入数据框?谢谢你的时间!

标签: pandas

解决方案


推荐阅读