首页 > 解决方案 > 为选定的 Mainstep 解析和创建新数据集

问题描述

我有一个巨大的数据文件,其中包含字符串作为每一列的标题。在这 17 列中,第二列有MainSteps,我想用它来绘制剩余列中存在的参数。例如:

column1 column2     cloumn3    column4    column5   column6   column7 ......
num1    Mainstep1    num3       num5       num7
num2    Mainstep1    num4       num6       ...
...     ...          ...        ...        ...

...     Mainstep2    ...       ...         ...

要求是根据 进行解析Mainstep1,然后仅获取从 csv 文件中记录的所有参数Mainstep1column1使用这些参数,在vs.column3column5vs.之间进行绘图column6

我是编程新手。有时我很难找到程序员用来提问的准确词汇。请询问是否需要就问题含义进行澄清。

首选输出是打印对应于特定 .x 轴和 y 轴两个参数的所有数据Mainstep。我希望我的问题很清楚。

标签: python-3.x

解决方案


像下面这样使用熊猫的东西对你有用吗?

import pandas as pd

my_df = pd.read_csv('/location/to/so_sample.csv', sep='\t')
filtered_df = my_df[my_df.column2=='Mainstep1']

基本上,filtered_df 将包含 column2 为 Mainstep1 的所有行。你可以打电话

filtered_df.column1
filtered_df.column3

获得所需的行集来绘制图表


推荐阅读