python-3.x - 为选定的 Mainstep 解析和创建新数据集
问题描述
我有一个巨大的数据文件,其中包含字符串作为每一列的标题。在这 17 列中,第二列有MainSteps
,我想用它来绘制剩余列中存在的参数。例如:
column1 column2 cloumn3 column4 column5 column6 column7 ......
num1 Mainstep1 num3 num5 num7
num2 Mainstep1 num4 num6 ...
... ... ... ... ...
... Mainstep2 ... ... ...
要求是根据 进行解析Mainstep1
,然后仅获取从 csv 文件中记录的所有参数Mainstep1
。column1
使用这些参数,在vs.column3
或column5
vs.之间进行绘图column6
。
我是编程新手。有时我很难找到程序员用来提问的准确词汇。请询问是否需要就问题含义进行澄清。
首选输出是打印对应于特定 .x 轴和 y 轴两个参数的所有数据Mainstep
。我希望我的问题很清楚。
解决方案
像下面这样使用熊猫的东西对你有用吗?
import pandas as pd
my_df = pd.read_csv('/location/to/so_sample.csv', sep='\t')
filtered_df = my_df[my_df.column2=='Mainstep1']
基本上,filtered_df 将包含 column2 为 Mainstep1 的所有行。你可以打电话
filtered_df.column1
filtered_df.column3
获得所需的行集来绘制图表
推荐阅读
- url - 如何为 SEO 偏爱特定版本的网站?
- python - 检查是否选择了下拉项
- xamarin - Xamarin 表单的 OnAppearing 会发生什么?
- python - Python Zeep - 多个 WSDL 文件
- jenkins - 在 Jenkins Pipeline 上,如何指定名称中包含“某些文本”的代理
- sql - case语句中字段不等于null的问题
- adobe - Adobe XD 无法自动启动产品,请手动退出并启动。(错误代码 111)
- python-2.7 - eventlet.monkey_patch() 忽略子进程
- c - 带数组的指针算术
- sorting - 编写汇编代码,对堆栈内存中的以下数字进行排序:2、34、3、12、8