首页 > 解决方案 > 如何循环和优化数据提取 - Python

问题描述

我已经为我正在做的一个小家庭项目制作了这个简短的代码,以便为我提供 .csv 文件中不等于 1 的不同列的值的索引号,然后我用它在 .txt 文件中查找另一个链接值使用所述指标值。

df = pd.DataFrame(pd.read_csv('Results.csv',  sep=','))
df1 = df.loc[df["Results 1"] != 1, 'Results 1']
print(df1)

这给了我这个,

335    0.962
436    0.990
898    0.990

然后我手动选择索引值以在 .txt 文件中使用它来查找链接值,

df2 = pd.read_csv('Results 1.txt', header=None, skiprows=1, usecols=[1], sep='\t')
print(df2[335:336], df2[436:437], df2[898:899])

这给了我,

         1
335  3.022          1
436  3.522          1
898  3.483

我有 100 个文件正在尝试重复此过程,并希望将所有结果绘制在单个图上。

我想知道你们是否可以帮助我了解如何设置我可以使用的循环或 if 语句,这样我就不仅仅是复制和粘贴代码 100 次。如果你们有任何指向有用网页的链接或任何非常有用的提示!

TIA

笔记:

.csv 文件包含我用来查找索引值的所有 .txt 文件的结果。

所有结果文件夹都命名为“Results #.txt”,编号为 1 - 100

标签: pythonpandasdataframecsv

解决方案


推荐阅读