首页 > 解决方案 > 使用 pandas 从文本文件中提取字符串

问题描述

import pandas as pd
s = pd.read_csv("DIM.txt")
print(s)

这很好用,我在不同的行中得到如下输出

abc,fgc,vvb....
sdc,trl,bgv...

我喜欢逐行显示如下

abc:fgc
sdc:trl

标签: python-3.xpandas

解决方案


如我所见,您的输入文件没有“标题”(列名)行。所以在这种情况下你应该传递header=None参数。

另一个细节是s(变量名)可以与Series相关联。由于 read_csv 的结果一个DataFrame,所以使用df变量名。

总而言之,读取文件的代码应该是:

df = pd.read_csv("DIM.txt", header=None)

结果(对于您的输入样本)是:

     0    1        2
0  abc  fgc  vvb....
1  sdc  trl   bgv...

(如果您的样本包含更多逗号,则会有更多列)。

要生成您想要的结果(第0列和第 1列的串联),请运行:

result = df[0] + ':' + df[1]

结果是:

0    abc:fgc
1    sdc:trl
dtype: object

推荐阅读