首页 > 解决方案 > 从 txt 文件生成 pandas 数据框

问题描述

我有一个大的txt文件,格式如下:

0
1
2
3
4
La situacion es preocupante
5
6
Radio es parte de la vida
7
Dejare de querer muy pronto

我需要生成一个类似于以下内容的熊猫数据框:

  Texto
0 NaN
1 NaN
2 NaN
3 NaN
4 La situacion es preocupante
5 NaN
6 Radio es parte de la vida
7 Dejare de querer muy pronto

使用以下代码,我得到不正确的输出:

import pandas as pd
data = pd.read_csv("nohup.out",sep="\\n")

    0
0   1
1   2
2   3
3   4
4   La situacion es preocupante
5   5
6   6
7   Radio es parte de la vida
8   7
9   Dejare de querer muy pronto

感谢您的时间

标签: pythonpandas

解决方案


您可以像这样使用DataFrame.replace

df['0'].replace(to_replace=r'^\d*$', value=np.nan, regex=True)
0                            NaN
1                            NaN
2                            NaN
3                            NaN
4    La situacion es preocupante
5                            NaN
6                            NaN
7      Radio es parte de la vida
8                            NaN
9    Dejare de querer muy pronto

尽管您可能需要整理您的输入文件以获得您想要的内容。


推荐阅读