python - 从 txt 文件生成 pandas 数据框
问题描述
我有一个大的txt文件,格式如下:
0
1
2
3
4
La situacion es preocupante
5
6
Radio es parte de la vida
7
Dejare de querer muy pronto
我需要生成一个类似于以下内容的熊猫数据框:
Texto
0 NaN
1 NaN
2 NaN
3 NaN
4 La situacion es preocupante
5 NaN
6 Radio es parte de la vida
7 Dejare de querer muy pronto
使用以下代码,我得到不正确的输出:
import pandas as pd
data = pd.read_csv("nohup.out",sep="\\n")
0
0 1
1 2
2 3
3 4
4 La situacion es preocupante
5 5
6 6
7 Radio es parte de la vida
8 7
9 Dejare de querer muy pronto
感谢您的时间
解决方案
您可以像这样使用DataFrame.replace:
df['0'].replace(to_replace=r'^\d*$', value=np.nan, regex=True)
0 NaN
1 NaN
2 NaN
3 NaN
4 La situacion es preocupante
5 NaN
6 NaN
7 Radio es parte de la vida
8 NaN
9 Dejare de querer muy pronto
尽管您可能需要整理您的输入文件以获得您想要的内容。
推荐阅读
- google-apps-script - 避免 Excel 转换 Google 脚本中的 UrlFetchApp 超时错误
- tableau-api - Tableau 与 Microsoft SQL Server 2017 的连接
- c# - StructureMap -> Lamar .NET Core 3.1 服务创建不起作用
- java - 卷曲命令不起作用(Spring Boot 项目)
- reactjs - 提交后重置表单输入
- android - 改造 - @Part MultipartBody.Part 未触发 API
- android - 删除它自己添加的标记
- java - 我的加密程序需要帮助
- c - 关于递归过程的C编程问题
- html - 需要帮助使用 HTML 字体样式