python - 如何使用 Nan 读取 Pandas 中的 CSV 文件?
问题描述
我有一个txt文件:
24688 1965 12 31 12 0 0 0.0 -48.3
24688 1965 12 31 15 0 0 -47.2
24688 1965 12 31 18 0 0 -49.0
24688 1965 12 31 21 0 0 0.0 -48.1
24688 1966 1 1 0 0 0 0.0 -52.5
…………
我正在尝试使用此 DataFrame
data = pd.read_csv('/home/igor/py/normdata.txt', header=None, sep='\s+')
24688 1965 12 31 12 0 0 0.0 -48.3
24688 1965 12 31 15 0 0 Nan -47.2
24688 1965 12 31 18 0 0 Nan -49.0
24688 1965 12 31 21 0 0 0.0 -48.1
24688 1966 1 1 0 0 0 0.0 -52.5
但我得到:
24688 1965 12 31 12 0.0 0.0 0.0 -48.3
24688 1965 12 31 15 0.0 0.0 -47.2 Nan
24688 1965 12 31 18 0.0 0.0 -49.0 Nan
24688 1965 12 31 21 0.0 0.0 0.0 -48.1
24688 1966 1 1 0 0.0 0.0 0.0 -52.5
谁能帮我?
解决方案
你应该告诉 Pandas 分隔符最多包含四个空格:
pd.read_csv('/home/igor/py/normdata.txt', sep="\s{1,4}",
header=None)
您也可以考虑使用pandas.read_fwf()
,因为您的表格具有固定宽度格式。
推荐阅读
- node.js - 机器人和用户识别、渠道团队和直线
- c# - Wiremock 请求给出 404
- c++ - 奇怪的输出 C++
- javascript - text.slice 不是函数 - 如何从 ReactMardown 组件中切片一些文本?
- docker - GKE Kubernetes Ingress 未将流量路由到微服务
- javascript - 在 Node.JS 上使用 Puppeteer&Python 解决验证码
- reactjs - React Native 中涉及时间延迟的两种不同代码实现
- azure - Azure 函数将文件发送到 sftp 服务器
- sql-server - 如果客户/客户投诉报告无法在 SSRS 中正确加载,那么作为开发人员首先要做什么?
- google-sheets - 将文本从谷歌表格中的范围获取到不在表格中的谷歌文档