python - 使用 pandas 读取 CSV 时出现 KeyError
问题描述
我有一个 1200 万行和 9 个列的 CSV 文件。
我得到一个
Keyword
错误不是一个MemoryError
,不是一个重复的问题。
我需要2nd lowest rate
为每个zipcode
.
我已经读过它来处理来自 CSV 文件的大数据集,您需要分块读取它们并将代码应用于每个块。
我有这个:
import pandas as pd
import csv
for df in pd.read_csv('slcsp/new_df.csv', sep='\t', iterator=True, chunksize=1000):
df.groupby('zipcode').rate.nsmallest(2).reset_index().drop('level_1',1) \
.drop_duplicates(subset=['zipcode'], keep='last')
但出现错误:
KeyError : 'zipcode' #但是有一列叫做zipcode
我检查过,有一个名为zipcode
.
Traceback (most recent call last):
File "slcsp/slcsp.py", line 19, in <module>
df.loc[df.groupby('zipcode').rate.rank(method='first').eq(2),['zipcode','rate']]
File "D:\virtual_envs\web_scrapping\lib\site-packages\pandas\core\generic.py", line 7632, in groupby
observed=observed, **kwargs)
File "D:\virtual_envs\web_scrapping\lib\site-packages\pandas\core\groupby\groupby.py", line 2110, in groupby
return klass(obj, by, **kwds)
File "D:\virtual_envs\web_scrapping\lib\site-packages\pandas\core\groupby\groupby.py", line 360, in __init__
mutated=self.mutated)
File "D:\virtual_envs\web_scrapping\lib\site-packages\pandas\core\groupby\grouper.py", line 578, in _get_grouper
raise KeyError(gpr)
KeyError: 'zipcode'
解决方案
推荐阅读
- python - 如何从运行在 QThread 中的服务器捕获信号
- php - PDO - 根据用户国家更改日期和时间的显示格式
- c# - 如何监听数据库的变化?
- react-native-navigation - react-native-navigation 中顶部栏菜单操作的样式选项
- windows - __appdir__ 在 cmd.exe 和 Start > Run 之间是不同的
- java - 将 Kafka 连接的状态传播到就绪执行器指示器
- python-3.x - 使用函数读取和写入文件
- json - 将列表转储到 Athena 可接受的 JSON 文件中
- javascript - 如何计算摆的运动?
- javascript - 为什么javascript在RN webview中不起作用但桌面浏览器工作正常?