python - pandas read_csv 问题/警告
问题描述
我正在尝试从公共数据集中读取数据 https://www.kaggle.com/cityofLA/los-angeles-parking-citations#parking-citations.csv
我的命令:
parking_data=pd.read_csv("/datasets/parking-citations.csv",delimiter=',',dtype={'Issue Date' : str, 'Issue time':str, 'Marked Time': str, 'Plate Expiry Date':str})
当我尝试将数据读入 pandas datfarame 时,只有当我制作“标记时间”时才会收到以下警告:dtype 中的 str。
警告
DtypeWarning: Columns (0,7) have mixed types. Specify dtype option on import or set low_memory=False.
有人可以给我一个为什么我得到它的理由吗?
它看起来Marked Time
有一些NaN
值,但我在 dtype 中给出的其他一些列也是如此。
解决方案
您的警告来自第 0 列('Ticket Number')和第 7 列('VIN')
df = pd.read_csv('parking-citations.csv', dtype={'Ticket number':str, 'VIN':str})
因此,指定这些列的类型可以解决问题。
推荐阅读
- f# - F# 使用通用参数调用 .Net 函数 - 不会编译
- architecture - 如何将 HTML/CSS/JS 存储在数据库中,或者基本上为每个用户构建独特的页面?
- jenkins-pipeline - 使用 Jenkins 对项目列表(可能在文件中)执行相同的工作流
- python - Google 使用 python 抓取 - 请求:如何避免因请求过多而被阻止?
- web-services - 资源文件在tomcat webservice操作后不显示更改
- javascript - 获取特定参数为空的数组中的第一项
- asp.net - microsoft 3rd 方身份验证 live.com 而不是 microsoftonline.com
- reactjs - “ReactJs”重置状态但不重置唯一 ID
- python - 处理 ValueError 的便捷方法:无法从重复轴重新索引
- r - 使用查找表(或数据字典)重命名多个 data_frames 的变量