首页 > 解决方案 > pandas read_csv 问题/警告

问题描述

我正在尝试从公共数据集中读取数据 https://www.kaggle.com/cityofLA/los-angeles-parking-citations#parking-citations.csv

我的命令:

parking_data=pd.read_csv("/datasets/parking-citations.csv",delimiter=',',dtype={'Issue Date' : str, 'Issue time':str, 'Marked Time': str, 'Plate Expiry Date':str})

当我尝试将数据读入 pandas datfarame 时,只有当我制作“标记时间”时才会收到以下警告:dtype 中的 str。

警告

DtypeWarning: Columns (0,7) have mixed types. Specify dtype option on import or set low_memory=False.

有人可以给我一个为什么我得到它的理由吗?

它看起来Marked Time有一些NaN值,但我在 dtype 中给出的其他一些列也是如此。

标签: pythonpandas

解决方案


您的警告来自第 0 列('Ticket Number')和第 7 列('VIN')

df = pd.read_csv('parking-citations.csv', dtype={'Ticket number':str, 'VIN':str})

因此,指定这些列的类型可以解决问题。


推荐阅读