首页 > 解决方案 > read_excel vs read_csv:object-dtype 列行为

问题描述

我有一张桌子,其中一列如下所示:

COLUMN
string_value
string_value
string_value
0
0
0
string_value
...

read_csv

df = pd.read_csv('file.csv')

df.COLUMN.isin(['0']).any(),-> 是的。

read_excel

df = pd.read_excel('file.xslx')

df.COLUMN.isin(['0']).any()-> 错误。

df.COLUMN.isin([0]).any()-> 真的。

为什么会这样?两列都被读取为对象 dtype,但数字在 read_csv 中被解析为字符串,在 read_excel 中被解析为数字。

标签: pythonpandas

解决方案


推荐阅读