首页 > 解决方案 > 无法读取 Pandas 数据框中的 TweetId

问题描述

我在 excel 文件中有一个推文 ID 列表(没有值)

ID
1258125182063050753
1233371388620263429
1237667024618258432
1225204912755179521
nan
nan

当我尝试在 Pandas 数据报中加载 excel 文件时,我将字符串列转换为干扰使用

df['ID']=df['ID'].apply(np.int64)

我得到的价值观是

 1258125182063050752
 1233371388620263424
 1237667024618258432
 1225204912755179520
 0
 0

字符串到整数的转换会改变数值。我该如何纠正这个问题?

标签: pythonpython-3.xpandastweepy

解决方案


Excel文件中可能存在数字精度问题,因为在检查纯python时,我看到转换不会改变数字:

df['ID2'] = df['ID'].apply(np.int64)
df['ID2'] == df['ID']

0    True
1    True
2    True
3    True
dtype: bool

推荐阅读