python - 无法读取 Pandas 数据框中的 TweetId
问题描述
我在 excel 文件中有一个推文 ID 列表(没有值)
ID
1258125182063050753
1233371388620263429
1237667024618258432
1225204912755179521
nan
nan
当我尝试在 Pandas 数据报中加载 excel 文件时,我将字符串列转换为干扰使用
df['ID']=df['ID'].apply(np.int64)
我得到的价值观是
1258125182063050752
1233371388620263424
1237667024618258432
1225204912755179520
0
0
字符串到整数的转换会改变数值。我该如何纠正这个问题?
解决方案
Excel文件中可能存在数字精度问题,因为在检查纯python时,我看到转换不会改变数字:
df['ID2'] = df['ID'].apply(np.int64)
df['ID2'] == df['ID']
0 True
1 True
2 True
3 True
dtype: bool
推荐阅读
- typescript - 类型扩展不适用于通用累加器
- sql - 如何在SQL中合并两个表并将具有相同ID的值相加?
- firebase - 如何从 Firebase Firestore 访问特定用户的信息?
- firebase - 如何在 GCP 中启用 Firebase 实时数据库?
- .htaccess - 我可以在 .htaccess 文件中有条件行吗?
- python - TKinter 多次按键
- scikit-learn - 模型选择 & 选择贝叶斯高斯混合模型中的活动组件数量
- mysql - 从批处理调用 MySQL 中的存储过程
- vue.js - Vue无法读取未定义的属性'$root'
- sql - 在 PostgreSQL 中插入之前触发,但某些列除外