python - 计算 3 个未共享的数据帧中的条目数的最佳方法是什么?
问题描述
我有三个数据框,它们是有关国家/地区的各种统计数据的摘要。我在“国家名称”列上创建了三个数据框的连接。但我想知道从连接中排除的三个原始数据框中存在多少条目。明智的代码计算方法是什么?
解决方案
由于您没有提供代码和数据框,因此不清楚您的三个数据框连接的输出是什么。您还应该考虑熊猫默认联接是左联接,因此重新排列数据框可能会改变结果。
但是,它不会改变解决方案。我假设您有一个名为 df 的数据框(您说您是通过连接创建的),并且您正在寻找这三个数据框上存在的 df 中所有缺失的索引。
第一步是使用how = 'outer'
参数加入所有数据帧。输出应该包含所有数据帧的所有索引([df1,df2,df3])
。第二步就像获取 full_df 和 df 的索引差异一样简单。
这是代码
full_df = pd.join([df1,df2,df3], how = 'outer')
missing_indices = full_df.index.difference(df.index)
print(missing_indices)
推荐阅读
- python - .loc 在具有相同条件的多个列上
- node.js - 为什么我只在一个帖子路线中出现禁止错误?
- mysql - 失败:Linux MySql 数据库上的 Microsoft.EntityFrameworkCore.Database.Command[20102]
- python - turtle.write() 函数不在海龟窗口中写入
- javascript - 防止并发ajax请求,让他们等待
- javascript - 是否有任何 JavaScript 测试框架在没有 babel 或其他转译器的情况下原生支持 ES6 导入?
- flutter - 如何使用 jwt 保持 100 % 的应用程序安全(flutter 和 php)
- python - 调用小区时小区杂乱,需要划分小区
- python - TimeoutException:InstaBot 用于评论
- scala - 如何在特定位置使用spark scala在aws s3中写入(不是来自数据帧)文件(如果位置不存在则自动创建位置)