python-3.x - 合并 2 列上的两个数据框
问题描述
df1 有 92851 行 × 6 列,
df2 有 92851 行 × 3 列。
但是当我尝试将两个数据帧合并为一个时,我得到的基数为 255089 行 × 7 列。它应该是 92851 行 x 7 列。
为什么会这样?
df=pd.merge(df1,df2,on=['source','destination'])
解决方案
您可以使用join
而不是合并。
SCALA 代码
val newDF = df1
.join(df2, Seq("source", "destination"), "left_outer")
蟒蛇代码
newDF = df1
.join(df2, ['source', 'destination'], 'left_outer')
推荐阅读
- python - 为给定方程的固定变量获取分离的 RHS 和 LHS
- javascript - 如何将 3D 模型加载到三个 JS(JSON 格式)
- vue.js - 将 NuxtJS 用于没有服务器目标的动态路由
- javascript - 在 jquery 中复制到剪贴板
- python - 如何防止 Excel 在我的公式中随机添加 @ 字符
- excel - 为什么使用命名范围时 AND 函数会将结果折叠为单个值?
- sed - 如何在正则表达式匹配的行之后修改文件中的所有行
- c - 二分法。C代码中的优化函数
- node.js - 异步函数返回 UnhandledPromiseRejectionWarning 与 try/catch (axios)
- node.js - socket.io 连接问题 node.js 托管在域上