python - 左合并在 Pandas Dataframes 中不起作用
问题描述
我正在尝试合并两个数据框df
和df1
. 每个 df 的 csv 超过 10gb 并且有数百万行,所以当我尝试合并时,我的内核一直在死亡。
我可以使用 spark 为此启用多核处理吗?如何避免内核错误?我有一个公共列df
,df1
我正在尝试使用merged = pd.merge(df, df1, on='Number and postcode', how = 'left')
. 使用left
合并的原因是因为df
在一列中有许多重复项。我想保留这些并查找 df 和 df1 在number and postcode
.
解决方案
推荐阅读
- xml - 如何使用 TXMLDocument 避免异常“禁止 DTD”
- asp.net-mvc - EF6 使用列默认值创建代码优先表
- rust - Rust 中的模式匹配如何与 `let` 语句一起使用
- actions-on-google - 谷歌智能家居操作的文档中没有示例话语
- php - 如何使用自己的实例构建订阅应用程序
- ecmascript-6 - 通过 ECMAScript 6 中的装饰器向基于类的查找表添加方法
- excel - Autofilter VBA,我如何检查条件是否不存在?
- windows - Windows CMD 批处理脚本 FFmpeg
- xamarin - 在 Apple Silicon M1 Mac 上运行的 iOS 应用程序的默认应用程序中打开文件
- html - 如何让禁用选项在选择 html 时变为粗体和黑色?