python - 在现有的 pandas df 中添加缺少观测值的变量,而不会丢失较大 df 中的观测值
问题描述
我有两个数据框。一个叫 ENFORE,有 139 个观察结果:
citation Enfore
0170/0952 1
0175/0686 1
0184/0521 1
0183/0726 1
0178/0595 0
另一个名为 CITATIONS 的数据框有 668 个观察值,也有列引用,但没有 Enfore。ENFORE 中的所有引文都在 CITATIONS 数据框中。
我想将 Enfore 列添加到 CITATIONS 数据框中,并用“X”填写不在 ENFORE 数据框中的观察结果。
使用此代码的各种变体(合并和连接)
enfore_merged = pd.merge(enfore , harrington_citations, on = 'citation')
我无法创建上面描述的数据框。
解决方案
你快到了:
enfore_merged = harrington_citations.merge(enfore, how='left', on='citation')
enfore_merged['Enfore'] = enfore_merged['Enfore'].fillna('X')
推荐阅读
- elasticsearch - 我可以定义要快照的分片吗?
- python-3.x - 通过硒单击“更多”按钮
- javascript - 交互式多边形形状
- javascript - 按钮需要点击 2 次才能工作。- 香草 JavaScript
- dart - 如何在 Flutter 的 AppBar 中制作相同的颜色
- javascript - 尝试将多个 ID 添加到 twitter 推文功能
- c - 把字符变成数字并在c中排列数字
- javascript - 配置文件名称中的 rc 代表什么?
- elasticsearch - 在弹性中索引海量数据的最快方法
- javascript - 正则表达式检查引荐来源网址字符串