python - 在 Pandas 中混合 DataFrame
问题描述
我无法弄清楚如何“混合”两个 DataFrame。我所追求的是用df_A
在类似 DataFrame 中找到的值填写 DataFrame 中的“缺失”值df_B
。我已经尝试了不同的版本,join
但显然还没有得出结果。
而且,
例如
dict_a = {'ID' : ['id_a', 'id_b', 'id_c', 'id_c'], 'A': ['Hello', 2, 3, 3], 'B': [3, 4, 5, 55], 'C': [11, 'World', 15, 25], 'Date': ['2018-10-23', '2018-10-23', '2018-10-23', '2018-10-24']}
dict_b = {'ID' : ['id_c', 'id_a'], 'A': [np.nan, 31], 'B': [np.nan, 55], 'C': [11, np.nan], 'Date': ['2018-10-23', '2018-10-23']}
df_A = pd.DataFrame(data=dict_a)
df_B = pd.DataFrame(data=dict_b)
>> df_A
>> A B C ID Date
0 Hello 3 11 id_a 2018-10-23
1 2 4 World id_b 2018-10-23
2 3 5 15 id_c 2018-10-23
3 3 55 25 id_c 2018-10-24
>> df_B
>> A B C ID Date
0 NaN NaN 11.0 id_c 2018-10-23
1 31.0 55.0 NaN id_a 2018-10-23
期望的结果应该看起来像(伪代码)
>> df_blended = df_B.values if df_A.isnan() else df_A.values where df_A.ID = df_B.ID and df_A.Date= df_B.Date
>> df_blended
>> A B C ID Date
0 3 5 11.0 id_c 2018-10-23
1 31.0 55.0 11 id_a 2018-10-23
因此,优先使用 df_B,其次使用 df_A。希望可以理解!
谢谢
解决方案
df = df_B.combine_first(df_A)
print (df)
A B C
0 Hello 32.0 11
1 22 4.0 World
2 31 55.0 15
或numpy.where
,但所有数据都转换为字符串:
df = pd.DataFrame(np.where(df_B.isnull(), df_A, df_B), index=df_A.index, columns=df_A.columns)
print (df)
A B C
0 Hello 32 11
1 22 4 World
2 31 55 15
编辑:首先merge
使用默认内部连接,然后选择列rename
并使用combine_first
:
df = df_B.merge(df_A, on=['ID','Date'], suffixes=('','_'))
cols = df.columns[df.columns.str.endswith('_')]
df = df[df_B.columns].combine_first(df[cols].rename(columns=lambda x: x.strip('_')))
print (df)
A B C Date ID
0 3.0 5.0 11.0 2018-10-23 id_c
1 31.0 55.0 11.0 2018-10-23 id_a
推荐阅读
- apache - 我的虚拟主机为我的所有域名加载第一个启用的站点
- jquery - 如何向 jQuery Selectbox 插件 0.3 添加新类
- java - 需要有关实现多个条件的逻辑的帮助
- angular - 到服务器的角度路由,但通过拦截器应用令牌标头
- swiftui - SwiftUI:ObservableObject 不更新其他视图
- ruby-on-rails - 组合 2 个作用域以从原始作用域获得具有 A、B、A、B、A、B 顺序的单个作用域(就像 zip.flatten 对数组一样)
- postgresql - 将 Apache Airflow Server 连接到安全的 PostgreSQL 实例
- node.js - 我在nodejs中收到空对象
- python - 使用 python 拟合经验分布
- python - 在 Python 中使用 WCS 在银河坐标中绘制 Halpha 地图的 FITS 图像