python - Python - 如何在 3 列上组合两个数据框并保留两个数据框中的列?
问题描述
我有两个数据框,我想将它们添加到另一个之上,由 3 列连接,但还要保留两个数据框中的列。
这两个数据框是:
data_top = [{'Date': '15/06/2021', 'Code_top': 'a', 'ID_top': 1, 'Portfolio_top':100, 'Currency': 'EUR', 'Country': 'France', 'Sector': 'Finance', 'Name':'Bradley', 'Classification': 'xyz', 'Data_Type':0, 'Value': 3000000.5,'Weight': 0.05, 'Floor': 'Flag'},
{'Date': '15/06/2021', 'Code_top': 'b', 'ID_top': 2, 'Portfolio_top':200, 'Currency': 'EUR', 'Country': 'Germany', 'Sector': 'Real Estate', 'Name':'ApartmentsInc.', 'Classification': 'xyz', 'Data_Type':0, 'Value': 2000000.5,'Weight': 0.02, 'Floor': 'Flag'}]
data_bottom = [{'Code_bottom': 'a', 'ID_bottom': 1, 'Portfolio_bottom':100, 'Price': 151.9, 'Delta': -1000},
{'Code_bottom': 'b', 'ID_bottom': 2, 'Portfolio_bottom':200, 'Price': 25.5, 'Delta': 1000}]
data_top = pd.DataFrame(data_top)
data_bottom = pd.DataFrame(data_bottom)
最终结果应如下所示:'
data_combined = [{'Date': '15/06/2021', 'Code_top': 'a', 'ID_top': 1, 'Portfolio_top':100, 'Currency': 'EUR', 'Country': 'France', 'Sector': 'Finance', 'Name':'Bradley', 'Classification': 'xyz', 'Data_Type':0, 'Value': 3000000.5,'Weight': 0.05, 'Floor': 'Flag'},
{'Date': '15/06/2021', 'Code_top': 'b', 'ID_top': 2, 'Portfolio_top':200, 'Currency': 'EUR', 'Country': 'Germany', 'Sector': 'Real Estate', 'Name':'ApartmentsInc.', 'Classification': 'xyz', 'Data_Type':0, 'Value': 2000000.5,'Weight': 0.02, 'Floor': 'Flag'},
{'Date': '15/06/2021', 'Code_top': 'a', 'ID_top': 1, 'Portfolio_top':100, 'Currency': 'EUR', 'Country': 'France', 'Sector': 'Finance', 'Name':'Bradley.', 'Classification': 'xyz', 'Data_Type':0, 'Value': 3000000.5,'Weight': 0.05, 'Floor': 'Flag', 'Price':151.9, 'Delta':-1000},
{'Date': '15/06/2021', 'Code_top': 'b', 'ID_top': 2, 'Portfolio_top':200, 'Currency': 'EUR', 'Country': 'Germany', 'Sector': 'Real Estate', 'Name':'ApartmentsInc.', 'Classification': 'xyz', 'Data_Type':0, 'Value': 2000000.5,'Weight': 0.02, 'Floor': 'Flag', 'Price': 25.5, 'Delta': 1000},
]
data_top = pd.DataFrame(data_top)
我做了一些尝试,但没有成功。谁能帮我解决这个问题?先感谢您!
解决方案
我希望我正确理解了您的问题:
x = data_top.merge(
data_bottom,
left_on=["Code_top", "ID_top", "Portfolio_top"],
right_on=["Code_bottom", "ID_bottom", "Portfolio_bottom"],
)
out = pd.concat([data_top, x[data_top.columns.tolist() + ["Price", "Delta"]]])
print(out)
印刷:
Date Code_top ID_top Portfolio_top Currency Country Sector Name Classification Data_Type Value Weight Floor Price Delta
0 15/06/2021 a 1 100 EUR France Finance Bradley xyz 0 3000000.5 0.05 Flag NaN NaN
1 15/06/2021 b 2 200 EUR Germany Real Estate ApartmentsInc. xyz 0 2000000.5 0.02 Flag NaN NaN
0 15/06/2021 a 1 100 EUR France Finance Bradley xyz 0 3000000.5 0.05 Flag 151.9 -1000.0
1 15/06/2021 b 2 200 EUR Germany Real Estate ApartmentsInc. xyz 0 2000000.5 0.02 Flag 25.5 1000.0
推荐阅读
- python - _tkinter.TclError:未知选项“-image”
- angular - 使用谷歌角度获取城市建议
- jenkins - 从脚本控制台删除文件夹内所有作业的旧版本
- ansible - 如何创建默认的空字典以在 Ansible 中组合过滤器?
- java - Java 11 + Tomcat 9 = java.lang.module.FindException:找不到模块 java.xml.bind
- windows - Docker Stack Deploy 无法访问 Mapping 的端口
- merge - 如何基于嵌套值合并对?
- uml - 用例图关系
- mysql - MYSQL COUNT(column) 意外返回多行
- laravel - 在 laravel 迁移中指定连接