首页 > 解决方案 > Python - 如何在 3 列上组合两个数据框并保留两个数据框中的列?

问题描述

我有两个数据框,我想将它们添加到另一个之上,由 3 列连接,但还要保留两个数据框中的列。

这两个数据框是:

data_top = [{'Date': '15/06/2021', 'Code_top': 'a', 'ID_top': 1, 'Portfolio_top':100, 'Currency': 'EUR', 'Country': 'France', 'Sector': 'Finance', 'Name':'Bradley', 'Classification': 'xyz', 'Data_Type':0, 'Value': 3000000.5,'Weight': 0.05, 'Floor': 'Flag'}, 
    {'Date': '15/06/2021', 'Code_top': 'b', 'ID_top': 2, 'Portfolio_top':200, 'Currency': 'EUR', 'Country': 'Germany', 'Sector': 'Real Estate', 'Name':'ApartmentsInc.', 'Classification': 'xyz', 'Data_Type':0, 'Value': 2000000.5,'Weight': 0.02, 'Floor': 'Flag'}]


data_bottom = [{'Code_bottom': 'a', 'ID_bottom': 1, 'Portfolio_bottom':100, 'Price': 151.9, 'Delta': -1000},    
           {'Code_bottom': 'b', 'ID_bottom': 2, 'Portfolio_bottom':200, 'Price': 25.5, 'Delta': 1000}]

data_top = pd.DataFrame(data_top)
data_bottom = pd.DataFrame(data_bottom)

最终结果应如下所示:'

data_combined = [{'Date': '15/06/2021', 'Code_top': 'a',    'ID_top': 1, 'Portfolio_top':100, 'Currency': 'EUR', 'Country': 'France', 'Sector': 'Finance', 'Name':'Bradley', 'Classification': 'xyz', 'Data_Type':0, 'Value': 3000000.5,'Weight': 0.05, 'Floor': 'Flag'}, 
             {'Date': '15/06/2021', 'Code_top': 'b',    'ID_top': 2, 'Portfolio_top':200, 'Currency': 'EUR', 'Country': 'Germany', 'Sector': 'Real Estate', 'Name':'ApartmentsInc.', 'Classification': 'xyz', 'Data_Type':0, 'Value': 2000000.5,'Weight': 0.02, 'Floor': 'Flag'},
             {'Date': '15/06/2021', 'Code_top': 'a',    'ID_top': 1, 'Portfolio_top':100, 'Currency': 'EUR', 'Country': 'France', 'Sector': 'Finance', 'Name':'Bradley.', 'Classification': 'xyz', 'Data_Type':0, 'Value': 3000000.5,'Weight': 0.05, 'Floor': 'Flag', 'Price':151.9, 'Delta':-1000},
             {'Date': '15/06/2021', 'Code_top': 'b',    'ID_top': 2, 'Portfolio_top':200, 'Currency': 'EUR', 'Country': 'Germany', 'Sector': 'Real Estate', 'Name':'ApartmentsInc.', 'Classification': 'xyz', 'Data_Type':0, 'Value': 2000000.5,'Weight': 0.02, 'Floor': 'Flag', 'Price': 25.5, 'Delta': 1000},
             ]

data_top = pd.DataFrame(data_top)

两个数据框和最终结果

我做了一些尝试,但没有成功。谁能帮我解决这个问题?先感谢您!

标签: pythondataframemergemultiple-columnsrows

解决方案


我希望我正确理解了您的问题:

x = data_top.merge(
    data_bottom,
    left_on=["Code_top", "ID_top", "Portfolio_top"],
    right_on=["Code_bottom", "ID_bottom", "Portfolio_bottom"],
)
out = pd.concat([data_top, x[data_top.columns.tolist() + ["Price", "Delta"]]])
print(out)

印刷:

         Date Code_top  ID_top  Portfolio_top Currency  Country       Sector            Name Classification  Data_Type      Value  Weight Floor  Price   Delta
0  15/06/2021        a       1            100      EUR   France      Finance         Bradley            xyz          0  3000000.5    0.05  Flag    NaN     NaN
1  15/06/2021        b       2            200      EUR  Germany  Real Estate  ApartmentsInc.            xyz          0  2000000.5    0.02  Flag    NaN     NaN
0  15/06/2021        a       1            100      EUR   France      Finance         Bradley            xyz          0  3000000.5    0.05  Flag  151.9 -1000.0
1  15/06/2021        b       2            200      EUR  Germany  Real Estate  ApartmentsInc.            xyz          0  2000000.5    0.02  Flag   25.5  1000.0

推荐阅读