首页 > 解决方案 > 如何在唯一列上使用熊猫将多个 CSV 文件合并到一个数据框中

问题描述

我有几个共享一列的 csv 文件:“unique_id”。我想使用 pandas 将所有 csv 文件合并为一个 csv 文件。每个文件的行数不同。我想让输出 csv 文件具有唯一的列。如果合并的文件包含缺失值,那很好。我真的很困惑如何做到这一点。我想要的一个例子如下:

csv1:
unique_id      date_of_birth      registered  
15ab           11/2/1990          Yes  
19qz           10/3/1980          No  
20b3                              Yes  
11b9a          3/18/1943  
4r2p                              No  
12p3           8/17/2003  

csv2:  
unique_id      fav_color     parents_alive  
15ab           blue          yes  
19qz           green         yes                              
11b9a                        no                  
12p3           pink    
79b2b2         red

csv3:  
unique_id     married       years_of_education   
15ab          Yes           8  
19qz          No            12  
79b2b2        Yes           6
2224b                       5  
100qwe3       Yes  
333o4         Yes           16    

Output csv:  
unique_id    date_of_birth    registered    fav_color    parents_alive    married    years_of_education
15ab         11/2/1990        Yes           blue         yes              Yes        8
19qz         10/3/1980        No            green        yes              No         12
20b3                          Yes
11b9a        3/18/1943                                   no
4r2p                          No
12p3         8/17/2003                      pink
79b2b2                                      red                           Yes        6
2224b                                                                                5
100qwe3                                                                   Yes
333o4                                                                     Yes        16

标签: pythonpandascsvmerge

解决方案


推荐阅读