首页 > 解决方案 > 如何加入大量数据框

问题描述

我有 35 个相同格式的表(股票),其中有 2 列:["Trading_date","volume"]。如何使用 Pandas python 将它们全部加入以具有这种格式的加入表:["Trading_date", "volume_1","volume_2",...,"volume_35"] 并保留所有但删除重复的“Trading_date”。例如:表 1 有 5 行,表 2 有 7 行,两个表在“Trading_date”共享 4 行。两个表的连接将有 8 行,row["volume"] 中的缺失值将分配为 0 或 null (首选 0) 非常感谢您的帮助。

标签: pythonpandas

解决方案


import pandas as pd
tables = [...] # your tables...
for i, tab in enumerate(tables):
    try: merged = pd.merge(merged, tab, how='left', on ='Trading_date', suffixes=('', '_%s'%(i)))
    except: merged = tab

推荐阅读