首页 > 解决方案 > 熊猫合并创建重复行

问题描述

我想逐行合并两个相似的数据框

我的代码:

d5=pd.DataFrame([["Id1",5313.0],["Id1",414542.0]])
d5.columns=["Id","Random"]
d6=pd.DataFrame([["Id1",15616.0],["Id1",168449.0]])
d6.columns=["Id","Random"]

我得到的是:

Id1 5313.0 15616.0
Id1 5313.0 168449.0
Id1 414542.0 15616.0
Id1 414542.0 168449.0

我想要的是:

Id1 5313.0 15616.0
Id1 414542.0 168449.0

我不明白他为什么要创建两个单独的行..

另外,如果我想在我的第一个数据框中再增加一列,我想在第二个数据框中指示一个 Nan 值,如下所示:

Id1 5313.0 15616.0
Id1 414542.0 168449.0
Id1 113.0 NaN

是不是因为我有同一个ID?

标签: pythonpandas

解决方案


df = pd.concat([d5,d6] , join='outer',axis=1).reset_index(drop=True) #this will join the dataframe right side

df.T.drop_duplicates().T # this will drop the duplicate column

推荐阅读