首页 > 解决方案 > 通过 multiindex 将 Series 分配给 DataFrame

问题描述

df_a = pd.DataFrame(data = [[1,2,3], [1,2,3], [1,2,3], [1,2,3]], index = [['a', 'a', 'a', 'a'], ['b', 'b', 'b', 'b'] ], columns=['A', 'B', 'C'])

     A  B  C
a b  1  2  3
  b  1  2  3
  b  1  2  3
  b  1  2  3

我有系列:

df_b = pd.Series(data = [1,2,3, 4], index = [['a', 'a', 'a', 'a'], ['b', 'b1', 'b2', 'b3'] ])

a  b     1
   b1    2
   b2    3
   b3    4

我正在尝试将 Series 分配给 DataFrame

    idx = df_a.index.intersection(df_b.index)
    df_a.loc[idx]['new_column'] = df_b.loc[idx]

但我得到:

     A  B  C
a b  1  2  3
  b  1  2  3
  b  1  2  3
  b  1  2  3

我希望得到:

     A  B  C new_column
a b  1  2  3   1
  b  1  2  3   1
  b  1  2  3   1
  b  1  2  3   1

知道有什么问题吗?

标签: pythonpandasdataframeindexingseries

解决方案


直接赋值就行了。默认情况下,系列分配按索引对齐:

df_a['new_column'] = df_b

print(df_a)

     A  B  C  new_column
a b  1  2  3           1
  b  1  2  3           1
  b  1  2  3           1
  b  1  2  3           1

推荐阅读