首页 > 解决方案 > 将 2D numpy 数组转换为行列值 pandas DataFrame

问题描述

假设我有一个像这样的二维 numpy 数组:

arr = np.array([[1, 2], [3, 4], [5, 6]])
# array([[1, 2],
#        [3, 4],
#        [5, 6]])

如何将其转换为“长”结构,每个值有一条记录,与行和列索引相关联?在这种情况下,它看起来像:

df = pd.DataFrame({'row': [0, 0, 1, 1, 2, 2],
                  'column': [0, 1, 0, 1, 0, 1],
                  'value': [1, 2, 3, 4, 5, 6]})

melt只分配列标识符,而不是行:

pd.DataFrame(arr).melt()
#   variable    value
# 0        0        1
# 1        0        3
# 2        0        5
# 3        1        2
# 4        1        4
# 5        1        6

有没有办法附加行标识符?

标签: pythonpandasnumpy

解决方案


传递index给 idvar:

pd.DataFrame(arr).reset_index().melt('index')
#    index variable  value
# 0      0        0      1
# 1      1        0      3
# 2      2        0      5
# 3      0        1      2
# 4      1        1      4
# 5      2        1      6

您可以重命名:

df = pd.DataFrame(arr).reset_index().melt('index')
df.columns = ['row', 'column', 'value']

推荐阅读