首页 > 解决方案 > 如何为转置数据创建新列

问题描述

我正在尝试使用 pandas 数据框将一行转换为新列。访问 ID 是唯一标识符。我使用了 df.pivot 和 df.melt 但 df.melt 似乎相反。我对 Python 很陌生,我给它一个开始,但我很迷茫。有什么建议么?

电流输入:

访问 ID DX 代码 保险 小学或中学
1 123 安泰 基本的
1 234 亲和力 中学
2 456 虚拟网络 中学
2 789 医疗保险 基本的

期望的输出:

访问 ID DX 代码 DX 代码2 基本的 中学
1 123 234 安泰 亲和力
2 456 789 医疗保险 虚拟网络
import pandas as pd

df = pd.read_excel(r'C:\Users\TEST.xlsx', sheet_name = 'Sheet1')

# pivot = df.pivot(index='Visit ID', columns='DX Code', values = 'DX ID')
# print(pivot)

# melt = df.melt(value_name='DX Code', var_name='DX Code2')
# print(melt)

标签: pythonpandaspivot-table

解决方案


您可以使用merge

out = pd.merge(df[df['Primary or Secondary'] == 'Primary'],
               df[df['Primary or Secondary'] == 'Secondary'],
               on='Visit ID', suffixes=('', '2'))

剩下的只是重新格式化:

out = out[['Visit ID', 'DX Code', 'DX Code2', 'Insurance', 'Insurance2']] \
          .rename(columns={'Insurance': 'Primary', 'Insurance2': 'Secondary'})
>>> df
   Visit ID  DX Code  DX Code2   Primary Secondary
0         1      123       234     Aetna  Affinity
1         2      789       456  Medicare       VNS

推荐阅读