python - 如何为转置数据创建新列
问题描述
我正在尝试使用 pandas 数据框将一行转换为新列。访问 ID 是唯一标识符。我使用了 df.pivot 和 df.melt 但 df.melt 似乎相反。我对 Python 很陌生,我给它一个开始,但我很迷茫。有什么建议么?
电流输入:
访问 ID | DX 代码 | 保险 | 小学或中学 |
---|---|---|---|
1 | 123 | 安泰 | 基本的 |
1 | 234 | 亲和力 | 中学 |
2 | 456 | 虚拟网络 | 中学 |
2 | 789 | 医疗保险 | 基本的 |
期望的输出:
访问 ID | DX 代码 | DX 代码2 | 基本的 | 中学 |
---|---|---|---|---|
1 | 123 | 234 | 安泰 | 亲和力 |
2 | 456 | 789 | 医疗保险 | 虚拟网络 |
import pandas as pd
df = pd.read_excel(r'C:\Users\TEST.xlsx', sheet_name = 'Sheet1')
# pivot = df.pivot(index='Visit ID', columns='DX Code', values = 'DX ID')
# print(pivot)
# melt = df.melt(value_name='DX Code', var_name='DX Code2')
# print(melt)
解决方案
您可以使用merge
:
out = pd.merge(df[df['Primary or Secondary'] == 'Primary'],
df[df['Primary or Secondary'] == 'Secondary'],
on='Visit ID', suffixes=('', '2'))
剩下的只是重新格式化:
out = out[['Visit ID', 'DX Code', 'DX Code2', 'Insurance', 'Insurance2']] \
.rename(columns={'Insurance': 'Primary', 'Insurance2': 'Secondary'})
>>> df
Visit ID DX Code DX Code2 Primary Secondary
0 1 123 234 Aetna Affinity
1 2 789 456 Medicare VNS
推荐阅读
- python - Python 遗产
- ruby-on-rails - 在 Rails 上编码 mailer ruby 时出现问题
- javascript - 从数组数组中查找每天的第一个和最后一个时间戳
- reactjs - React Redux - 无法通过调度操作传递字符串
- hibernate - 在 MappedSuperclass 中为 ElementCollection 使用共享表
- ios - 应用程序在没有堆栈跟踪的情况下在 NSPredicate 上崩溃
- lazarus - 如何在lazarus中调试dll
- c - TCP 连接:重新创建已关闭的套接字
- ios - null 不是对象(评估'__gCrWeb.form.wasEditedByUser.set')
- django - 模型的 max_length 字段在 localhost 上不起作用