python - 仅使用熔化和枢轴将选定的列转换为转置?
问题描述
我有这样的数据框:
id Gender TV Radio
0 M Daily Daily
1 F Monthly Weekly
2 M Weekly Weekly
3 F Daily Daily
我需要将列更改为值并将值更改为列,这是我想要的输出。
id Gender Daily Monthly Weekly
0 M TV NaN NaN
0 M Radio NaN NaN
1 F NaN TV Weekly
2 M NaN NaN TV
2 M NaN NaN Radio
3 F TV NaN NaN
3 F Radio NaN NaN
我正在使用melt+pivot,但我丢失了信息。这是我正在使用的。
idx = ['id', 'Gender']
m = df.melt(idx).pivot_table(index=idx,columns='value',values='variable',aggfunc='first')
out = m.reset_index(idx).rename_axis(index=None,columns=None)
但我只得到第一个值。例如,如果每天发生在电视和广播中,那么我只得到第一个值。我知道我只是先聚合,但不知道我可以使用哪个函数来获取所有值。
id Gender Daily Monthly Weekly
0 M TV NaN NaN
1 F NaN TV Weekly
2 M NaN NaN TV
3 F TV NaN NaN
解决方案
通过重复DataFrame.melt
值GroupBy.cumcount
用于计数器,然后Series.unstack
用于重塑:
idx = ['id', 'Gender']
m = df.melt(idx)
m['g'] = m.groupby(idx).cumcount()
m = m.set_index(idx + ['g', 'value'])['variable'].unstack()
out = m.reset_index(idx).rename_axis(index=None,columns=None)
print (out)
id Gender Daily Monthly Weekly
0 0 M TV NaN NaN
1 0 M Radio NaN NaN
0 1 F NaN TV NaN
1 1 F NaN NaN Radio
0 2 M NaN NaN TV
1 2 M NaN NaN Radio
0 3 F TV NaN NaN
1 3 F Radio NaN NaN
推荐阅读
- mysql - mysql.service:主进程退出,code=exited,status=1/FAILURE
- python - 使用 Python 的未定义引用
- bash - 如何在 golang 中运行 shell 命令
- xml - 如何在 XSLT 3.0 中重命名多重属性名称?
- reactjs - 为什么子组件没有在反应中呈现
- json - POSTrequest 上的 Postman SpringBoot RestApi 状态码 415
- python - 如何使用 Django 在网站中实现图像识别系统?
- ruby-on-rails - 将参数传递给 new_path 并增加创建计数
- c++ - C++:在函数指针向量中存储和调用函数指针
- amazon-web-services - 我应该为移动应用选择 DAX 的 API 网关缓存吗?