python-3.x - 如何将熊猫数据框从宽形拆分为高形
问题描述
我有一个包含这种结构的数据框,并且我已经弄清楚了如何通过这样做来“取消旋转”df,但我很确定这不是我想要的更 Pythonic 的方式。你能建议一个更好的方法吗?:
v = [[{'BIN_ID_WDM': i, 'DSIMILARITY': df1.D1[i], 'BIN_ID_IHS': df1.ID1[i]},
{'BIN_ID_WDM': i, 'DSIMILARITY': df1.D2[i], 'BIN_ID_IHS': df1.ID2[i]},
{'BIN_ID_WDM': i, 'DSIMILARITY': df1.D3[i], 'BIN_ID_IHS': df1.ID3[i]},
{'BIN_ID_WDM': i, 'DSIMILARITY': df1.D4[i], 'BIN_ID_IHS': df1.ID4[i]},
{'BIN_ID_WDM': i, 'DSIMILARITY': df1.D5[i], 'BIN_ID_IHS': df1.ID5[i]}]
for i in df1.index]
数据框:
D1 D2 D3 D4 D5 ID1 ID2 ID3 ID4 ID5
WMAC
258403 0.002665 0.003306 0.001396 0.003395 0.003741 100000141725 100000141709 100000141696 100000141676 100000141294
105692 0.000016 0.000257 0.000264 0.000298 0.000349 100000030110 100000030243 100000030109 100000030166 100000323212
70795 0.001588 0.001564 0.000019 0.001828 0.001828 100000040111 100000028683 100000034744 100000324405 100000038952
解决方案
IIUC,使用pd.wide_to_long
:
pd.wide_to_long(df, ['D', 'ID'], 'WMAC', 'No')
输出:
D ID
WMAC No
258403 1 0.002665 100000141725
105692 1 0.000016 100000030110
70795 1 0.001588 100000040111
258403 2 0.003306 100000141709
105692 2 0.000257 100000030243
70795 2 0.001564 100000028683
258403 3 0.001396 100000141696
105692 3 0.000264 100000030109
70795 3 0.000019 100000034744
258403 4 0.003395 100000141676
105692 4 0.000298 100000030166
70795 4 0.001828 100000324405
258403 5 0.003741 100000141294
105692 5 0.000349 100000323212
70795 5 0.001828 100000038952
推荐阅读
- android - 如何设置最后修改的文件?
- scala - EMR Notebook Scala 内核导入图框库
- php - 如何配置谷歌图表以从行更改为列
- java - entityManager.flush() 会清除二级缓存吗?
- reactjs - 将常量参数绑定到构造函数中的方法是否是一种好习惯
- node.js - 基于持续时间的空闲时间 - NODEJS
- javascript - 如何从对象创建 JSON 文件
- html - 如何将 .ttf 和 .eot 文件嵌入为一种字体?
- xslt-3.0 - 无法使用不同的循环求和 xslt 求和
- sprite-kit - 为 SKAudioNode 创建一个 SKAction 扩展