python - 如何将数据框字典条目拆分/分解为多行
问题描述
我从一个复杂的 JSON 开始,经过一些操作,我非常接近我想要的,我唯一缺少的步骤是:
如何从输出到输入,棘手的部分是我希望能够选择要展平的列
[input]
index extras info
0 a {'value1': 'one'} {'info2': 'two'}
1 a {'value1': 'one', 'value2': 'two'} {'info1': 'one', 'info2': 'two'}
2 a {'value2': 'two'} {}
3 b {'value2': 'two'} {'info1': 'one'}
4 b {} {'info2': 'one'}
5 b {'value2': 'two'} {}
[output]
index extras.value1 extras.value2 info
0 a 'one' Undefined {'info2': 'two'}
1 a 'one' 'two' {'info1': 'one', 'info2': 'two'}
2 a Undefined 'two' {}
3 b Undefined 'two' {'info1': 'one'}
4 b Undefined Undefined {'info2': 'one'}
5 b Undefined 'two' {}
解决方案
也许你可以检查一下apply
,这比冷的方法慢
df=df.assign(**df.extras.apply(pd.Series).add_prefix('extras.'))
推荐阅读
- stanford-nlp - 在 Stanzas Corenlp 实现中与 tregex 的模式匹配似乎找不到正确的子树
- sql - 长生到pdf
- elm - 如何使用 Elm(最好是 Elm-UI)制作可拖动的拆分面板?
- fortify - reportgenerator 和 BIRTreportgenerator 有什么区别?
- python - 返回最后一个非零值
- r - 如何将列值设置为最后一个正整数
- php - 显示帖子类型的标签时如何限制列表元素的数量
- azure - B2C 自定义策略:如何为陪审团 UI 标头查找未记录的本地化字符串 ID
- python - 我在使用下面给出的代码时收到“ProgrammingError: Unknown character set: 'utf8mb4'” ..请提出解决方案
- python - 一个接一个地根据另一个数组的值对数组进行排序