python - 如何在 Python 中最好地展平 NDJson 数据
问题描述
我有一个巨大的 NDJson 格式数据文件 (>400MB),我喜欢将其展平为表格格式以供进一步分析。
我开始手动迭代各种对象,但有些对象相当深,甚至可能会随着时间而改变,所以我希望有一种更通用的方法。
我确信 pandas lib 会提供一些东西,但找不到任何对我有帮助的东西。此外,我发现的其他几个库似乎没有“完全”提供我所希望的(flatten_json)。这一切似乎还很早。
目前是否有可能没有很好的(快速和简单的)解决方案?
任何帮助表示赞赏
解决方案
pandasread_json
有一个 bool 参数lines
,将其设置为 True 以读取 ndjsons
data_frame = pd.read_json('ndjson_file.json', lines=True)
推荐阅读
- python - 如何检查函数是在 IDLE 中运行还是从另一个函数/模块运行
- android - Kotlin 扩展属性在某些应用程序模块中被识别,而在其他模块中不被识别
- javascript - js.erb 文件在尝试渲染部分时抛出“错误:rails-erb-loader failed with code: 1”错误
- css - 在 WordPress 中使用 css 在文本旁边对齐字体真棒图标
- python - 如何重新排列 DateTime 对象的顺序
- algorithm - 如何衡量地址自动建议的相关性?
- javascript - 如何使用 jQuery 一次只隐藏/显示一个 div
- bash - 如何在同时用于 CMD 和 BASH 的脚本中关闭 ECHO
- css - 我无法使用浏览器缩小导航栏和搜索栏以进行引导反应
- java - Android Marshmallow (6) 上的 PopupMenu BadTokenException,但适用于 Q (Android 10)?