pandas - 如何使用 Hadoop 维护其架构每季度更改一次的历史数据
问题描述
我有存储调查数据(来自客户的反馈)的 json 输入文件。
json 文件中的列可能会有所不同
例如,第一季度可以有 70 列,下一季度可以有 100 列,依此类推。
- 我想将所有这些季度数据存储在 hdfs 上的同一张表中。
有没有办法通过删除并重新创建具有更改架构的表来维护历史记录?
如果列长度下降,它将如何表现让我们说在第三季度我们只有 30 列。
解决方案
推荐阅读
- python - 为什么我的多处理函数 map_async 卡住了?
- php - 如何在 codeigniter 中使用 ajax 在 div 中加载视图
- permissions - Hyperledger-Composer 权限:从 HistorianRecord 只读特定类型的交易
- objective-c - 以编程方式打开显示首选项?
- prometheus - Prometheus avg_over_time 和除非包含太多数据
- git - 无法从 Windows 10 WLS (ubuntu) 推送到 github 存储库
- machine-learning - 如何将新向量添加到 Keras 嵌入矩阵
- reactjs - MUI:有条件地禁用按钮
- data-structures - 如何在 UnionFind 数据结构中正确实现加权联合和路径压缩
- python - Python 最佳实践。从另一个 python 文件调用命令行 python 文件