hive - hive 最大分区数
问题描述
我的配置单元表中有 1500 个分区,但是在进行查询时,它花费的时间比预期的要多。在 hive 表中可以创建的最大分区数。
解决方案
当前具有 RDBMS 元存储后端的 Hive 版本应该能够处理10000+
分区。
出于多种原因,社区正在放弃这种设计以利用 HBase 作为元存储。关注 https://issues.apache.org/jira/browse/HIVE-9452。
总体设计文档可在此处获得:https ://issues.apache.org/jira/secure/attachment/12697601/HBaseMetastoreApproach.pdf
推荐阅读
- sql - 在 SQL 视图中填充缺失的数据集
- dependencies - 在 `dpkg -i` 上,一个包引用依赖项而不是在目录中找到的依赖项
- node.js - TypeScript 生成函数
- reactjs - 页面加载时的弹出框问题
- python - 如何在 pyspark 2.3.2 中使用 lit,lower,trim 等功能
- javascript - 在 CSS 中使用 Ajax 成功数据显示带有在表单中输入的值的预览
- swiftui - Swift UI 动画 360 度旋转
- windows - 在 Windows 10 上导入 scipy 或 pywt 时,DLL 加载失败
- c - 为什么会跳过变量?
- javascript - 如何根据患者体重值动态更改文本框中的信息?