hive - HIVE 中的空桶
问题描述
有 65 GB 的数据,我在 HIVE 中创建了 40 个存储桶,但在加载数据后,我发现 5 个存储桶仍然是空的。这 5 个空桶的可能性是什么?
解决方案
在不知道如何插入数据的情况下,我猜测您使用的是低于 2.x 的 Hive 版本,hive.enforce.bucketing
但未设置为true
. 或者您在插入数据时没有明确提供cluster by
子句。
推荐阅读
- rest - 在 REST 中实现 PUT 的正确方法是什么?
- python - 从另一个文件中数学减去一个文件中的值
- c++ - 忽略 OpenMP 任务依赖性?
- excel - Excel公式从距离和速度中获取时间
- javascript - 带有过滤器表达式的 DynamoDB 扫描表
- git - git auto merge 两个分支:哪个文件的内容优先于源文件或目标文件?
- excel - Excel 2019 打开模板文件的默认行为
- python - Python需要一个类似字节的对象,而不是'str'
- php - 使用 shell 命令时无法访问 Magento 1 Cache 文件夹
- java - Java Swing 阿拉伯语文本反转方向