首页 > 解决方案 > Impala 表小文件问题

问题描述

我有一个 10 TB 大小的表,有 2k+ 个分区,每个分区有大约 300 个小文件,请你帮我解决小文件问题而不影响目录结构。我尝试了 shuffle 选项,它减少了小表的文件,但不适用于大表。

标签: hadoopimpala

解决方案


推荐阅读