首页 > 解决方案 > 提高 Hive 中 Ntile 函数的速度

问题描述

我在 4 个分区变量上运行 Ntile 函数 4 次,如下所示:

CREATE TABLE Table2 AS
Select*,

ntile(10) over (partition by A, B,C,D order by var1) as dec_1,
ntile(10) over (partition by A, B,C,D order by var2) as dec_2,
ntile(10) over (partition by A, B,C,D order by var3) as dec_3,
ntile(10) over (partition by A, B,C,D order by var4) as dec_4

From Table1

该表目前大约有 4 亿行,该操作要么运行非常缓慢,要么失败。如果我在运行此查询之前Table1A, B, C,排序会提高性能吗?D

标签: sqlhivehiveql

解决方案


推荐阅读