首页 > 解决方案 > 根据客户帐户创建分区

问题描述

我需要根据客户标识符(帐号如 12345678)对一个大 Hive 表进行分区。

特别是,我正在寻找一个获取 customer_id 的函数,然后将其转换为 0-9 之类的数值,因此它成为我的分区。通过这样做,我在每个分区中有 10% 的客户。

例如,f('123455') 返回 4

欣赏提示

标签: hadoophivedatabase-partitioning

解决方案


推荐阅读