首页 > 解决方案 > 如何从 hive 获取最新的分区数据

问题描述

我需要从具有最新分区的配置单元中的表中获取所有记录。该表是由date,year,montheg 分区的(date=25,year=2020,month=3),同样会有很多分区。

分区不是静态的,它会经常变化。我正在尝试处理获取查询中的最新分区。有人可以帮我写查询吗?

在此处输入图像描述

标签: hivehiveqlhadoop-streaminghive-partitions

解决方案


尝试这个:

select * 
  from your_table t
 where concat_ws('-',t.year,t.month,t.date) in (select max(concat_ws('-',s.year,s.month,s.date)) from your_table s)

另请阅读这些相关答案:

https://stackoverflow.com/a/59675908/2700344

https://stackoverflow.com/a/41952357/2700344


推荐阅读