首页 > 解决方案 > 从蜂巢中的表中获取最新的 2 条记录

问题描述

团队,我在这里有一个场景。我需要通过 Hql 选择 2 条最新记录。

我已经尝试了 rownumber,但似乎没有得到预期的输出

Select
A.emp_ref_i,
A.last_updt_d,
A.start_date,
case when A.Last_updt_d=max(A.Last_updt_d) over (partition by A.emp_ref_i) 
and A.start_date=max(a.start_date) over (partition by A.emp_ref_i)
then 'Y' else 'N' end as Valid_f,
a.CHANGE
from
(
select
distinct(emp_ref_i),
last_updt_d,
start_date,
CHANGE
from
PR) A

目前获得输出为

    EMP_REF_I   LAST_UPDT_D start_date  Valid_f CHANGE
1   123         3/29/2020   2/3/2019    Y   CHG3
2   123         3/30/2019   2/4/2018    N   CHG2
3   123         3/29/2019   2/4/2018    N   CHG1

but required:

    EMP_REF_I   LAST_UPDT_D start_date  Valid_f CHANGE
1   123         3/29/2020   2/3/2019    Y   CHG3
2   123         3/30/2019   2/4/2018    N   CHG2

标签: hivehiveqltop-n

解决方案


使用row_number和过滤:

select s.emp_ref_i,
       s.last_updt_d,
       s.start_date, 
       case when rn=1 then 'Y' else 'N' end Valid_f,
       s.change
from 
(
Select
    A.*,
    row_number() over(partition by A.emp_ref_i order by a.Last_updt_d desc, a.start_date desc) rn
from (...) A
)s
where rn<=2;

推荐阅读