首页 > 解决方案 > 如何给分组的行编号

问题描述

有一个表格,其中存储了如下视频观看日志的数据。

|user_id| status |     time         |
-------------------------------------
|user_a |start   |2019-06-18 00:00:00|
|user_a |progress|2019-06-18 00:00:05|
|user_a |progress|2019-06-18 00:00:10|
|user_a |complete|2019-06-18 00:00:15|
|user_a |start   |2019-06-18 00:10:00|
|user_a |complete|2019-06-18 00:10:05|
|user_a |start   |2019-06-19 00:10:00|
|user_a |start   |2019-06-19 00:10:05|
|user_a |progress|2019-06-19 00:10:10|
|user_b |start   |2019-06-18 00:20:00|
|user_b |progress|2019-06-18 00:20:05|
|user_b |progress|2019-06-18 00:20:10|

我想为从状态“开始”到“开始”的每个 user_id 的行赋予相同的编号,如下所示。

id|user_id| status |     time         |
-------------------------------------
 1|user_a |start   |2019-06-18 00:00:00|
 1|user_a |progress|2019-06-18 00:00:05|
 1|user_a |progress|2019-06-18 00:00:10|
 1|user_a |complete|2019-06-18 00:00:15|
 2|user_a |start   |2019-06-18 00:10:00|
 2|user_a |complete|2019-06-18 00:10:05|
 3|user_a |start   |2019-06-19 00:10:00|
 4|user_a |start   |2019-06-19 00:10:05|
 4|user_a |progress|2019-06-19 00:10:10|
 1|user_b |start   |2019-06-18 00:20:00|
 1|user_b |progress|2019-06-18 00:20:05|
 1|user_b |progress|2019-06-18 00:20:10|

有没有办法用sql聚合?我正在使用presto。

标签: sqlpresto

解决方案


使用累积和:

select t.*, 
       sum(case when status = 'start' then 1 else 0 end) over (partition by user_id order by time) as id
from t;

Demo


推荐阅读