首页 > 解决方案 > 为什么 BigQuery 无法识别文本格式持续时间的正确顺序

问题描述

对于我的数据集,我想解决一个非常简单的问题。我想按持续时间计算不同的员工 ID。在我的数据集中,持续时间如下:0-6 6-12 12-18 18-24 24-

其实解决方法很简单

SELECT
  tenure_group, count (distinct EmpID )as count
FROM
  `T1`
group by time_group
order by time_group ascending

However, the result turns out to be 
Row     time_group      count   
1       null              0
2       0-6              501
3       12-18            183
4       18-24            229
5       24-32            238
6       32-48            438
7       48-              282
8       6-12             353

似乎6-12总是被视为最后一组。我也在 Google Data Studio 中尝试过,但结果相同。

任何人都可以帮忙吗?我一直在考虑它在 Google 表格中的原始数据格式。但后来,我已经把它们改成了文字。

标签: google-bigquery

解决方案


SELECT
  tenure_group, count (distinct EmpID )as count
FROM
  `T1`
group by time_group
order by 
CASE 
  WHEN time_group = '6-12' THEN '06-12'
  ELSE time_group 
END asc

推荐阅读