首页 > 解决方案 > 如何使用 PostgresQL 在这些存储桶中创建存储桶和组

问题描述

如何查找信用卡的按年分布,以及已完成的交易。将这些信用卡分为三类:少于 10 笔交易、10 到 30 笔交易、多于 30 笔交易?

我尝试使用的第一种方法是使用 PostgresQL 中的 width_buckets 函数,但文档说只创建等距的桶,这不是我在这种情况下想要的。因此,我转向案例陈述。但是,我不确定如何将 case 语句与 group by 一起使用。

这是我正在使用的数据:

table 1 - credit_cards table
credit_card_id
year_opened


table 2 - transactions table
transaction_id
credit_card_id - matches credit_cards.credit_card_id
transaction_status ("complete" or "incomplete")

这是我到目前为止所得到的:

SELECT 

CASE WHEN transaction_count < 10 THEN “Less than 10”
WHEN transaction_count >= 10 and transaction_count < 30 THEN “10 <= transaction count < 30”
ELSE transaction_count>=30 THEN “Greater than or equal to 30”
END as buckets

count(*) as ct.transaction_count
FROM credit_cards c
INNER JOIN transactions t
ON c.credit_card_id = t.credit_card_id
WHERE t.status = “completed”
GROUP BY v.year_opened

GROUP BY buckets
ORDER BY buckets

预期产出

credit card count | year opened | transaction count bucket
23421             | 2002        | Less than 10
etc

标签: postgresql

解决方案


您可以width_bucket通过指定每个 bin 的下限的排序数组来指定 bin 大小。

在你的情况下,它会是array[10,30]:任何小于 10 的东西都得到 bin 0,10 到 29 之间的东西得到 bin 1,30 或更多的东西得到 bin 2。

WITH a AS (select generate_series(5,35) cnt)
SELECT  cnt, width_bucket(cnt, array[10,30]) 
FROM a;

推荐阅读