首页 > 解决方案 > 带有左外连接的 Postgresql COUNT() 值不正确

问题描述

在 postgresql 9.3 中使用 LEFT OUTER JOIN 时,我遇到了计数聚合问题。

当我在没有左外连接的情况下执行标准语句时,它返回正确的计数,在本例中为 3。当语句变得更复杂时,如下面的语句,它返回 7 而不是不正确的。

只有一些 count() 聚合不正确,其中大多数是正确的。这是什么原因造成的?我应该使用不同的联接吗?

SELECT country_code, 
       period, 
       COUNT(commissions.id) AS count, 
       SUM(commissions.total) AS total, 
       SUM(CASE WHEN commission_adjustments.is_bonus is True THEN commission_adjustments.total else 0 END) AS bonus
FROM commissions 
  LEFT OUTER JOIN commission_adjustments ON commissions.id = commission_adjustments.commission_id
GROUP BY commissions.country_code, commissions.period 
ORDER BY commissions.country_code, commissions.period

标签: sqlpostgresqljoincountpostgresql-9.3

解决方案


如果你有这个:

SELECT * FROM table
id, x
1, 'foo'
2, 'foo'
3, 'foo'

SELECT x, COUNT(*) as ct FROM table GROUP BY x
x, ct
'foo', 3

它是“正确的”..

然后你这样做:

SELECT x, COUNT(*) as ct FROM table LEFT JOIN sometable ON table.x = sometable.y GROUP BY x

它突然“出错”:

x, ct
'foo', 7

这是因为有一个笛卡尔积;多行sometable与此行匹配。删除分组/选择 * 并查看:

SELECT * FROM table LEFT JOIN sometable ON table.id = sometable.otherid --GROUP BY x

id, x, otherid
1, 'foo', 1
1, 'foo', 1
1, 'foo', 1
2, 'foo', 2
2, 'foo', 2 
2, 'foo', 2
3, 'foo', null

7 行,由以下原因引起:

SELECT * FROM othertable
otherid
1
1
1
2
2
2

多于一行 fromothertable匹配一行 intable

您需要限制您的连接,因此它不会导致这种行的倍增,或者可能在您进行连接之前将您的连接行分组到子查询中

如果突然不再需要所有行都匹配,则切换 JOIN 类型也可能导致出现更多行,但这不会影响您在左侧计算一个表并通过左连接添加另一个表的情况;只有笛卡尔积会在这里颠簸


推荐阅读