首页 > 解决方案 > 为什么这个 BigQuery WHERE NOT IN 语句没有给出任何结果?

问题描述

我们预计这个 Google BigQuery 查询最多会删除 10 行结果——但这个查询给我们的结果为零——尽管表 A 有数千行都具有唯一的 ENCNTR_ID。

SELECT ENCNTR_ID
FROM `project.dataset.table_A`
WHERE ENCNTR_ID NOT IN
(
SELECT ENCNTR_ID
FROM `project.dataset.table_B`
LIMIT 10
)

如果我们使查询自引用,它的行为与预期一样:我们只删除了 10 行就得到了数千个结果。

SELECT ENCNTR_ID
FROM `project.dataset.table_A`
WHERE ENCNTR_ID NOT IN
(
SELECT ENCNTR_ID
FROM `project.dataset.table_A` # <--- same table name
LIMIT 10
)

我们做错了什么?为什么第一个查询给我们零个结果而不是只删除 10 行结果?

标签: google-bigquery

解决方案


解决方案:在处理可能的空值时使用NOT EXISTS而不是:NOT IN

SELECT *
FROM UNNEST([1,2,3]) i
WHERE NOT EXISTS (SELECT * FROM UNNEST([2,3,null]) i2 WHERE i=i2)

# 1

以前的猜测 - 原来是原因:

SELECT *
FROM UNNEST([1,2,3]) i
WHERE i NOT IN UNNEST([2,3])

# 1

对比

SELECT *
FROM UNNEST([1,2,3]) i
WHERE i NOT IN UNNEST([2,3,null])

# This query returned no results.

里面有空project.dataset.table_B吗?


推荐阅读