首页 > 解决方案 > 对 Clickhouse 中的多个列使用 NOT IN

问题描述

我有一个表格,其中包含以下方式的数据

id, 电子邮件, 文件名

1,ABC,文件1

2,ABC,文件1

1,ABC,文件2

1,ABC,文件3


我需要明智的唯一用户文件名。

我需要以某种方式进行查询,即文件中包含的数据不应包含在其他文件中。

前任:

file1 有两个不同的 id,在这种情况下它将有 2 个唯一用户。

file2 数据与 file1 数据相同,因此唯一用户数应为 0

file3 有不同的电子邮件,所以它应该有 1 个唯一用户

文件应至少具有与其他文件不同的 id 或电子邮件,以将其计算为唯一用户

标签: clickhouse

解决方案


推荐阅读