首页 > 解决方案 > BigQuery 中的重复数据删除

问题描述

我有一个查询,仅显示非重复值,我正在寻找有关如何在其他查询中使用此重复数据的解决方案。

我没有创建任何东西的权限,所以我需要为此找到解决方案。

伊丹

编辑(来自“答案”):

这是我的“采购”表中的字段: user_id purchase_amount purchase_sku source device_type uuid - 每行的唯一标识符

当除 uuid 之外的所有字段都相同时,将考虑重复。我需要返回去重数据并准备好用于其他查询。

这是基本数据,第 5-6 行和第 7-8 行有重复值

我想显示不重复的行,并且在重复的行上只显示一行,如下所示:

重复数据

标签: sqlgoogle-bigquery

解决方案


考虑以下通用解决方案 - 您根本不需要列出所有列名 - 查询中仅使用 uuid)

select any_value(t).*
from `project.dataset.table` t
group by to_json_string((select as struct * except(uuid) from unnest([t])))

推荐阅读