sql - BigQuery 中的重复数据删除
问题描述
我有一个查询,仅显示非重复值,我正在寻找有关如何在其他查询中使用此重复数据的解决方案。
我没有创建任何东西的权限,所以我需要为此找到解决方案。
伊丹
编辑(来自“答案”):
这是我的“采购”表中的字段: user_id purchase_amount purchase_sku source device_type uuid - 每行的唯一标识符
当除 uuid 之外的所有字段都相同时,将考虑重复。我需要返回去重数据并准备好用于其他查询。
这是基本数据,第 5-6 行和第 7-8 行有重复值
我想显示不重复的行,并且在重复的行上只显示一行,如下所示:
重复数据
解决方案
考虑以下通用解决方案 - 您根本不需要列出所有列名 - 查询中仅使用 uuid)
select any_value(t).*
from `project.dataset.table` t
group by to_json_string((select as struct * except(uuid) from unnest([t])))
推荐阅读
- php - 页脚从 Woocommerce 挂钩加载链接
- javascript - 如何使用道具中的对象解构为功能性 React 组件声明类型?
- java - Data Studio 中是否有任何 REST API 可用于在 JAVA 中创建报告?
- angular - 在 HTTP 获取订阅方法中设置 Angular 类变量
- java - json反序列化有一些问题
- python - 从一个点找到坐标并在图中给出距离
- javascript - 如何为 javascript 对象设置动画?
- macos - 需要创建一个受限网络,其中 UDP 端口在 mac 中被阻止
- lua - 如何连续执行 for 循环而不是卡在单个重复函数上?
- python - 根据小时和分钟列表生成日期