function - 按多列从 GBQ 表中删除重复项的最有效方法
问题描述
我有下表(见上文)。
什么是通过 appId 和 clientId 删除重复项的最有效方法,因此结果表仅包含具有最小 DIFF 的那些行
例如:260848 应该是 yandex 作为源
谢谢!
解决方案
以下是 BigQuery 标准 SQL
#standardSQL
SELECT AS VALUE ARRAY_AGG(t ORDER BY DIFF LIMIT 1)[OFFSET(0)]
FROM `project.dataset.table` t
GROUP BY appId, clientId
推荐阅读
- json - 解码 golang http.Client POST 输出
- python - 是否可以通过 Ctypes 调用带有指向 3dim 数组的指针的 C DLL?
- java - 记录器参数变成了一个数组对象
- php - 如何包含目录中的所有php文件?
- python - 将代币添加到现有 Python 区块链
- python - 此处引发了 TypeError 异常:init() 采用 2 个位置参数,但通过 Selenium 和 Python 使用显式等待给出了 3 个
- reactjs - 如何防止用户在 React-Js 网站截图
- sql - 考虑假期/周末后如何找到去年的同一天?
- c# - 为什么找不到方法 app.UseSwaggerUI(...)?
- ios - XMLHttpRequest 无法加载
由于访问控制检查 [IOS]