sql - bigQuery ANY_VALUE 不确定?
问题描述
bigQuery ANY_VALUE 是确定性的吗?我有一个产生约 200,000 行结果的查询,但如果我在查询后过滤掉重复的条目,它们会减少到约 500 行。为了解决查询本身的问题,我添加了一个 GROUP BY,然后将所有属性用 `ANY_VALUE(tN.fieldX) 包装为 tN_fieldX 。输出经过排序、保存为 .csv 并多次执行后,返回相同的结果 md5sum 文件。
这是否意味着 ANY_VALUE 正在解决我的重复条目问题,因为由于 bigQuery 中的不确定性,它每次都会给出不同的值?
解决方案
显然, ANY_VALUE 是非确定性的——但如果你对 GROUP'ed BY 值应用该函数——从某种意义上说,它会从一组相同的值中随机选择值,从而变得确定性。所以,是的 - 它有助于解决像你这样的情况下的重复问题
推荐阅读
- backbone.js - 有没有办法将 .Net Core 2 appsettings.json 属性传递给主干组件?
- javascript - JavaScript 中的 Pickle/Serialize 生成器状态
- r - 如何重复按组选择特定行
- c++ - 如何为共享基类并在定义结构后定义的结构定义复制构造函数
- python - makemigrations 不添加任何列,除了 id 列
- c++ - 如何删除已在 CMD 中特定位置输出的字符?
- react-native - AWS Amplify 发送到 React-Native App 的 PushNotification 中缺少图像
- python - 替换存储在字典中的特定 numpy 数组中的条目
- google-apps-script - 我们如何使用 Google App Script 格式化电子邮件
- r - 将值分配给R中的覆盖?