首页 > 解决方案 > bigQuery ANY_VALUE 不确定?

问题描述

bigQuery ANY_VALUE 是确定性的吗?我有一个产生约 200,000 行结果的查询,但如果我在查询后过滤掉重复的条目,它们会减少到约 500 行。为了解决查询本身的问题,我添加了一个 GROUP BY,然后将所有属性用 `ANY_VALUE(tN.fieldX) 包装为 tN_fieldX 。输出经过排序、保存为 .csv 并多次执行后,返回相同的结果 md5sum 文件。

这是否意味着 ANY_VALUE 正在解决我的重复条目问题,因为由于 bigQuery 中的不确定性,它每次都会给出不同的值?

标签: sqlgoogle-bigquery

解决方案


显然, ANY_VALUE 是非确定性的——但如果你对 GROUP'ed BY 值应用该函数——从某种意义上说,它会从一组相同的值中随机选择值,从而变得确定性。所以,是的 - 它有助于解决像你这样的情况下的重复问题


推荐阅读