首页 > 解决方案 > BigQuery:加入集群字段

问题描述

我正在尝试通过使用聚簇表来优化我们的 BigQuery 模型。

我正在测试这些场景:

  1. 聚簇表连接聚簇表(通过簇字段连接)
  2. 非聚簇表联接 非聚簇表(通过与方案 1 相同的字段联接)

如果不应用任何条件场景 1 和 2 具有相同的成本(处理的时间和字节数)。 当我通过集群字段 1 应用条件时,速度快 4 倍且成本更低。

只有在查询中使用条件时,聚集字段才有用?而不是加入?在这种情况下,如果我在没有任何条件的情况下执行连接,无论有没有集群,性能都是一样的

如何改进 BigQuery 中两个表之间的连接?

编辑 2021-05-31

添加两个作业的查询执行计划:

  1. 集群的

  2. 非集群

标签: sqlperformancegoogle-bigquery

解决方案


推荐阅读