首页 > 解决方案 > 表与分区的平均深度

问题描述

选择系统$clustering_depth('Table1','(Column1)');

它根据指定的列给出了表的平均深度:在我的情况下,该值为 17501.1143。这表明该表的聚集严重。

选择 SYSTEM$CLUSTERING_INFORMATION('Table1','(Column1)');

表中每个微分区的平均重叠深度。:在我的情况下,该值是 16033,这表明该表已严重聚集。

问题:1 第一个值用于(17501.1143),第二个值(16033)用于根据雪花文档的分区。

为了分析 Table1 的聚类,我们应该考虑哪一个?

问题:2理论上它们都代表相同的?如果是这样,为什么它们每个都有不同的值?

标签: snowflake-cloud-data-platform

解决方案


问题 1:两者都有。对于集群键,您希望这两个数字都尽可能接近 1。如果您在表上指定的列实际上不是集群键,那么除非按该列的顺序加载内容,否则它可能会被严重集群。

问题 #2:我强烈建议您阅读 Snowflake 文档的这一部分,以了解重叠和深度之间的区别。它显示了一个很好的插图。 https://docs.snowflake.com/en/user-guide/tables-clustering-micropartitions.html#clustering-depth


推荐阅读