snowflake-cloud-data-platform - 表与分区的平均深度
问题描述
选择系统$clustering_depth('Table1','(Column1)');
它根据指定的列给出了表的平均深度:在我的情况下,该值为 17501.1143。这表明该表的聚集严重。
选择 SYSTEM$CLUSTERING_INFORMATION('Table1','(Column1)');
表中每个微分区的平均重叠深度。:在我的情况下,该值是 16033,这表明该表已严重聚集。
问题:1 第一个值用于表(17501.1143),第二个值(16033)用于根据雪花文档的分区。
为了分析 Table1 的聚类,我们应该考虑哪一个?
问题:2理论上它们都代表相同的?如果是这样,为什么它们每个都有不同的值?
解决方案
问题 1:两者都有。对于集群键,您希望这两个数字都尽可能接近 1。如果您在表上指定的列实际上不是集群键,那么除非按该列的顺序加载内容,否则它可能会被严重集群。
问题 #2:我强烈建议您阅读 Snowflake 文档的这一部分,以了解重叠和深度之间的区别。它显示了一个很好的插图。 https://docs.snowflake.com/en/user-guide/tables-clustering-micropartitions.html#clustering-depth
推荐阅读
- android - 在cardview周围带有透明背景的片段 - 如何在外面触摸时关闭片段?
- c# - 如果用户不选择任何组,则搜索所有数据的更好方法
- node.js - 如何解决 TypeError:validateSchema 不是 React 应用程序的函数?
- opengl - OpenGL:防止在每个着色器程序中产生雾
- javascript - FlatList 不会在道具更改时重新渲染
- r-raster - R 中的水深测量栅格(负值栅格)未正确读取
- bash - Jenkins 参数化变量名将空格转换为下划线
- jsf - jsf primefaces中动态更改分页行值
- c# - 在 WaitForExit C# 控制台应用程序上终止命令的问题
- javascript - slick.js 滑块问题