首页 > 解决方案 > Snowflake 中的数据建模最佳实践

问题描述

这个问题可能已被多次以多种方式提出。而且我一直没能找到满意的答案。

鉴于 Snowflake 中的数据是以列格式组织的,并且与数据建模方法(3NF、Dimensional、Data Vault)无关,那么在 Snowflake 中设计数据模型时的最佳实践是什么?

对此主题的在线资源的任何推荐或建议表示赞赏。

谢谢!

标签: snowflake-cloud-data-platformdata-modeling

解决方案


鉴于 Snowflake 在很大程度上是一个 MPP 列式存储(但是是的 - 有点扭曲),本文的内容应该在很大程度上是正确的。感谢它的作者(Sudershan Srinivasan),它写得非常好。

https://docplayer.net/2885379-Data-modeling-applying-relevant-data-modeling-techniques-to-mpp-columnar-stores-a-point-of-view-author-sudershan-srinivasan.html

虽然它主要涵盖维度建模技术,但一些建议(例如非规范化而不是构建雪花维度/蜈蚣事实)将适用于 DV 和 3NF。也就是说,如果您的目标是避免重复数据并因此减​​少存储消耗,请重新考虑是否需要规范化。

但是,如果有人有任何其他资源或想法要分享,请分享。


推荐阅读