snowflake-cloud-data-platform - Snowflake 中的数据建模最佳实践
问题描述
这个问题可能已被多次以多种方式提出。而且我一直没能找到满意的答案。
鉴于 Snowflake 中的数据是以列格式组织的,并且与数据建模方法(3NF、Dimensional、Data Vault)无关,那么在 Snowflake 中设计数据模型时的最佳实践是什么?
对此主题的在线资源的任何推荐或建议表示赞赏。
谢谢!
解决方案
鉴于 Snowflake 在很大程度上是一个 MPP 列式存储(但是是的 - 有点扭曲),本文的内容应该在很大程度上是正确的。感谢它的作者(Sudershan Srinivasan),它写得非常好。
虽然它主要涵盖维度建模技术,但一些建议(例如非规范化而不是构建雪花维度/蜈蚣事实)将适用于 DV 和 3NF。也就是说,如果您的目标是避免重复数据并因此减少存储消耗,请重新考虑是否需要规范化。
但是,如果有人有任何其他资源或想法要分享,请分享。
推荐阅读
- ruby-on-rails - Rails 不回滚也不更新属性
- python - 如何使用 pip 单独安装 python 包及其依赖项以允许单独的 pip 选项?
- can-bus - 在矢量面板设计器中使用工具箱中的“按钮”,用于 CAPL
- amazon-s3 - 使用 GoDaddy 域和 AWS 静态 Web 托管获取连接被拒绝消息
- typescript - 具有通用抽象对象的 TypeScript 映射
- c# - 在 VSIX 中将 BuildAction 更改为 None
- ios - 删除 MKAnnotation Swift4 后 MapView 不更新视图
- c# - 打印 NV 图像 ESC/POS
- html - z-index 不适用于重叠元素
- android - 如何仅在打开互联网连接时每天启动后台服务?