首页 > 解决方案 > 雪花云数据仓库上的多个数据集市架构/建模

问题描述

语境 :

假设我们有多个数据集市(例如:人力资源、会计、营销……),并且它们都使用星型模式作为维度建模(Kimball 方法)。

问题 :

由于雪花云数据仓库架构消除了分离单独的物理数据集市/数据库以保持性能的需要。那么,在 Snowflake 上构建多个数据集市的最佳方法是什么?

为每个数据集市创建数据库?创建一个具有多个架构的数据库(EDW),每个架构都引用一个数据集市?

谢谢 !

标签: schemadata-modelingdata-warehousesnowflake-cloud-data-platformdatamart

解决方案


罗恩是正确的——答案取决于几件事:

  1. 如果有一致的维度,那么一个数据库和模式可能是要走的路
  2. 如果它们是完全非集成的数据集市,我会使用单独的模式甚至单独的数据库。它们都是 Snowflake 中的逻辑容器(而不是物理容器),具有可用于隔离用户的完全基于角色的访问控制。

真的 - 你今天是怎么做到的?这对您有用吗,或者您需要或想做的事情是您今天无法使用当前的物理设置完成的。您的 BI 工具如何设置安全性?它们是引用数据库名称还是仅引用模式名称?如果可以的话,尽量减少对数据管道和报告的更改,从而减少可能需要重构的东西(至少对于您的第一个 POC 或迁移而言)。

需要注意的一点是,使用 Snowflake,您可以轻松地进行跨数据库连接(即 database.schema.table)——您所需要的只是 SELECT 访问,因此即使您通过数据库 oyu 分隔集市,仍然可以进行跨集市必要时报告。

希望有帮助。


推荐阅读