database - OLAP 架构?
问题描述
我正在学习数据仓库的架构和设计,并且有一个关于 OLAP 系统的问题。因此,据我了解,从历史上看(当计算能力和内存不是商品时),数据将被获取并存储在数据仓库中。对于每个分析/BI 任务,都需要配置一个 OLAP 系统,并且来自仓库的查询结果将存储在复杂且需要高维护的单个立方体中。快进到现代云计算时代,数据存储在优化的 OLAP 多维数据集、数据集市或 MPP 解决方案(列式存储)中。
几个问题...
OLAP 多维数据集是虚拟的/临时的,还是占用服务器上的物理空间?存储在数据集市或列式存储中的数据是否占用与数据仓库中相同的空间?如果是,我认为现在这不是问题,因为内存空间很容易获得。
我理解这个错误的任何部分吗?随时纠正我,就像我说的,我只是在学习。
解决方案
OLAP 多维数据集是虚拟的/临时的,还是占用服务器上的物理空间?
->OLAP 多维数据集确实占用服务器上的物理空间。阅读有关处理多维数据集的信息。这会提取源数据并将其以专有格式存储。存储在数据集市或列式存储中的数据是否占用与数据仓库中相同的空间?
-> 我认为,与面向行的数据库相比,列式存储确实减少了占用的空间
推荐阅读
- java - Java 忽略 http 代理设置
- javascript - 使用 Jexcel 根据选择的另一个下拉列表更改下拉列表值
- javascript - 聚合缺少数据的嵌套文档
- javascript - 如何重构此 js 代码以避免 eslint no-eval-func?
- python - 如何在另一个字符串中的坐标之间获取字符串,开始和停止坐标由数据框中的列指定
- spring-boot - 使用 SSI 在 Nginx 后面运行两个 Spring Boot 应用程序
- python - 如何使用 Selenium 动态化页面内容(LinkedIn 搜索)
- flutter - Flutter-如何用“年月”格式替换标签栏
- python - 我正在重新采样每日数据并使用 pandas 聚合我的数据
- java - GCP Dataflow 抛出异常 Shuffle key too large