delta-lake - 关于三角洲湖的困惑
问题描述
我尝试阅读了很多有关数据块三角洲湖的信息。据我了解,它将 ACID 事务添加到您的数据存储中,并使用增量引擎加速查询性能。如果是这样,为什么我们需要其他不支持 ACID 事务的数据湖?Delta Lakes 声称结合了数据湖和数据仓库的两个世界,我们知道由于目前对运营的支持,它还不能替代传统的数据仓库。但它应该取代数据湖吗?为什么需要拥有两份数据副本——一份在数据湖中,一份在三角洲湖中?
解决方案
Delta Lake 是一种产品(如 Redshift),而不是一种概念/方法/理论(如维度建模)。与各行各业的任何产品一样,针对该产品的某些声明将是真实的,而有些则将是营销宣传。产品声称的好处是否实际上使其优于替代产品会因用例而异。
问为什么除了 Delta Lake 之外还有其他数据湖解决方案,有点像问为什么世界上有不止一个 DBMS。
推荐阅读
- android - 从 Recyclerview 分离 SwipeListener
- asp.net - 将变量或属性传递给共享方法时出错
- kubernetes - 如何使用 podAntiAffinity 定位动态标签?
- html - 单击其中的链接(导航链接)时,如何关闭整个导航?
- javascript - 如何在p5js javascript中来回移动对象
- node.js - 无法在当前版本的 VS 代码中附加节点调试器
- django - 如何在列表中加载 django 模型行?
- sqlalchemy - 可以使用 SQLAlchemy 来管理数据库角色权限吗?
- google-apps-script - 为什么我无法按 ID 打开已安装插件的文件?
- javascript - 更低、更低、更高的模式