sql - 如何从多个来源 upsert 到数据仓库
问题描述
我正在建立一个新的数据仓库。在这种情况下,仓库需要支持增量夜间更新。真的很标准的东西。
以前在构建数据仓库时,我要么使用 Created / Updated 日期列来驱动插入和更新,要么使用源表上的 PrimaryKey 并将其作为自然键存储在仓库中,并使用 HashBytes 来比较行数据。
然而,在这个特定的仓库中,数据将来自多个 sql 表,因此这些表将具有多个主键和/或多个创建/更新日期。
处理这种情况的典型设计模式是什么?
解决方案
推荐阅读
- python - 由于属性关系修改类声明中的对象属性
- javascript - 将多个 .html 文件链接到一个 .js 文件
- java - Spark Mongo DB 连接 - MongoDB 版本低于 3.2
- javascript - 在控制台中打印来自 Graphql API 调用的值
- node.js - Mongoose - 更新数组中的最后一个元素(使用聚合器更新文档)
- r - R如何检查是否在某个包的特定函数中调用了自定义函数
- javascript - 如何从 indexeddb 数据库中加快自动完成的性能
- c - 编译 DOOM 源码时出现问题:错误:初始化元素不是常量(整数转换)
- django - 尝试在 Django 中动态调用视图时,我的视图上下文中出现 KeyError
- android - 从 AndroidStudio 运行检测测试时触发 gradle 任务