ibm-infosphere - 对于任何 ETL 或数据转换工具,IGC 是否允许我跟踪数据的来源或数据的使用方式?
问题描述
作为我们的治理计划和监管要求的一部分,我们需要生成一个沿袭(可追踪性)报告,概述进入我们仓库的数据流,以及使用其数据的报告或服务。我们知道,当 DataStage 将数据写入 Warehouse 时,Information Governance Catalog 可以自动生成这样的报告。当我们使用 SQL 脚本或其他工具向仓库读取或写入信息时,Information Governance Catalog 可以做同样的事情吗?我可以查看包含这些不同信息的完整沿袭报告吗?
IGC 内部有哪些步骤来记录或定义信息的使用以支持数据沿袭和监管报告?
解决方案
是的,虽然我们可以为 DataStage 自动生成沿袭(可追溯性)报告,但 IGC 确实提供了为其他数据移动脚本、工具或流程记录数据流的设施。这将生成相同的沿袭报告,可用于满足合规性需求,或建立对数据使用或消费的信心和信任。
最简单的是,IGC 允许起草一份映射文件。本质上是一个描述数据源和数据目标的电子表格,以及支持转换、聚合或其他逻辑的文档。电子表格可以直接在 IGC 中创作,或从进一步支持流程自动化的 Excel(文本文件)加载。可以在此处找到扩展映射文档的文档: https ://www.ibm.com/support/knowledgecenter/en/SSZJPZ_11.5.0/com.ibm.swg.im.iis.mdwb.doc/topics/c_extensionMappings.html (虽然建议从 IGC 创建这样的文档,并将结果导出到 Excel)。
此外,IGC 支持更正式的流程来扩展目录和引入新类型的资产。这将更进一步,正确记录和分类数据流程(SQL 命令、其他 ETL 工具),并通过这些流程映射数据移动。这将允许用户识别数据流程,甚至允许用户包含操作数据(正如 IGC 所支持的那样)。可以在此处找到有关此过程的更多信息: https ://www-01.ibm.com/support/docview.wss?uid=swg21699130
建议审核绝对要求,以及后续追溯报告需要哪些信息。从扩展映射文档开始应该就足够了,并且是最容易实现和立即受益的。
推荐阅读
- reactjs - ReactJS 将函数从 Parent 传递给 Child 抛出 TypeError: this.props.passedFunction is not a function
- java - 我正在用 java 制作一个程序,打印从 1 到 x 的数字(x 是用户输入值)。这是使用 for 循环和方法语句
- data-binding - Xamarin.Forms 中标签 StringFormat 的本地化
- apache-spark - RDD、DataFrames、Spark SQL:360 度对比?
- vba - 用于操作 Office 365 主题颜色的 VBA 代码?
- maven - 为什么我会从 Maven Central 收到“收到致命警报:protocol_version”或“peer not authenticated”?
- matlab - 如何获得按某一列分组的列的平均值?
- react-native - 无法从推送通知导航到所选屏幕
- ruby-on-rails - Rails - 数据库之间的集成
- rust - 发送 Vec
> 过频道