databricks - 我们如何从 Databricks 中的 delta Lake 获取读取查询的日志?
问题描述
Delta Lake 具有事务日志,其中包含有关 deltalake 发生的写入的信息。是否有某种审计日志用于读取 Deltalake 上发生的查询?
类似于:笔记本 X 在时间 T 发布了关于 Deltalake 的阅读。
用例:此信息将帮助我了解数据集和沿袭中涉及的相关笔记本之间的沿袭。
PS:我的 deltalake 存储在 ADLS 中(安装在数据块中)
解决方案
作为对表所做的每一次更改的最终记录,Delta Lake 事务日志为用户提供了可验证的数据沿袭,这对于治理、审计和合规性目的很有用。它还可用于将管道中的无意更改或错误的起源追溯到导致它的确切操作。
用户可以运行DESCRIBE HISTORY来查看所做更改的元数据。
有关更多详细信息,请参阅深入 Delta Lake:解包事务日志。
推荐阅读
- python-3.x - 当我增加 Bitvector 的长度时,z3py solver.check() 从“sat”变为“unknown”
- angular - 从 ngFor 中动态创建的多个 mat-slider 获取值
- python - 尝试使用 Python 进行顶级包之外的相对导入
- r - 使用 grepl R 子集列表
- angular - Observable 而不是函数 angular 8 9
- groovy - 如何在 groovy 脚本中返回类成员字符串
- html - 如何通过单击检查 Angular 中的材质复选框?
- mapbox - 如何在 MAPBOX 中调整窗口大小时同时适应边界并设置最大边界?
- javascript - 赛普拉斯安全错误。只能在同源文档上调用 open()
- func - 预期返回“房间”的函数中缺少返回