hadoop - Hive - 增量更新物化视图
问题描述
假设我有一个事务表 t1 作为
1,abc,4.5
2,xyz,3.7
我创建了一个物化视图:
> create materialized view t1_mv as select * from t1;
然后我更新表格:
> insert into t1 values (3,"lmn",4.7)
现在,当我想更新视图时,我必须执行以下查询:
> ALTER MATERIALIZED VIEW t1_mv REBUILD;
在上述查询重建操作中触发对 t1 表的全扫描并重写物化视图。
根据 Hive 文档:“ Hive 支持增量视图维护,即仅刷新受原始源表更改影响的数据。增量视图维护将减少重建步骤的执行时间。此外,它将保留 LLAP 缓存以供现有物化视图中的数据。 ”文档链接
然而,关于物化视图的增量更新,没有提到确切的过程,
我的问题是:
- 如何增量更新物化视图?
- LLAP缓存在增量更新过程中的作用是什么?
解决方案
推荐阅读
- python - Pandas 在插入数据时将日期时间对象转换为时间戳或整数
- vue.js - 在哪里使用 API 数据更新 Vuex 状态
- json - 无法使用 webpack 分析器创建构建
- python - Tkinter Checkbutton 问题
- javascript - 在有序列表中显示输入值时遇到问题
- javascript - 如何制作一个每次特定时间循环警报的功能?
- ios - 由于 Info.plist 中缺少权限,Apple 拒绝了我的应用程序,但我的权限已本地化
- c++ - 是否需要动态数组容器类的 isFull() 函数?
- asp.net - 解压 JSZip 压缩文件时服务器端出现 GZipStream 异常
- javascript - 用数组嵌套for循环表