sql - 扩展 Hive 分区 ORC 表中断查询
问题描述
我正在使用 Hive 3.0
我在 ORC 分区 Hive 内部表中添加了几列。例如
create table test (a int) partitioned by ( b string) stored as ORC;
insert into test values(1,’a’);
insert into test values(2,’b’);
select * from test;
| 测试.a | 测试.b | |---------|----------| | 1 | 一个 | | 2 | 乙 |
alter table test add columns (c string);
一开始,我希望这些列中的值为 NULL。
select * from test;
| 测试.a | 测试.c | 测试.b | |---------|---------|---------| | 1 | 空 | 一个 | | 2 | 空 | 乙 |
当我在新列上使用 where 子句执行查询时,系统会中断
select count(*) from test where c is null;
这会产生错误
Vertex did not succeed due to OWN_TASK_FAILURE, failedTasks:1 killedTasks:1, Vertex vertex_1579629597981_743514_1241_00 [Map 1] killed/failed due to:OWN_TASK_FAILURE]Vertex killed, vertexName=Reducer 2, vertexId=vertex_1579629597981_743514_1241_01, diagnostics=[Vertex received Kill while in RUNNING状态。,由于 OTHER_VERTEX_FAILURE,Vertex 未成功,failedTasks:0killedTasks:1,Vertex vertex_1579629597981_743514_1241_01 [Reducer 2] 由于:OTHER_VERTEX_FAILURE 而杀死/失败] DAG 由于 VERTEX_FAILURE 未成功。failedVertices:1 killVertices:1 (state=08S01,code=2)
我搜索了文档,但看起来我做得正确。
有什么建议吗?
解决方案
推荐阅读
- java - 如何将OX12转换为十进制
- python - 根据不同的行值创建新列并计算每个值的频率
- php - 使用 Jquery Ajax 将数据发送到另一个页面不起作用
- python - 在 Python 中运行树结构
- c++ - C++类指针动态数组释放问题
- python - 修复此检查器中的线程错误并使其接受更多线程
- html - 如何从 CSS 中的图像复制此文本?
- google-chrome - 如何从 gdrive 中删除此文件夹 - 它仍然显示
- apache-spark - Spark 3.0 JdbcRDD Java - 为没有 ID 列的视图指定 lowerBound 和 upperBound 的问题
- java - 了解 OpenJDK 与 Oracle JDK 的使用