apache-spark - 无法使用 Zeppelin 在配置单元中创建表
问题描述
我正在zeppelin
使用 spark 解释器对创建表运行查询。
spark.sql("create table person as select * from TABLE_NAME")
查询运行没有任何错误。
但是当我对该表运行查询时,我收到了这个错误
spark.sql("select count(*) from person")
: org.apache.spark.SparkException: Job aborted due to stage failure:
Task 30 in stage 80.0 failed 4 times, most recent failure: Lost task 30.3 in stage 80.0 (TID 7772, ip-10-226-34-88.ec2.internal, executor 530):
org.apache.hadoop.hdfs.BlockMissingException: Could not obtain block:
BP-97775991-10.226.34.113-1532420342496:blk_1073799259_58435 file=/user/hive/warehouse/person/part-0001
我该如何解决这个问题?
解决方案
问题是表格的格式 - 默认是“parquet”尝试将其更改为“orc”:
spark.sql("select * from TABLE_NAME").write.format("orc").saveAsTable("person")
推荐阅读
- python - 尝试使用python中的日历模块创建多维数组
- python - 如何在 GCloud App 上安装 SQLite 和 CORS 等模块
- r - 有没有办法从 R 中的一组父子关系中获取 BOM 样式输出(SAP CS12)?
- jpa - 在共享 JAR 的 persistence.xml 中使用 EAR 级定义的数据源作为 JTA 数据源
- reactjs - 使用 OnBlur 事件修剪 Draft.js 编辑器内容
- r - 如何导入带有闪亮的 csv 文件
- python-3.x - 将 Tensorflow 1.x 代码升级到 Tensorflow 2.x 代码
- python - 如何使用函数外部的烧瓶变量以供以后在javascript中使用?
- mysql - 从另一个表的聚合中触发更新其他表
- r - 如何在单个列的级别之间获得所有可能的成对比较?