首页 > 解决方案 > 如何调试为什么挂起阶段处于未知状态?

问题描述

我有一个 Spark 批处理作业,它读取一些 json 文件并将它们写入 Hive,然后查询其他一些 Hive 表,进行计算并将 Orc 格式的输出写回 Hive。

我的经验是工作卡在待处理状态的一个阶段。 待定阶段

DAG 如下所示: 有向无环图 我正在使用Hadoop 2.7.3.2.6.5.0-292并且 Spark 正在 YARN 上运行。

我查看了纱线日志、火花事件日志,但没有发现问题。只是重新运行作业会导致相同的行为。

问题是:阶段中的未知状态是什么意思,如何调试为什么工作在其中?

标签: apache-sparkhadoophiveapache-spark-sqlhadoop-yarn

解决方案


推荐阅读