首页 > 解决方案 > Spark 作业状态正在运行,但第一步启动的时间几乎是 20 分钟后

问题描述

我的 Spark 工作于 19:46 提交,但第一阶段从 19:07 开始,为什么会有这么大的差距,我在过去 2 天都面临这个问题,在 2 天之前它工作正常。

请参阅图片以供参考,并说明可能的原因。

第一步是从 Hadoop 读取标头(CSV 文件)。

1

2

标签: apache-sparkhadoophdfs

解决方案


推荐阅读