apache-spark - Spark 作业状态正在运行,但第一步启动的时间几乎是 20 分钟后
问题描述
我的 Spark 工作于 19:46 提交,但第一阶段从 19:07 开始,为什么会有这么大的差距,我在过去 2 天都面临这个问题,在 2 天之前它工作正常。
请参阅图片以供参考,并说明可能的原因。
第一步是从 Hadoop 读取标头(CSV 文件)。
解决方案
推荐阅读
- mysql - 带有基于值的新列的 SELECT 语句
- logging - Istio 网络策略日志记录
- java - IBM MQQueue 获取所有消息的最安全方法
- node.js - 我需要使用节点 js mongo db 显示集合 a 不在集合 b 中的数据
- kubernetes - kubernetes 卷:复制的 Pod 之间的一个共享卷和一个专用卷
- python - 如何按字母顺序对列表进行反向排序,但首先是数字
- javascript - 如何将 Axios.get 中的值存储到全局数组中?
- php - 如何以百分比显示数字
- robotframework - 关键字“Selenium2Library.Click Element”需要 1 到 3 个参数,得到 0
- regex - 自定义解释器 - 使用正则表达式