apache-spark - Spark History 服务器未列出已完成的 jar
问题描述
我在 Windows 中运行 Spark 独立作业。我想使用 spark 历史服务器监控我的 Spark 作业。我已经使用以下命令启动了 spark 历史服务器,并且历史服务器已成功启动。
C:\Users\Documents\Prev_D_Folder\Softwares\Softwares\spark-2.2.0-bin-hadoop2.7\spark-2.2.0-bin-hadoop2.7\spark-2.2.0-bin-hadoop2.7\bin>spark-class.cmd org.apache.spark.deploy.history.HistoryServer
我在本地运行了 spark 作业,但历史服务器没有列出任何已完成的作业。
我的 spark-defaults.conf 文件内容是:
spark.eventLog.enabled true
spark.eventLog.dir file:///C:/Users/m1047320/Documents/logs
spark.history.provider = org.apache.spark.deploy.history.FsHistoryProvider
spark.history.fs.logDirectory file:///C:/Users/m1047320/Documents/logs-hist
我对两个日志目录都有读、写和执行权限。
解决方案
spark.eventLog.dir
和的目录spark.history.fs.logDirectory
应该相同。
从文档中,spark.eventLog.dir
是日志基目录:
如果 spark.eventLog.enabled 为 true,则记录 Spark 事件的基本目录。在此基本目录中,Spark 为每个应用程序创建一个子目录,并在此目录中记录特定于应用程序的事件 [...]
在spark.history.fs.logDirectory
配置历史服务器用于读取日志的目录时:
对于文件系统历史提供程序,指向包含要加载的应用程序事件日志的目录的 URL。
您找不到任何已完成作业的原因是由于历史服务器读取了一个空目录。
推荐阅读
- c - Why cant i replace the character at 0th index with character at 1th index through the assignment statement at line 11?
- ios - iOS RxSwift - 如何“断开”一个 observable?
- node.js - 如何管理环回应用程序?
- android - 更新到 fcm 后,带有 android 棒棒糖的设备崩溃
- c# - Trying to call a function from another form, but it won't work
- jsf - 使用 onclick 事件捕获数据表中单元格的值 -primefaces
- gitlab - Gitlab:如何向请求访问的用户发送消息
- c# - Check if a file is directory in UWP
- azure-machine-learning-studio - 如何在 Azure 机器学习中限制请求参数
- python - 程序跳过列表元素