scala - Log4j 在多个节点中创建日志。想在一个节点上创建一个日志
问题描述
我有一个多节点集群 Spark 集群。我正在使用 log4j 创建日志。正在创建日志,但集群中的所有节点都是一个。它们也在 /tmp 目录中创建,而不是在任何其他目录中。这是
spark2-submit --master yarn --deploy-mode cluster --files /path/log4j.properties --conf "spark.driver.extraJavaOptions=-Dlog4j.configuration=log4j.properties" --conf "spark.executor.extraJavaOptions =-Dlog4j.configuration=log4j.properties" --class com.dataLoad.Load_WF /path/LoadData.jar
如何将所有日志附加到一个日志文件而不是多个日志中?如何在 Linux 中的 /tmp 目录以外的目录中创建日志?示例代码将非常有助于理解。非常感激。
解决方案
在多节点 spark 集群上,应用程序的日志由 spark 驱动程序写入。
如果在节点 A 上使用客户端模式执行,日志将保存在节点 A 上
如果以集群模式执行,日志将保存在运行 spark 驱动程序的节点上。
我们遇到了同样的问题,我们找到的解决方案是使用 syslog 来集中每个节点的日志,用于同一节点上的所有应用程序。
在主节点上,您必须将 syslog 配置为日志服务器。在 /etc/syslog-ng/ 中,您必须编辑 syslog-ng.conf 以创建目的地来保存集中式日志文件,:
例子 :
@version: 3.5
@include "scl.conf"
@include "`scl-root`/system/tty10.conf"
options {
time-reap(30);
mark-freq(10);
keep-hostname(yes);
};
source s_local { system(); internal(); };
source s_network {
syslog(transport(udp) port(514));
};
destination df_local2 {
file(
"/var/log/MyClusterLogs/myAppLogs.$YEAR-$MONTH-$DAY.log"
owner("user")
group("user")
perm(0777)
); };
filter f_local2 { facility(local2); };
log { source(s_network); filter(f_local2); destination(df_local2); };
然后,将 spark 应用程序的 log4j.properties 文件中的配置更改为指向 syslog 服务器:
log4j.rootCategory=INFO,FILE,SYSLOG
log4j.appender.SYSLOG=org.apache.log4j.net.SyslogAppender
log4j.appender.SYSLOG.syslogHost=<syslog_server_ip>
log4j.appender.SYSLOG.layout=org.apache.log4j.PatternLayout
log4j.appender.SYSLOG.layout.conversionPattern=%d{ISO8601} %-5p [%t] %c{2} %x - %m%n
log4j.appender.SYSLOG.Facility=LOCAL2
推荐阅读
- javascript - 如何将 ID 从 JavaScript 传递到 Laravel PHP 脚本?
- maven - 为什么“mvn deploy”命令正在重建 .jar?
- python - 使用 Python 脚本下载 Outlook 附件的正确模块是什么?
- drools - 我不明白为什么 drools 规则会产生错误
- reactjs - 如何在过渡期间移除overflowX
- php - 如何在 Wordpress 主题上显示我自己的自定义字段?
- html - 如何使表格单元格的宽度适应其内容?
- django - 从 lambda 函数(django)调用 www.googleapis.com:443 时如何修复超时错误 504
- r - jqui_sortable 与 do.call 的多个 ggplots 不起作用
- reactjs - 为什么将状态设置为常量会触发两次重新渲染?