apache-spark - 增加 yarn-site.xml 中的 yarn.scheduler.maximum-allocation-mb 值
问题描述
yarn.scheduler.maximum-allocation-mb 值在 yarn-site.xml 中设置为 143360 MB。在 oozie 中运行 pyspark 作业时出现以下错误。我想增加它在 yarn-site.xml 中的值,但我无权增加它的值。
我有办法在 oozie 中设置 yarn.scheduler.maximum-allocation-mb 值吗?或将 yarn-site.xml(从服务器)复制到我的本地/hdfs 目录,增加其值,然后在 Oozie 工作流程中调用它?
错误:
Oozie Launcher 失败,主类 [org.apache.oozie.action.hadoop.SparkMain],main() 抛出异常,所需的执行程序内存 (133120+22000 MB) 高于此集群的最大阈值 (143360 MB)!请检查 'yarn.scheduler.maximum-allocation-mb' 和/或 'yarn.nodemanager.resource.memory-mb' 的值。java.lang.IllegalArgumentException:所需的执行程序内存(133120+22000 MB)高于此集群的最大阈值(143360 MB)!请检查 'yarn.scheduler.maximum-allocation-mb' 和/或 'yarn.nodemanager.resource.memory-mb' 的值。
Oozie workflow :
<action name="spark-node" cred="hcred">
<spark xmlns="uri:oozie:spark-action:0.1">
<job-tracker>${value}</job-tracker>
<name-node>${value}</name-node>
<configuration>
<property>
<name>mapreduce.job.queue.name</name>
<value>${value}</value>
</property>
</configuration>
<master>yarn</master>
<mode>cluster</mode>
<jar>xyz.py</jar>
<spark-opts>${sparkopts}</spark-opts>
</spark>
解决方案
推荐阅读
- sql - 选择计数和最大值
- python-3.6 - 为什么从 Tensorflow Record 文件中读取大张量的速度如此之慢?
- visual-studio-code - 当我在实时服务器中运行 HTML 文件时,它总是显示在新窗口中
- html - 我不明白 MDN 中提到的有关 HTML 元素的一行
- excel - Google 表格中的地址公式
- c - `qsort()` 可以按升序授予排序数组吗?
- security - 网站如何验证用户是否安全登录?
- css - Bootstrap4 - 具有 100% 高度和内部滚动的列的布局
- php - Laravel Group 和 Sum hasMany 关系
- php - Laravel 模型:引用模型的平均值(子查询)