oozie - Oozie Job Invocation 需要时间来获得更大的容量
问题描述
我是 Oozie 的新手
我们有一个工作流程,我们在其中调用预处理 Python,然后是 Spark,然后是后处理 Python 作业
如果我们为单个实体调用工作流,它会立即得到处理
但是随着我们不断增加实体数量,每个 Jobs 的调用开始花费大量时间。作业的处理速度仍然很快,但作业的调用需要时间。
以下是我们保留的 oozie 配置:
<property>
<name>oozie.service.CallableQueueService.queue.size</name>
<value>10000</value>
<description>Max callable queue size</description>
</property>
-<property>
<name>oozie.service.SchedulerService.threads</name>
<value>100</value>
<description>The number of threads to be used by the SchedulerService to run deamon tasks.If maxed out, scheduled daemon tasks will be queued up and delayed until threads become available. </description>
</property>
-<property>
<name>oozie.service.CallableQueueService.threads</name>
<value>600</value>
<description>Number of threads used for executing callables</description>
</property>
<property>
<name>oozie.service.CallableQueueService.callable.concurrency</name>
<value>200</value>
<description>Maximum concurrency for a given callable type.Each command is a callable type (submit, start, run, signal, job, jobs, suspend,resume, etc).Each action type is a callable type (Map-Reduce, Pig, SSH, FS, sub-workflow, etc).All commands that use action executors (action-start, action-end, action-kill and action-check) usethe action type as the callable type. </description>
</property>
<property>
<name>oozie.service.coord.normal.default.timeout </name>
<value>120</value>
<description>Default timeout for a coordinator action input check (in minutes) for normal job. -1 means infinite timeout</description>
</property>
-<property>
<name>oozie.action.launcher.mapreduce.job.ubertask.enable</name>
<value>true</value>
</property>
-<property>
<name>oozie.action.shell.launcher.mapreduce.job.ubertask.enable</name>
<value>true</value>
</property>
我们尝试更改各种值,但没有看到显着的改进。有建议请支持
解决方案
推荐阅读
- reactjs - 如何找到实现某个接口的函数的参数类型?
- sas - 无法在 SAS 中注销用户会话
- firebase - 使用 Firebase Admin SDK 撤销刷新令牌所需的凭据实现是什么
- algorithm - Big-O本身有什么功能吗?
- apache-spark - 我们如何在 aws emr 集群中一次运行多个步骤(主要运行 spark)?
- sql - SQL 中按 1-7 系统日期分组
- resty-gwt - 无法配置 RestyGWT 示例应用程序
- sql - 填充 SQL Server 中两个日期之间的缺失日期
- sdk - 寻找CRM 2015 sdk zip下载
- java - 如何使用多种类型的 customViewHolder 在 recyclerView 中实现 recyclerView.smoothScrollToPosition(position)?