hadoop-yarn - Apache Impala - 类似 YARN 的查询 CPU 利用率报告(在 Cloudera 上)
问题描述
我们将 YARN 和 Impala 放在同一个 cloudera 集群上,YARN 利用率报告和 YARN 历史服务器提供更有价值的信息,例如 YARN CPU (Vcores) 和内存使用情况。
IMPALA 是否存在类似的情况,我可以在 Cloudera 集群上获取每个查询以及整体上的 CPU 和内存使用情况。
确切地说,我想知道在其 CPU 分配中使用了多少 Vcore。
例如,一个 Impala 查询需要 10 秒来执行一个查询,假设它使用了 4 个 vcore 和 50MB 的 RAM,我如何找出使用了 4 个 vcore。
是否有任何直接的方法可以从集群中查询这个或任何其他关于如何计算 CPU 利用率的方法?
解决方案
您可以通过 Cloudera Manager Charts 获得大量信息。您可以在他们的网站上找到所有可用指标的概述,或者在创建新图表时单击右侧的帮助符号。
Impala 有很多类别可能值得您一读。例如一般 Impala 指标和Impala 查询指标。例如,查询指标包含以字节为单位测量的“memory_usage”,而一般指标包含“impala_query_cm_cpu_milliseconds_rate”和“impala_query_memory_accrual_rate”。这些似乎与您的用例相关,但请查看它们和链接的站点以查看哪些适合您的用例。
更多信息可从 Cloudera Manager 中 Impala 服务的服务页面获得。您可以在此处找到有关此页面的更多信息,但例如链接页面提到:
Impala 查询页面显示有关正在运行和已在集群中运行的 Impala 查询的信息。您可以按时间段和指定简单的过滤表达式来过滤查询。
它还允许您为每个查询显示“线程:CPU 时间”和“工作 CPU 时间”,这同样可能与您相关。
这就是 Impala 提供的所有信息。
推荐阅读
- python - 如何提交修改后的表格?
- php - PHP MVC 数据表服务器端处理
- html - @font-face .ttf 导致加载时间变慢
- javascript - Lightbox2 不会阻止浏览器跟随链接
- c# - 在邮递员上不断收到 < 和 > XML 响应
- python - 通过在列中的两个值之间插值并分别计算中位数来填充表中的 nan 值
- python - 如何放置超过 1 个输入框,当我单击验证时,它会在 tkinter 上一次性创建变量?
- css - 使用无法居中的 Tailwind flex 项目
- javascript - 如何检测以前在浏览器中不可见的元素的可见性?
- prestashop - Prestashop:当订单状态更改为“已发货”时获取订单详细信息