apache-spark - 如何为 spark-shell 设置 YARN 队列?
问题描述
我正在 spark shell 中执行一些 spark(scala) sql 代码。我想知道我正在使用哪个队列,如果可能的话,我想知道我正在使用多少内存和执行程序以及如何优化它?
解决方案
您可以在启动 spark shell 或 spark-submit 时设置队列名称、执行程序数量、执行程序内存、总内核数、每个执行程序的内核数、驱动程序内存等
这是您可以指定参数的方法。
spark-shell --executor-memory 6G --executor-cores 5 --num-executors 20 --driver-memory 2G --queue $queue_name
您应该根据胖执行器或瘦执行器概念根据集群容量计算这些参数。
如果您仍想查看资源利用率,可以查看资源管理器页面或 SPARK web UI 页面
推荐阅读
- hibernate - 使用 @SpringBootTest 禁用数据库连接
- ios - 当标签中的值低于 Swift 4 中的阈值时,如何通过本地通知提醒用户?
- ios - Objective c scrollview屏幕截图在ios 13中有问题
- ios - WARNING-[UIApplication delegate] 只能在主线程中使用
- php - PHP函数获取数组值
- javascript - 如何在innerHTML中激活表格响应列上的点击选项
- google-bigquery - gcloud:如何从 Stackdriver 的 pod 日志中获取特定字段?
- selenium - 如何使用 UI Vision 2019(又名 Selenium IDE++)读取和修改 url
- elasticsearch - 如何自动将@timestamp 值添加到 elasticsearch7 的文档中?
- flutter - 如何在 Flutter 中添加带有图标的按钮