google-cloud-platform - 无论如何,是否可以根据计划而不是 GCP(谷歌云平台)中 dataproc 的策略自动扩展
问题描述
这是直截了当的。我正在开发的系统将在 dataproc(谷歌云平台)中提供,并且由于我们系统的一些业务特性,我们可以计算出未来处理的预期数据。所以,我只想基于它做横向扩展数据处理。
有什么想法可以通过我们这边实现的调度程序或 API 来横向扩展 dataproc 吗?
提前致谢。
解决方案
对于这种情况,您应该结合使用云调度程序和手动横向扩展方法。
创建云调度程序作业运行手动横向扩展 API 调用,如下所示。
您必须了解cron 语法才能将 cron 调度用于您的缩放作业。
在这种情况下,您只能指定集群使用的节点数,而不是增量节点数。这是此解决方案的限制。下面是 API 调用的示例。
PATCH /v1/projects/project-id/regions/us-central1/clusters/example-cluster?updateMask=config.worker_config.num_instances,config.secondary_worker_config.num_instances
{
"config": {
"workerConfig": {
"numInstances": 4
},
"secondaryWorkerConfig": {
"numInstances": 2
}
},
"labels": null
}
有关 Dataproc API 的详细说明,请参阅此处。
推荐阅读
- python - Numpy:在各种索引处将任意数量的零插入矩阵行
- python - 试图提示目录选择菜单
- excel - 如何在 oracle 中使用 YEARFRAC
- reactjs - 将 offsetLimitPagination 与过滤 Apollo Graphql 相结合
- c# - 运动取决于帧速率。我怎样才能让它独立于帧速率
- reactjs - 警告:签名和功能的功能可能无法正常运行,因为其权利使用占位符团队 ID
- javascript - jquery关于表单计算最大值而不提交
- python - 使用 selenium 和 python 进行 YouTube 自动化,从搜索的视频中选择的问题
- python - 如何使用 Spyder 和 Python 2.7 安装 conda 环境?
- java - 在春季批处理中调用 Joblauncher.run 时获取空指针