google-cloud-platform - 数据流流式自动缩放究竟何时开始发生?
问题描述
因此,根据文档“如果流式管道仍然积压,工作人员在几分钟内平均使用超过 20% 的 CPU,数据流就会扩大”(https://cloud.google.com/dataflow/docs/指南/部署管道#autoscaling)。Dataflow 开始扩展时是否有确切的时间范围?
因为我使用 Streaming Engine(默认情况下有 1 个工作人员)测试了我的流式传输作业,以查看自动缩放是否有效以及工作人员数量是否增加,但在 CPU 利用率超过 20% 超过 6 分钟后。并且在相同的时间内(大约 6 分钟)积压了来自 PubSub 的未确认消息,当前工作人员的数量保持为 1,并且没有发生自动缩放。
此外,关于 Dataflow 中作业指标下的自动缩放图表,它对我说:“当前工作人员:1,目标工作人员:1”。“目标工人”是什么意思,与当前工人有什么区别?
提前感谢您的帮助。
解决方案
关于自动缩放图表。
- 当前工作人员- 管道当前使用的工作人员数量
- 目标工作人员- 数据流自动缩放算法建议的工作人员数量。可以是高档的,也可以是低档的。Pipeline 正在努力实现这一目标。
关于扩展决策的时间,我不认为 Dataflow 服务在这里提供了确切的保证。请参阅此处的流式自动缩放相关文档。如果您认为是否存在与自动缩放相关的问题,请联系 Dataflow 支持,以便他们查看您的特定管道。
推荐阅读
- python - 在 Django 中序列化一对一关系
- java - 将附加参数传递给 MapStruct 映射器
- python - 与字典列表的值交互并保存为字符串的最佳方式是什么?
- php - 如何在我的 php 代码中添加搜索消息“未找到”?
- python - 将 tcl 8.6 与已编译的 python 一起使用
- c# - 使用 .Net Core 2.0 编写的 AWS Lambda 函数无法加载 libdl
- c - 在 VS 2017 中禁用 AVX-512 内部函数
- java - 链 CompletableFuture 并在第一次成功时停止
- c# - crud 更新无法正常工作
- python - 如何将变量设置为问题总数