kubernetes - Kubernetes Horizontal Pod Autoscaler (HPA) 测试
问题描述
我们在 Web 服务 API 上遇到了一些内部服务器错误 (500),这似乎是在我们的自动扩缩器配置中引入或删除新 pod 时。
自然,这类事情很难排除故障,因为您并不总是能够控制 pod 启动和停止的时刻。
是否有一种机制可以用来指示集群向上和向下扩展?
我们hpa.yaml
的利益。
kind: HorizontalPodAutoscaler
apiVersion: autoscaling/v2beta2
metadata:
name: xyz
spec:
minReplicas: 1
maxReplicas: 12
scaleTargetRef:
apiVersion: apps/v1
kind: Deployment
name: xyz
behavior:
scaleUp:
stabilizationWindowSeconds: 0
policies:
- type: Percent
value: 100
periodSeconds: 15
scaleDown:
stabilizationWindowSeconds: 300
policies:
- type: Percent
value: 50
periodSeconds: 60
metrics:
- type: Resource
resource:
name: cpu
target:
type: Utilization
averageUtilization: 70
- type: Resource
resource:
name: memory
target:
type: Utilization
averageUtilization: 85
解决方案
如果您有兴趣让 HPA 强制创建或销毁 Pod 以进行调试,您可以在 Horizontal Pod Autoscaler .yaml 定义中使用自定义指标。
如果问题是新创建的 Pod 导致错误,您可以在 Pod 定义中实现就绪探针,执行 httpGet 检查。这样,您可以避免重定向故障 Pod 上的流量,直到探测检查返回 status = 200。
推荐阅读
- r - 基础 R 中绘图的小问题 - 绘图顶部显示不需要的线条
- python - python - 如何将不同级别的日志写入python日志模块中的单独文件?
- ssh - Windows 10 和 ssh 上的 Visual Studio Code Live 服务器
- vert.x - 如何在 Vertx 中设置活动配置文件,类似于 Spring Boot
- jquery - 将 css 框扩展到正确的文本高度
- r - 对 R 中的列求和时的问题
- r - 根据重复的字符串值将行拆分为具有列名的多列
- html - 强制以 css 网格开始新行
- apache-spark - Spark - 计算数组列的统计信息 (ArrayType)
- android - 错误:程序类型已存在:com.google.gson.JsonNull 如何找到重复的库