google-cloud-platform - 仅在 GCP 内无法在 www.googleapis.com 上找到服务器
问题描述
我知道有一些与此问题类似的问题。但就我而言,这个问题只发生在 GCP 上。我们已经在 AKS (Azure) 中运行我们的服务近一年了,没有一次发生。在我们迁移到 GCP GKE 之后,我们的 Python 应用程序的一些请求陷入了错误:Unable to find the server at www.googleapis.com
. 在大多数情况下,请求有效,因此它似乎是随机的。我已经尝试增加 TCP 超时以及 Cloud Nat 中每个 VM 实例的最小最小端口数。我们正在使用 GKE 运行服务,并且我们为网络设置了 Cloud Nat 网关。
GCP 上是否有任何可能导致问题的专有设置?
解决方案
我弄清楚了问题所在。kube-dns 服务被调度到遭受高内存压力的节点,导致 kube-dns 被驱逐并重新启动。在此期间,一些请求将无法解决。为了解决这个问题,我创建了一个 kube-system 服务专有的节点池,然后编辑了 kube-system 部署并设置了一个 nodeSelector 以便它们总是被安排到安全节点。在那之后,这个问题就停止了。
推荐阅读
- php - 如何从网页加载和编辑 txt?
- javascript - 用自定义反应组件替换 html 中的元素
- go - 如何让我的 Go Lambda 函数在浏览器中调用它时给我一个响应?
- amazon-web-services - AWS CloudFormation 模板 - 如何使用 SQS 队列配置 Lambda 以从队列中挑选项目
- php - 将 PHP 会话变量的值设置为变量
- java - 每当我尝试创建我的递归方法时,我都会遇到同样的错误
- x86 - 为什么MESI协议不能保证没有LOCK前缀的x86上CMPXCHG的原子性?
- node.js - 即使在sails.js中使用mongodb的ObjectID也找不到记录
- node.js - 在 TSC 打印机上打印位图 - 使用 Node.js
- azure - Windows container from private Azure registry does not start in AKS