kubernetes - Gcloud Kubernetes 和 Redis 内存存储,间歇性问题,找不到主机
问题描述
有时一周左右一次,我们会遇到一个奇怪的状态,我们的 Kubernetes 集群无法连接到内存存储 Redis 服务。
K8S母版:1.10.7云测试版redis实例列表--region europe-west1 1 ↵ 10122 12:26:38
INSTANCE_NAME REGION TIER SIZE_GB HOST PORT NETWORK RESERVED_IP STATUS CREATE_TIME
chefclub-redis europe-west1 STANDARD_HA 1 10.0.10.4 6379 default 10.0.10.0/29 READY 2018-05-29T14:12:46
获得一个没有路由到主机。
kubectl run -i --tty busybox --image=busybox -- sh ✓ 10125 12:28:36
If you don't see a command prompt, try pressing enter.
/ # telnet 10.0.10.4 6379
telnet: can't connect to remote host (10.0.10.4): No route to host
过去发生过几次,现在我刚刚升级了我的节点1.10.7
,一切都恢复了原位,我可以再次连接。
我想知道接下来我可以采取哪些其他步骤?
解决方案
确保您已按照有关如何从集群连接到 Redis 实例和故障排除文档的说明进行操作。请注意,如果您的集群配置启用了 IP 别名,则在连接到 redis 服务器时,步骤可能会有所不同。
您可以研究 Kubernetes pod 的 Stackdriver 日志记录,并在受影响的时间范围内检查完整的错误消息。这将帮助您检查 Github 或其他 Stackoverflow 线程中的已知问题。用于查看 pod 日志的高级 Stackdriver 日志过滤器:
resource.type="container" resource.labels.cluster_name="cluster_name" resource.labels.namespace_id="k8s_namespace" 标签。"container.googleapis.com/k8s_pod_name"="k8s_pod_name"
如果您没有发现任何已知问题并怀疑该问题可能出在 Google 端。您可以使用Public Issue Tracker创建问题。
推荐阅读
- ios - 使用 Metal 有效计算 UIImage/CIImage 中有多少透明像素
- javascript - 未捕获的 ReferenceError: textAudio 未在 HTMLElement.onclick (index.html:1) 中定义
- python - 找不到 Flask-RESTX Jinja 模板 url
- c# - bfs 算法出错我无法理解我使用 c# unity
- laravel - Laravel - 关闭关系的过滤器集合
- python - 根据列表的值更新表中的列
- r - 在 RStudio 中更新涉及 NA 的烛台图表数据
- flutter - 为什么 Ipaymu API 发布响应总是 401?
- android - 用于将图像下载到位图中的异步任务
- telegram - 电报网络钩子“连接超时”