kubernetes - 仅在 tidb 集群中由于 tidb pod 中的连接被拒绝而导致准备就绪问题失败
问题描述
我们一直在 k8s 上运行 tidb 集群。从那以后它工作正常。但是突然之间,tidb-tidb-1
在扩展 tidb-tidb statsfulset 后,我只在新的 statsfull pod 中遇到了以下问题。有趣的是 tidb-tidb-2 正在运行。所有其他 pd 和 tikv pod 也运行良好。我检查了 pd url,它无法从有问题的 pod 访问,但对其他 pod 很好。你能帮我解决这个问题吗?
tidb-tidb-1 logs:
[2021/04/11 16:15:44.526 +00:00] [WARN] [base_client.go:180] ["[pd] failed to get cluster id"]
[2021/04/11 16:15:48.527 +00:00] [WARN] [base_client.go:180] ["[pd] failed to get cluster id"] [error="[PD:client:ErrClientGetMember]error:rpc error: code = DeadlineExceeded desc = latest connection error: connection error: desc = \"transport: Error while dialing dial tcp: i/o timeout\" target:test-tidb-pd:2379 status:CONNECTING
解决方案
- 你能显示命名空间信息吗?kubectl get all -n -o wide
- 请检查节点信息。 https://kubernetes.io/docs/concepts/scheduling-eviction/assign-pod-node/#node-isolation-restriction
- 请检查网络。如果两个节点都能ping通?传输:拨号时出错 TCP:i/o 超时
推荐阅读
- c# - 没有给出与 'Employee.Employee(string,string, int)' 的所需形式参数 'name' 相对应的参数
- c# - 如何从字典中获取元素并添加到数组中?
- python - 我可以在 PHP 中运行 Python 函数吗
- python - How to format to n decimal places in Python
- node.js - Microsoft Graph List outlookTask not returning immutable ID even if it's in preferred in header
- django - 在 /login/ 处获取 TypeError:authenticate() 得到了一个意外的关键字参数“用户名”
- java - 在java中为报表创建sql查询
- python - 在另一个包的模块中导入包?
- sharepoint - createNewDiscussion/createNewDiscussionReply 通过来自外部 Angular SPA 的 SharePoint 讨论板中的 JSOM
- c# - 如何在不使用 Visual Studio 的情况下直接在 Dockers 容器上运行 ASP.NET Core Web 应用程序