kubernetes - Prometheus 作业“kubernetes-nodes”端点处于“未知”状态
问题描述
我们面临一个问题,即某些端点处于“未知”状态。Prometheus 作业“kubernetes-nodes”。
Nodes 和 Prometheus 都上线了好几天。我们试图卷曲那些处于“未知”状态的“kubernetes-nodes”端点。指标可以正确卷曲,但端点状态仍为“未知”。我们不知道原因(标准,在这种情况下它将被标记为“未知”)。
我知道在 Prometheus 进行第一次抓取之前,端点处于“未知”状态。然后,如果抓取成功,端点将为“UP”,如果失败,则为“DOWN”。但是,在下面的屏幕截图中,似乎某些端点从未被刮过……我们只是不知道为什么。
您能否就这种情况的可能原因提出建议?这是否意味着这个节点(名称隐藏在红色块中......)有问题?如果是这样,是否可以修复,让普罗米修斯将其视为“UP”?
提前致谢。
- job_name: kubernetes-nodes
scrape_interval: 1m
scrape_timeout: 10s
metrics_path: /metrics
scheme: https
kubernetes_sd_configs:
- api_server: null
role: node
namespaces:
names: []
bearer_token_file: /var/run/secrets/kubernetes.io/serviceaccount/token
tls_config:
ca_file: /var/run/secrets/kubernetes.io/serviceaccount/ca.crt
insecure_skip_verify: true
relabel_configs:
- separator: ;
regex: __meta_kubernetes_node_label_(.+)
replacement: $1
action: labelmap
- separator: ;
regex: (.*)
target_label: __address__
replacement: kubernetes.default.svc:443
action: replace
- source_labels: [__meta_kubernetes_node_name]
separator: ;
regex: (.+)
target_label: __metrics_path__
replacement: /api/v1/nodes/${1}/proxy/metrics
action: replace
- source_labels: [__meta_kubernetes_namespace]
separator: ;
regex: (.*)
target_label: namespace
replacement: $1
action: replace
解决方案
我认为您nodes/proxy
在普罗米修斯集群角色中缺少资源。这是官方示例github.com/prometheus/documentation/examples/rbac-setup.yml。
推荐阅读
- python-3.x - 电子邮件字段未保存在管理站点中
- javascript - ' TypeError: [Variable].getDay 不是函数
- wiki - 我可以复制一个 dokuwiki 命名空间吗
- r - 基于多个日期条目创建一个新列
- appium - 为什么 findElementsByXPath 对我不起作用
- tensorflow - 如何将 .tflite 文件转换为 .h5 或 .hdf5 文件
- c# - 动态页面的 Blazor 组件路由
- visual-studio-code - 如何使调试器在 VSCode 中对 C/C++ 文件使用“make”。我应该在 tasks.json 或 launch.json 中添加/更改哪些参数?
- git - 我从工作仓库中删除了一个提交文件,我想从 GIT 的本地仓库中取回它
- html - 如何在不透明度的图像顶部添加黑色层?