首页 > 解决方案 > Prometheus 作业“kubernetes-nodes”端点处于“未知”状态

问题描述

我们面临一个问题,即某些端点处于“未知”状态。Prometheus 作业“kubernetes-nodes”。

Nodes 和 Prometheus 都上线了好几天。我们试图卷曲那些处于“未知”状态的“kubernetes-nodes”端点。指标可以正确卷曲,但端点状态仍为“未知”。我们不知道原因(标准,在这种情况下它将被标记为“未知”)。

我知道在 Prometheus 进行第一次抓取之前,端点处于“未知”状态。然后,如果抓取成功,端点将为“UP”,如果失败,则为“DOWN”。但是,在下面的屏幕截图中,似乎某些端点从未被刮过……我们只是不知道为什么。

您能否就这种情况的可能原因提出建议?这是否意味着这个节点(名称隐藏在红色块中......)有问题?如果是这样,是否可以修复,让普罗米修斯将其视为“UP”?

提前致谢。

在此处输入图像描述

- job_name: kubernetes-nodes
  scrape_interval: 1m
  scrape_timeout: 10s
  metrics_path: /metrics
  scheme: https
  kubernetes_sd_configs:
  - api_server: null
    role: node
    namespaces:
      names: []
  bearer_token_file: /var/run/secrets/kubernetes.io/serviceaccount/token
  tls_config:
    ca_file: /var/run/secrets/kubernetes.io/serviceaccount/ca.crt
    insecure_skip_verify: true
  relabel_configs:
  - separator: ;
    regex: __meta_kubernetes_node_label_(.+)
    replacement: $1
    action: labelmap
  - separator: ;
    regex: (.*)
    target_label: __address__
    replacement: kubernetes.default.svc:443
    action: replace
  - source_labels: [__meta_kubernetes_node_name]
    separator: ;
    regex: (.+)
    target_label: __metrics_path__
    replacement: /api/v1/nodes/${1}/proxy/metrics
    action: replace
  - source_labels: [__meta_kubernetes_namespace]
    separator: ;
    regex: (.*)
    target_label: namespace
    replacement: $1
    action: replace

标签: kubernetesprometheus

解决方案


我认为您nodes/proxy在普罗米修斯集群角色中缺少资源。这是官方示例github.com/prometheus/documentation/examples/rbac-setup.yml


推荐阅读