docker - Kubernetes 健康检查因自定义 Nginx 网络服务器配置而失败
问题描述
我的健康检查因以下设置而失败。
nginx.conf
user root;
worker_processes auto;
error_log /var/log/nginx/error.log warn;
events {
worker_connections 1024;
}
http {
server {
listen 80;
server_name subdomain.domain.com
auth_basic "Restricted";
auth_basic_user_file /etc/nginx/.htpasswd;
}
server {
listen 80;
auth_basic off;
}
server {
listen 2222;
auth_basic off;
location /healthz {
return 200;
}
}
}
码头工人文件
FROM nginx:alpine
COPY index.html /usr/share/nginx/html/index.html
VOLUME /usr/share/nginx/html
COPY /server/nginx.conf /etc/nginx/
COPY /server/htpasswd /etc/nginx/.htpasswd
CMD ["nginx", "-g", "daemon off;"]
EXPOSE 80
EXPOSE 2222
部署.yaml
apiVersion: apps/v1
kind: Deployment
metadata:
name: my-app
namespace: my-namespace
labels:
app: my-app
spec:
replicas: 1
selector:
matchLabels:
app: my-app
template:
metadata:
labels:
app: my-app
spec:
containers:
- name: my-app
image: gcr.io/GOOGLE_CLOUD_PROJECT/my-app
ports:
- containerPort: 80
- containerPort: 2222
livenessProbe:
httpGet:
path: /healthz
port: 2222
readinessProbe:
httpGet:
path: /healthz
port: 2222
当我删除 nginx.conf 中的“server_name”行并删除第二个服务器块时,它肯定有效。这可能是入口/负载均衡器的问题,因为我不知道更新需要多长时间(昨天几分钟后,我经历了一个健康的 pod 变得不健康)。使用 Google 自己的入口控制器(不是 NGINX 入口!)在 Google Kubernetes Engine (GKE) 上运行它
我究竟做错了什么?
解决方案
问题在于 GKE 的负载均衡器会进行自己的运行状况检查。这些默认情况下查看 / 并期望得到 200 作为回报。只有当部署/pod 中的健康检查声明了另一个路径时,负载均衡器健康检查才会选择这些路径。
在应用入口 YAML 后预置负载均衡器。只要负载均衡器运行,部署或入口中的任何影响负载均衡器的更改都不会被接受。这意味着我必须先删除负载均衡器,然后应用部署、服务和入口 YAML(然后入口自动设置负载均衡器)。可以手动输入正确的路径(并等待几分钟),而不是删除负载均衡器。
由于负载均衡器似乎对每个打开的端口进行健康检查,我删除了我的 2222 端口,并将位置 /healthz 添加到每个服务器块,在 nginx 中使用端口 80 并关闭 auth_basic。
请参阅:https ://cloud.google.com/load-balancing/docs/health-check-concepts和https://stackoverflow.com/a/61222826/2534357和https://stackoverflow.com/a/38511357/ 2534357
新的 nginx.conf
user root;
worker_processes auto;
error_log /var/log/nginx/error.log warn;
events {
worker_connections 1024;
}
http {
server {
listen 80;
server_name subdomain1.domain.com;
root /usr/share/nginx/html;
index index.html;
auth_basic "Restricted";
auth_basic_user_file /etc/nginx/.htpasswd_subdomain1;
location /healthz {
auth_basic off;
allow all;
return 200;
}
}
server {
listen 80;
server_name subdomain2.domain.com;
root /usr/share/nginx/html;
index index.html;
auth_basic "Restricted";
auth_basic_user_file /etc/nginx/.htpasswd_subdomain2;
location /healthz {
auth_basic off;
allow all;
return 200;
}
}
server {
listen 80;
server_name domain.com www.domain.com;
root /usr/share/nginx/html;
index index.html;
auth_basic "Restricted";
auth_basic_user_file /etc/nginx/.htpasswd_domain;
location /healthz {
auth_basic off;
allow all;
return 200;
}
}
## next block probably not necessary
server {
listen 80;
auth_basic off;
location /healthz {
return 200;
}
}
}
我的新部署.yaml
apiVersion: apps/v1
kind: Deployment
metadata:
name: my-app
namespace: my-namespace
labels:
app: my-app
spec:
replicas: 1
selector:
matchLabels:
app: my-app
template:
metadata:
labels:
app: my-app
spec:
containers:
- name: my-app
image: gcr.io/GOOGLE_CLOUD_PROJECT/my-app
ports:
- containerPort: 80
livenessProbe:
httpGet:
path: /healthz
port: 80
readinessProbe:
httpGet:
path: /healthz
port: 80
推荐阅读
- sql-server - 不显示来自游标内动态 SQL 的选择结果
- ios - TapGesture 在 tabBar 下不起作用
- angular - angula 5材料奇偶列表按类别识别
- python - 熊猫数据框检查字符串是否不在要附加的列中
- python - 如何在列表 API 视图中查询 SerializerMethodField?
- javascript - Ajax 在提交时发送我的表单
- r - 错误:出现意外符号:R 错误消息
- datastax - 如何在 DataStax 版本 5.1.7 上启用 spark-sql?
- python - 如何将任务分配给特定的 CPU 内核?
- paypal - PayPal IPN 验证回传到 HTTPS