首页 > 解决方案 > Zabbix 性能调优(使用代理)

问题描述

我们用一个 Zabbix (3.4.7) 服务器和 8 个代理设置了一个分布式监控集群:

扎比克斯:

OS: Debian Stretch
CPU: 16*2.27GHz
RAM: 48GB
Disk: Raid1 10K (Non-SSD)


LogFile=/var/log/zabbix/zabbix_server.log
PidFile=/var/run/zabbix/zabbix_server.pid
DBName=zabbix
DBUser=zabbix
DBHost=127.0.0.1
DBPort=3307
LogFileSize=0
DBPassword=****
Timeout=4
AlertScriptsPath=/etc/zabbix/alert.d/
FpingLocation=/usr/bin/fping
LogSlowQueries=3000
Include=/etc/zabbix/zabbix_server.conf.d/*.conf
StartAlerters=10
StartPollers=80
StartPollersUnreachable=80
StartTrappers=20
StartPingers=30
StartEscalators=5
CacheSize=8G
StartDBSyncers=16
HistoryCacheSize=2048M
TrendCacheSize=256M
ValueCacheSize=10G
HistoryIndexCacheSize=2G
ExternalScripts=/etc/zabbix/alert.d/
SSHKeyLocation=/nonexistent/.ssh

代理人:

OS: Debian Stretch
CPU: 15*2.5GHz
RAM: 6GB
Disk: Raid1 10K (Non-SSD)


Server=XXXX
Hostname=zbx-lte
LogFile=/var/log/zabbix/zabbix_proxy.log
LogFileSize=0
PidFile=/var/run/zabbix/zabbix_proxy.pid
SocketDir=/var/run/zabbix
DBName=zabbix
DBUser=zabbix
DBPassword=159753
ConfigFrequency=600
DataSenderFrequency=1
StartPollers=240
StartPollersUnreachable=80
StartTrappers=20
StartPingers=80
SNMPTrapperFile=/var/log/snmptrap/snmptrap.log
CacheSize=1G
StartDBSyncers=16
HistoryCacheSize=2048M
HistoryIndexCacheSize=2G
Timeout=6
ExternalScripts=/usr/lib/zabbix/externalscripts
FpingLocation=/usr/bin/fping
LogSlowQueries=3000

我们正在通过 Zabbix 监控近 1650 个节点(snmp、icmp、代理、ssh、外部脚本和外部应用程序)

自(大约)2个月前以来,我们在特定zabbix代理(图片中的zbx-lte)上的非icmp图表(图片:5.png)中看到了很多滞后

Zabbix Proxy 的所有图表上都有太多滞后

此图与设备相关(使用 snmp v2)。(在这个代理上还有很多其他类似的图)我捕获了相关 zabbix 代理的网络流量,对于其中一项,zabbix 代理仅发送 16 个查询而不是 60 个查询(间隔 1m 1 小时)。

Zabbix Proxy 的所有图表上都有太多滞后

如果我将此设备更改为由 Zabbix Server 或任何其他代理监控,一切正常

听起来这个代理有问题 Zabbix 代理的 htop Zabbix Proxy 的免费内存

请帮助我找到根本原因。

更多细节 更多细节 更多细节 更多细节 更多细节 更多细节 更多细节

标签: performanceproxyzabbix

解决方案


我知道了!

令人惊讶的是,答案很有趣!

zabbix_proxy 中的服务器地址是一个 FQDN 地址,当我将它添加到 /etc/hosts 时,我们的性能问题得到了解决。


推荐阅读