monitoring - 使用 Prometheus 和 Grafana 监控基础架构堆栈
问题描述
我们在 Kubernetes 环境中使用 Prometheus-Grafana 监控工具来监控节点、Pod 和容器资源。我们为硬件、VM Ware 和操作系统磁盘空间、文件系统监控和服务器的其他方面提供了许多其他监控工具。想知道是否有人尝试使用 Prometheus-Grafana 工具集监控整个堆栈,将所有指标集中在一个地方并使用单个工具集,而不是针对计算层的不同区域使用不同的方法?
我确实看到了用于 VM Ware、Linux 和 Windows 操作系统以及许多其他开源和企业软件解决方案的 Prometheus 出口商。我们已经使用 Tomcat、IIS、Java 相关的导出器来获取现有传统 Web 应用程序的运行时指标,并在为 WebLogic、WebSphere 和其他软件添加相关导出器的过程中。还将与应用程序团队合作以获取应用程序特定的指标。
想法是使用通用方法来解决所有监视和警报要求,如果这是推荐的方法,则与基础架构层无关。想要获得一些反馈,如果这是一种正确的方法,我无法提供太多信息。
解决方案
推荐阅读
- github - 如何使用 java 列出 GitHub 存储库的文件夹及其内容?
- git - 使用不同的用户名创建 GitHub 存储库?
- java - java中带有二维数组的反射
- c# - 从字符串中删除换行符
- python - Python function not working on Pandas Dataframe when subsetted in a loop
- mysql - 创建视图以从多个表中获取值
- swift - Array is null after setting data in it
- powershell - PowerShell Send-MailMessage 命令后电子邮件到达前的长时间延迟(约 2 分半钟)
- amazon-web-services - Trigger an AWS lambda after an event is completed
- python - pandas/sqlalchemy/pyodbc: Result object does not return rows from stored proc when UPDATE statement appears before SELECT