Prometheus控制台和仪表盘

本秂侑毒 提交于 2019-12-15 08:30:13

完整译文请访问http://www.coderdocument.com/docs/prometheus/v2.14/best_practices/consoles_and_dashboards.html

在仪表盘上显示尽可能多的数据是很吸引人的,特别是当像Prometheus这样的系统能够为你的应用程序提供如此丰富的监控手段时。这可能导致控制台由于拥有太多的信息而无法访问。

不要试图展现每一块数据,对于操作控制台,请考虑最可能的故障模式是什么,以及如何使用控制台来区分它们(利用服务的结构)。例如,如果在线服务系统中有一棵很大的服务树,服务的低延迟就是一个典型的问题。与其在单个大型仪表盘上显示每个服务的信息,不如为每个服务构建单独的仪表盘,其中包括与之通信的每个服务的延迟和错误。然后,你可以从顶部开始,逐步向下找到有问题的服务。

以下的指南非常有用:

  • 在一个控制台上最多有5个图形。
  • 每个图上的曲线不超过5个。如果是一个堆叠图或区域图,则可以相应多一些。
  • 在使用所提供的控制台模板示例时,请避免在右侧的表格中包含超过20-30个条目。

如果你发现自己超出了这些限制,那么可以将不太重要的信息隐藏,或将一些子系统拆分到一个新的控制台。例如,你可以绘制聚合而不是分解的数据,将其移动到右手边的表格中,甚至完全删除数据(如果数据很少有用的话)——你总是可以在表达式浏览器中查看它!

最后,一组控制台很难服务于多个主节点(master)。在电话响起时(出现了什么问题?)你想要知道的东西与你在开发功能(有多少人遇到了极端情况)想要知道的东西有很大的不同。在这种情况下,可以使用两套独立的控制台。

 

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!