完整译文请访问:http://www.coderdocument.com/docs/prometheus/v2.14/best_practices/consoles_and_dashboards.html。
在仪表盘上显示尽可能多的数据是很吸引人的,特别是当像Prometheus这样的系统能够为你的应用程序提供如此丰富的监控手段时。这可能导致控制台由于拥有太多的信息而无法访问。
不要试图展现每一块数据,对于操作控制台,请考虑最可能的故障模式是什么,以及如何使用控制台来区分它们(利用服务的结构)。例如,如果在线服务系统中有一棵很大的服务树,服务的低延迟就是一个典型的问题。与其在单个大型仪表盘上显示每个服务的信息,不如为每个服务构建单独的仪表盘,其中包括与之通信的每个服务的延迟和错误。然后,你可以从顶部开始,逐步向下找到有问题的服务。
以下的指南非常有用:
- 在一个控制台上最多有5个图形。
- 每个图上的曲线不超过5个。如果是一个堆叠图或区域图,则可以相应多一些。
- 在使用所提供的控制台模板示例时,请避免在右侧的表格中包含超过20-30个条目。
如果你发现自己超出了这些限制,那么可以将不太重要的信息隐藏,或将一些子系统拆分到一个新的控制台。例如,你可以绘制聚合而不是分解的数据,将其移动到右手边的表格中,甚至完全删除数据(如果数据很少有用的话)——你总是可以在表达式浏览器中查看它!
最后,一组控制台很难服务于多个主节点(master)。在电话响起时(出现了什么问题?)你想要知道的东西与你在开发功能(有多少人遇到了极端情况)想要知道的东西有很大的不同。在这种情况下,可以使用两套独立的控制台。
来源:CSDN
作者:子夜的魂
链接:https://blog.csdn.net/xtayfjpk/article/details/103465947