
Prometheus return no data when calculating a ratio of two metrics

问题 I want to calculate a ratio of two metrics, but I get no data... I have some metrics like: fs_bytes{filesystem="/var",instance="localhost:9108",job="graphite",metric="Used"} 50.0 fs_bytes{filesystem="/var",instance="localhost:9108",job="graphite",metric="Total"} 100.0 When I try to do any operation (device, multiply, add, subtract) like: fs_bytes{instance="localhost:9108",metric="Used"} / fs_bytes{instance="localhost:9108",metric="Total"} Prometheus returned: no data When I query each metric

Ceph Dashboard 等 mgr 常用插件

Ceph Dashboard — Ceph Documentation 安装dashboard [root@node1 ~]# yum install ceph-mgr-dashboard -y 在正在运行的 Ceph 群集中,Ceph Dashboard 启用: [root@node1 ~]# ceph mgr module enable dashboard --force SSL/TLS 支持 默认情况下,与仪表板的所有 HTTP 连接都使用 SSL/TLS 进行保护。 若要快速启动和运行 dashboard ,可以使用以下内置命令生成和安装自签名证书: [root@node1 ~]# ceph dashboard create-self-signed-cert 注意 大多数 Web 浏览器会提示此类自签名证书,并且需要在建立与仪表板的安全连接之前进行显式确认。 若要正确保护部署并删除证书警告,应使用由证书颁发机构 (CA) 颁发的证书。 主机名和端口 与大多数 Web 应用程序一样,仪表板绑定到 TCP/IP 地址和 TCP 端口。 默认情况下,仪表板的守护进程(即当前活动管理器)将在禁用 SSL 时绑定到 TCP 端口 8443 或 8080。 ceph-mgr 如果未配置特定地址,Web 应用将绑定到 ,该绑定对应于所有可用的 IPv4 和 IPv6 地址。 ::

记一次 TCP 全队列溢出问题排查过程

1. 前言 本文排查的问题是经典的TCP队列溢出问题,因TCP队列问题在操作系统层面没有明显的指标异常,容易被忽略,故把排查过程分享给大家。 2. 问题描述 A服务调用B服务接口超时,B服务主机IOWAIT高,具体超时情况分为两种: A服务的请求在B服务日志中可查到,但B服务的响应时间超过了A服务的等待超时时间3S。 A服务的请求在B服务日志中无法查到。 3. 问题分析 此种超时请求集中在很短的一段时间(通常在2分钟之内),过后便恢复正常,所以很难抓到问题现场分析原因,只能搭建测试环境,A服务持续请求B服务,在B服务主机上通过DD命令写入大量数据造成主机IOWAIT高,同时通过TCPDUMP在两端抓包分析。 部分服务超时日志: 服务A:Get http:// xxx &id=593930: net/http: request canceled (Client.Timeout exceeded while awaiting headers) 服务B: "GET xxx&id=593930 HTTP/1.1" 200 64 "-" "Go-http-client/1.1" "-" "-" 165000(单位微秒) 服务A发起请求3S后没有收到服务B响应,断开连接,服务B日志显示处理时长为0.165S,远低于3S,服务A侧看服务B的响应时间为网络传输时间

Adding two values in Prometheus

问题 We need to add results of two queries in Prometheus. Snippet is below: (probe_ssl_earliest_cert_expiry{job="SSL-expiry"} - time() < 86400 * 738 )*1000 + (node_time_seconds*1000) but the result says no data as shown below: 回答1: You will get an empty result if the metrics do not match. The reason is that for binary operator vector1 <op> vector2 vector1 and vector2 results in a vector consisting of the elements of vector1 for which there are elements in vector2 with exactly matching label sets.

sum of rate function in prometheus

问题 Given the following prometheus time series called requests : the vector query requests[3 seconds] is : and the rate of the vector query requests[3 seconds], rate(requests[3 sec]) (computed by the shown formula) is : My question is : what is sum(rate(requests[3 sec])) evaluated at seconds 5, 4 and 3 respectively is it 16.5, 6.5 and 1. Any idea? 回答1: You are misunderstanding the purpose of sum. It is not performing a sum over time but over the dimensions for your metric. In your example,

