InfluxDB

万字谈监控:解答Zabbix与Prometheus选型疑难

半腔热情 提交于 2020-09-24 06:00:06
Zabbix与Prometheus 读完本文,你将收获 两者适用于多大规模的监控场景?超过5000以上监控节点 时怎么办?高可用怎么解决? 两者怎么解决存储问题?对于监控信息是否有历史存储和分析,能从历史信息中挖掘到哪些有价值的信息? 两者怎么应对告警风暴和误报? 在智能监控和自动治愈方面是否有可借鉴的实践?基于什么算法或策略?怎么进行故障预判和预处理? 监控大屏是怎么设计的? 自动化运维管理是两者同时使用还是二选一更合适? 两者在配合使用时,应该怎么分工?怎么落地? 如果已经部署了Zabbix,怎么平稳过渡到Prometheus? 分布式链路的可观测性和端到端诊断怎么做? 大规模场景下,两者的性能和成本哪个比较低? 监控,为什么总让我们头痛 监控一直都是运维工作中不可或缺的部分,一个高效、契合的监控系统是服务赖以健康稳定的基石。 随着业务规模的增长、技术 的发展、行业的变革,企业对用户体验 越来越重视 ,监控的需求发生着日新月异的变化,相应的监控工具和解决方案也层出不穷。其中,Zabbix 和Prometheus就是两款非常典型的监控工具,应用 颇为广泛。 说起来,监控在不同的团队和公司之间,可能会存在各种差异化的需求。如何基于开源产品打造一个符合自己业务场景的监控体系,并且持续迭代?这成为了大家无法绕开的课题。 比如说,如何选择监控方案和开源工具

influxdb centos --> yum install 安装

匆匆过客 提交于 2020-08-19 20:30:55
命令行运行: cat <<EOF | sudo tee /etc/yum.repos.d/influxdb.repo [influxdb] name = InfluxDB Repository - RHEL \$releasever baseurl = https://repos.influxdata.com/rhel/\$releasever/\$basearch/stable enabled = 1 gpgcheck = 1 gpgkey = https://repos.influxdata.com/influxdb.key EOF 然后安装influxdb ` sudo yum install influxdb sudo service influxdb start Or if your operating system is using systemd (CentOS 7+, RHEL 7+): sudo yum install influxdb` 来源: oschina 链接: https://my.oschina.net/u/217662/blog/4514692

详解k8s原生的集群监控方案(Heapster+InfluxDB+Grafana)

醉酒当歌 提交于 2020-08-19 09:55:59
1、浅析监控方案 heapster是一个监控计算、存储、网络等集群资源的工具,以k8s内置的cAdvisor作为数据源收集集群信息,并汇总出有价值的性能数据(Metrics):cpu、内存、network、filesystem等,然后将这些数据输出到外部存储(backend),如InfluxDB,最后再通过相应的UI界面进行可视化展示,如grafana。 另外heapster的数据源和外部存储都是可插拔的,所以可以很灵活的组建出很多监控方案,如:Heapster+ElasticSearch+Kibana等等。 Heapster的整体架构图: 2、部署 本篇我们将实践 Heapster + InfluxDB + Grafana 的监控方案 。使用官方提供的yml文件有一些小问题,请参考以下改动和说明: 2.1、创建InfluxDB资源对象 apiVersion: apps/v1 kind: Deployment metadata: name: monitoring-influxdb namespace: kube-system spec: replicas: 1 selector: matchLabels: task: monitoring k8s-app: influxdb template: metadata: labels: task: monitoring k8s-app:

ansible的常用模块和自定义模块

霸气de小男生 提交于 2020-08-18 14:23:58
1. ansible命令集 ansible: 定义并运行简单任务。 ansible-config: 查看、编辑、管理ansible配置。 ansible-doc: 文档查看工具。 ansible-galaxy:共享和下载roles的工具。 ansible-inventory:查看inventory的信息。 ansible-playbook:执行playbook。 ansible-pull: 从仓库中拉去playbook。 ansible-vault: 文件加密工具。 ansible-console: repl控制台执行ansible任务。 2. ansible模块 ansible给我们提供了很多的常用模块, 我估计你自己想用的模块, 基本都可以找到, 我们在写功能的时候, 首先来查一下, 已经有很大大佬给我们写了很多模块了, 足够你使用了. 针对下面的模块, 我建议大家还是扫一眼, 万一以后用到呢, 其实找到下面的模块, 你知道它已经有了, 就没必要自己去写了.针对能用到的, 我都进行加粗处理了,大家扫一眼, 了解一下. ansible 2.2.0.0ansible-doc -l add_host 将主机(以及组)添加到ansible-playbook内存库存中 apk 管理apk包 apt 管理apt-packages assemble 从片段组装配置文件

JMXtrans + InfluxDB + Grafana实现Zookeeper性能指标监控

好久不见. 提交于 2020-08-17 18:28:41
一、总体效果图 这里是将集群全部放在一起,可以根据自己的审美看怎么放 二、监控指标 其中有些指标与第一篇 Zookeeper通过四字命令基础监控(Zabbix) 的四字命令的指标是有重复的,二者选一个则可 三、实现 1、influxdb的安装 1)设置yum源 cat <<EOF | sudo tee /etc/ yum .repos.d/ influxdb.repo [influxdb] name = InfluxDB Repository - RHEL \$releasever baseurl = https: // repos.influxdata.com/rhel/\$releasever/\$basearch/stable enabled = 1 gpgcheck = 1 gpgkey = https: // repos.influxdata.com/influxdb.key EOF 2)安装influxdb yum install influxdb systemctl start influxdb 3)修改配置文件(元数据以及数据存放目录) [root@ip- 172 - 0 - 0 - 7 influxDB]# cat /etc/influxdb/influxdb.conf | grep " ^\s*[^# \t].*$ " [meta] dir = "

SQL/PromQL? SLS时序分析选型

老子叫甜甜 提交于 2020-08-17 16:50:08
可观察性与Open Telemetry 在CNCF的 landscape 上,有专门的一个部分来展示Obserability and Analysis,什么是Observability(可观察性)? 我从OpenTelementry官网摘抄了这段描述: 可观察性包括Logging,Metrics,Tracing这三类紧密配合的数据源:metrics可以用来发现问题,利用相关的trace去找到异常节点,再看该异常节点的日志去定位根因。 很多人可能会觉得可观察性就是“旧瓶装新酒”,本质上没有任何的创新。从现实中(包括Landscape)不难理解这个说法,目前Logging,Metrics(Monitoring),Tracing都有各自的生态。实现上大家有各自的数据模型,模型中可能有也可能没有考虑和其他数据的联动,如果想要对数据做整合,就要各自做大量的适配工作。 为了解决这个问题,OpenTelementry诞生了。OpenTelementry从OpenTracing和OpenCensus合并而来,致力于可观察性的统一,他的重点在规范的制定,sdk的实现,采集系统的实现上,让大家都以一致的数据模型来产出数据. 对于数据如何存储如何使用,这个范畴太大,有非常多可能性,所以仍然需要上层产品去探索。 SLS 对Open Telemetry支撑

开放、普惠、高性能-SLS时序存储助力打造企业级全方位监控方案

拥有回忆 提交于 2020-08-15 15:14:43
无所不在的时序数据 时间带走一切,长年累月会把你的名字、外貌、性格、命运都改变。 ---柏拉图 随着时间的推移,万事万物都在不停的变化,而我们也会用各种数字去衡量这些变化信息,比如年龄、重量、速度、温度、金钱...在数字化时代中,我们会把这些随着时间变化的数据保存起来,挖掘这些数据的价值。通常我们会称这类数据为---时序数据。 时序数据用于描述物体在时间维度上的状态变化信息。 时序数据在各行各业都得到了非常广泛的应用,例如股票走势、交易趋势、服务器指标、脉搏心跳、定位坐标、能耗趋势等等,而这些数据几乎在所有的场景中都得到了应用,例如: 各类炒股软件提供众多不同维度的股票K线图,为广大股民提供参考标准; Apple Watch通过监控佩戴者的心率信息,帮助人们提早发现严重的心脏疾病; 国家电网通过分析各个小区、住户的用电量曲线,来判断是否有偷电漏电情况; 电商类的公司会监控平台的下单、交易、退货、评价等关键流程的变化趋势,用来快速发现各类异常; 各个游戏平台通过分析每个用户角色的操作、位置等变化规律,来判断是否使用了作弊辅助工具... 我们需要一个什么样的时序存储 为了能够支撑各种场景的时序分析、监控等需求,近几年在开源和商业领域均出现了一些时序存储的引擎,例如TimescaleDB、CrateDB、InfluxDB、OpenTSDB、Prometheus等

可视化工具Grafana:简介及安装

蹲街弑〆低调 提交于 2020-08-15 12:45:29
from: https://www.cnblogs.com/imyalost/p/9873641.html 可视化工具Grafana:简介及安装 随着业务的越发复杂,对软件系统的要求越来越高,这意味着我们需要随时掌控系统的运行情况。因此,对系统的实时监控以及可视化展示,就成了基础架构的必须能力。 这篇博客,介绍下开源的可视化套件grafana的安装及其功能特点。。。 官网地址: Grafana 官方文档: Grafana文档 环境:CentOS7.4 64位 Grafana版本:5.3.2 一、Grafana介绍 Grafana是一个跨平台的开源的度量分析和可视化工具,可以通过将采集的数据查询然后可视化的展示,并及时通知。它主要有以下六大特点: 1、展示方式:快速灵活的客户端图表,面板插件有许多不同方式的可视化指标和日志,官方库中具有丰富的仪表盘插件,比如热图、折线图、图表等多种展示方式; 2、数据源:Graphite,InfluxDB,OpenTSDB,Prometheus,Elasticsearch,CloudWatch和KairosDB等; 3、通知提醒:以可视方式定义最重要指标的警报规则,Grafana将不断计算并发送通知,在数据达到阈值时通过Slack、PagerDuty等获得通知; 4、混合展示:在同一图表中混合使用不同的数据源,可以基于每个查询指定数据源

Hacker News 简讯 2020-07-21

好久不见. 提交于 2020-08-14 03:28:33
更新时间: 2020-07-21 23:00 AMD Launches 12 Desktop Renoir Ryzen 4000G Series APUs: But You Can’t Buy Them - (anandtech.com) AMD推出12台雷诺阿雷森4000克系列台式机:但你不能买 得分:46 | 评论:31 Common mistakes writing React components with hooks - (lorenzweiss.de) 书写常见错误用钩子反应组件 得分:65 | 评论:38 Monitoring your own infrastructure using Grafana, InfluxDB, and CollectD - (serhack.me) 使用Grafana、InfluxDB和CollectD监控您自己的基础架构 得分:114 | 评论:78 Invert, Always, Invert - (anup.io) 反转,总是,反转 得分:234 | 评论:64 Systems Design for Advanced Beginners - (robertheaton.com) 面向高级初学者的系统设计 得分:650 | 评论:73 AI in physics: are we facing a scientific

Windows10 InfluxDB安装、启动、使用

谁说我不能喝 提交于 2020-08-13 23:05:41
InfluxDB是一个时间时序数据库,被设计用来处理高写入和查询负载。 一、下载InfluxDB 在官网https://portal.influxdata.com/downloads/下载,目前最新稳定版本是v1.8.0,下载完成后,解压influxdb-1.8.0_windows_amd64.zip到指定目录。 二、安装InfluxDB 打开解压包里的influxdb.conf文件,配置meta、data、wal相关目录,配置完成后进行保存。 三、使用InfluxDB 为了使用第二步的配置,启动influxd时需要制定配置,如下所示: influxd --config influxdb.conf 之后启动influx,如下所示: 显示数据库:show databases 创建数据库: create database myfirstdb 使用数据库:use myfirstdb InfluxDB中没有显式的新建表的语句,只能通过insert数据的方式来建立新表 insert results,hostname=indexq value=1 查询数据: 上述中的时间戳默认是一个纳秒时间错,可以修改为只读格式: precision rfc3339 查看数据库中的所有tag key: show tag keys 查看数据库中的所有field key: show field keys