nagios

Prometheus 0002

二次信任 提交于 2020-01-14 11:22:34
Prometheus vs Zabbix Zabbix 使用的是 C 和 PHP, Prometheus 使用 Golang, 整体而言 Prometheus 运行速度更快一点。 Zabbix 属于传统主机监控,主要用于物理主机,交换机,网络等监控,Prometheus 不仅适用主机监控,还适用于 Cloud, SaaS, Openstack,Container 监控。 Zabbix 在传统主机监控方面,有更丰富的插件。 Zabbix 可以在 WebGui 中配置很多事情,但是 Prometheus 需要手动修改文件配置。 Prometheus vs Graphite Graphite 功能较少,它专注于两件事,存储时序数据, 可视化数据,其他功能需要安装相关插件,而 Prometheus 属于一站式,提供告警和趋势分析的常见功能,它提供更强的数据存储和查询能力。 在水平扩展方案以及数据存储周期上,Graphite 做的更好。 Prometheus vs InfluxDB InfluxDB 是一个开源的时序数据库,主要用于存储数据,如果想搭建监控告警系统, 需要依赖其他系统。 InfluxDB 在存储水平扩展以及高可用方面做的更好, 毕竟核心是数据库。 Prometheus vs OpenTSDB OpenTSDB 是一个分布式时序数据库,它依赖 Hadoop 和 HBase

zabbix、cacti、nagios,服务器监控还有更好的选择吗?

我只是一个虾纸丫 提交于 2020-01-08 17:52:17
【推荐】2019 Java 开发者跳槽指南.pdf(吐血整理) >>> 对于运维的日常工作来说,服务器监控是必须且最基础的一项内容。在企业网络运维过程中,管理员闭虚随时关注服务器和网络运行情况,以便及时发现问题,尽可能减少故障的发生。当网络中的设备、服务器数量较多时,为了更加方便,快捷的获得各种监控信息,通常会借助一些集中监测软件。 目前使用比较多的服务器监控软件有这三款: zabbix、cacti、nagios ,简单介绍一下这三个软件。 zabbix zabbix 是一个基于WEB界面的提供分布式系统监视以及网络监视功能的企业级的开源解决方案。 zabbix能监视各种网络参数,保证服务器系统的安全运营;并提供灵活的通知机制以让系统管理员快速定位/解决存在的各种问题。 cacti Cacti是一套基于PHP,MySQL,SNMP及RRDTool开发的网络流量监测图形分析工具。 nagios Nagios 是一款开源的免费网络监视工具,能有效监控Windows、Linux和Unix的主机状态,交换机路由器等网络设备,打印机等。在系统或服务状态异常时发出邮件或短信报警第一时间通知网站运维人员,在状态恢复后发出正常的邮件或短信通知。 然而对于大部分新手来说,这三款监控软件虽然在监控方面的功能很强大,都不是太容易上手,安装和部署比较困难。 资源监控在运维工作中的作用是发现问题

Check-mk installation. Failed dependencies (Mariadb, Python-reportlab, libgsf)

╄→гoц情女王★ 提交于 2020-01-06 23:45:06
问题 I have problem with installation check_mk on amazon-ec2. I have already installed nagios core successfully and I try now install check_mk plugin by rpm: rpm -ivh check-mk-raw-1.2.8p17-el7-40.x86_64.rpm Rpm stop and return list of needed dependencies for installation. Most of them I installed successfully but I have problem with rest of it. error: Failed dependencies: mariadb-server is needed by check-mk-raw-1.2.8p17-el7-40.x86_64 python-reportlab is needed by check-mk-raw-1.2.8p17-el7-40.x86

Unable to pull JMX data using jolokia from Kafka

两盒软妹~` 提交于 2020-01-05 04:13:06
问题 I have installed Jolokia in centos 7 machine and trying to pull Kafka metrics using Jolokia agent and integrate with Icinga monitoring tool using Nagios plugin check_jmx4perl. Below are the configuration steps I have followed Step 1: Downloaded jolokia-jvm-1.3.4-agent.jar Step 2: Copied to /home/usr/ Step 3: Provided permissions by issuing command chmod a+x /home/usr/jolokia-jvm-1.3.4.jar Step 4: Added to class path by issuing command export KAFKA_OPTS="$KAFKA_OPTS -javaagent:/home/usr

Nagios安装部署

霸气de小男生 提交于 2019-12-27 17:40:18
/*--> */ /*--> */ Nagios 安装 Nagios 工作原理    Nagios 的功能是监控服务和主机,但是他自身并不包括这部分功能,所有的监控、检测功能都是通过各种插件来完成的。   启动 Nagios 后,它会周期性的自动调用插件去检测服务器状态,同时 Nagios 会维持一个队列,所有插件返回来的状态信息都进入队列, Nagios 每次都从队首开始读取信息,并进行处理后,把状态结果通过 web 显示出来。    Nagios 提供了许多插件,利用这些插件可以方便的监控很多服务状态。安装完成后,在 nagios 主目录下的 /libexec 里放有 nagios 自带的可以使用的所有插件,如, check_disk 是检查磁盘空间的插件, check_load 是检查 CPU 负载的,等等。每一个插件可以通过运行 ./check_xxx –h 来查看其使用方法和功能。    Nagios 可以识别 4 种状态返回信息,即 0(OK) 表示状态正常 / 绿色、 1(WARNING) 表示出现警告 / 黄色、 2(CRITICAL) 表示出现非常严重的错误 / 红色、 3(UNKNOWN) 表示未知错误 / 深黄色。 Nagios 根据插件返回来的值,来判断监控对象的状态,并通过 web 显示出来,以供管理员及时发现故障。 四种监控状态   再说报警功能

Nagios监控部署(一)

不羁岁月 提交于 2019-12-27 09:58:37
Nagios部署(一) 1) 安装准备 系统:redhat7.1(监控端)、centos6.5(被监控端) 软件:nagios-cn-3.2.3.tar.bz2、gd-devel-2.0.35-26.el7.x86_64.rpm、nagios-plugins-2.1.1.tar.gz | 主机名 | IP地址 | 角色 | | ------------------| -------------- |-------------------| | host.mystudy.com | 192.168.1.183 | 监控端 | | chunlin | 139.199.181.155| 被监控端1(远程) | | client5 | 192.168.1222.15| 被监控端2(同网段)| 防火墙:关闭 SELinux:Disabled 时间:保持同步 2) 安装nagios [root@host ~]# yum install -y httpd [root@host ~]# yum install -y gd-devel-2.0.35-26.el7.x86_64.rpm [root@host ~]# mkdir /usr/local/nagios [root@host ~]# useradd -s /sbin/nologin nagios [root@host ~]# groupadd

How do I get a custom Nagios plugin to work with NRPE?

老子叫甜甜 提交于 2019-12-24 21:17:35
问题 I have a system with no internet access where I want to install some Nagios monitoring services/plugins. I installed NRPE (Nagios Remote Plugin Executor), and I can see commands defined in it, like check_users , check_load , check_zombie_procs , etc. command[check_users]=/usr/lib/nagios/plugins/check_users -w 5 -c 10 command[check_load]=/usr/lib/nagios/plugins/check_load -w 15,10,5 -c 30,25,20 ... I am able to run the commands like so: /usr/local/nagios/libexec/check_nrpe -H 127.0.0.1 -c

How Can I Install Redis perl library Manually i.e offline.And From Where Can I Get All The Dependencies To Install

末鹿安然 提交于 2019-12-24 20:10:02
问题 I am trying to install check_redis plugin and for that i need redis perl library but i don't have access to CPAN and internet.So Is there any way to install by downloading zip file and all the dependencies.I am using nagios core.Here is the plugin i am trying to install 回答1: Because I had a similar problem at work I happened to write my personal Q&A on this topic. Here it is: Q: How to install CPAN modules without Internet access? A: 1. Install CPAN::Mini on the internet machine: $ cpan CPAN:

Nagios plugin to check files are created within x minutes

一世执手 提交于 2019-12-23 04:24:09
问题 I'm trying to convert a bash script to nagios plugin The script will run a find command to see if files are created within x minutes: #!/bin/bash # #Check NVR newfiles=$(find /srv/unifi-video/videos/* -name '*.ts' -mmin -10 | wc -l) if [[ $newfiles -eq 0 ]] ; then echo "!!!WARNING!!! The NVR has System stopped recording." fi I tried to convert that script to a Nagios plugin here: #!/bin/bash # #Check NVR #http://www.netchester.com #Check if NVR System is recording correctly newfiles=$(find

云监控中的告警

送分小仙女□ 提交于 2019-12-22 03:22:57
在云计算平台中,资源的监控和管理是确保平台可靠性非常重要的一环。不仅是为了能够在资源监控的基础上方便提出有效的管理方案,从而提升资源利用率,同时还能够确保在故障发生时能最及时的探测到并采取一种最为有效的方法解决它。 云监控 云监控指的是一种 针对网络、系统、应用等内容提供可用性、用户体验和安全性方面的监控服务。它的目的是保障 云计算 用户的业务稳定安全运行。当服务器发送故障时,及时的给网站管理人员发送邮件和短信报警。第一时间了解网站状态,将故障时间降低到最小。 云监控包含的范围有很多:首先就是对服务器本身的监控。监控的指标可以有多个,比如: CPU使用率 CPU负载 内存使用率 磁盘空间使用率 磁盘I/O 网络流量 系统进程数、进程CPU/内存/状态监控 服务监控 日志监控 其次是对web站点的性能进行监控,包括: 站点URL(HTTP)可用性和响应时间 UDP/TCP端口可用性和响应时间 POP3/SMTP/FTP端口可用性和响应时间 告警 告警部分是与监控一脉相承的。其目的就是为了在监控系统检测到故障发生时,以某种形式通知给用户。一般包括以下几个方面: 通过网页控制台获得告警 通过Email接收告警 通过手机短信接收告警 触发告警的形式有很多。对于服务器本身监控而言,一般是由于监控指标的数据达到了报警阈值。对于站点监控而言,一般是网站不可达会触发告警。 告警牵涉到的几个条件包括