nagios

开源网管工具 Cacti,Nagios,Zabbix 比较

我只是一个虾纸丫 提交于 2019-12-21 13:16:48
首先 Cacti 是一个用 rrdtool 来画图的网络监控系统, 通常一说到网络管理, 大家首先想到的经常是 mrtg, 但是 mrtg 画的图比较简单而且且难看, rrdtool 虽然画图本领一流, 画出来的图也漂亮, 但是毕竟是一个画图工具, 不像 mrtg 那样本身还集成了数据收集功能. Cacti 则是集成了各种数据收集功能,然后用 rrdtool 画出监控图形. 其本身界面比起同类系统要漂亮不少. 推荐所有有监控需求的人都去研究一下。 Cacti 和 Nagios 是不同功用的系统, Nagios 适合监视大量服务器计算环境,重点并不在于图形化的监控, 其集成了很多功能,例如报警,都是 cacti 没有或者很弱的. Cacti 主要用途还是用来收集历史数据和画图, 所以界面比 Nagios 漂亮很多. Nagios和Cacit都是比较老牌的开源网管软件;OpenNMS是稍微点出现的项目,它集成了前两者的部分优点,界面是Java的界面,后台的自动发现机制非常的方便。Zenoss是一个比较年轻的项目,所谓长江后浪推前浪,它是纯python语言编写的一个软件,架构非常的不错,而其界面做的非常好,面向对象编程的理念处处可见。从根上可以看出它们的主要编程语言各有不同,这也决定了它们的特点和发展方向的不同. Nagios Core下载:http://www

自动化监控利器-Zabbix

我与影子孤独终老i 提交于 2019-12-21 09:11:39
转自: http://www.xuliangwei.com/xubusi/117.html 1.1为何需要监控系统 在一个IT环境中会存在各种各样的设备,例如:硬件设备、软件设备、其系统的构成也是非常复杂的。 多种应用构成负载的IT业务系统,保证这些资源的正常运转,是一个公司IT部门的职责。而要让这些应用能够稳定地运行,则需要专业IT人员进行设计、架构、维护和调优。在这个过程中, 为了及时掌握基础环境和业务应用系统的可用性,需要获取各个组件的运行状态,如 CPU 的利用率、系统的复制、服务的运行、端口的连通、带宽流量、网站访问状态码等信息。而这一切都离不开监控系统。 1.2监控系统的实现 一个监控系统的组成大体可以分为两部分:数据采集部分(客户端)和数据存储分析告警展示部分(服务器端),这两部分构成了监控系统的基本模型。 数据采集的工作模式可以分为被动模式(服务端到客户端采集数据)和主动模式(客户端主动上报数据到服务器端)。通常,大多数监控系统应该能同时支持这两种模式。被动模式对服务器的开销较大,适合小规模的监控环境:主动模式对服务器的开销较小,适合大规模的监控环境。 采集数据的协议方式可以分为两种:专用客户端采集和共用协议采集(SNMP、SSH、Telnet等) 对于采集到的监控数据,可以将其存储到数据库或者文本或者其他方式,具体采用哪一种,应根据实际需求来决定。 1.3

CentOS 安装nagios

Deadly 提交于 2019-12-20 10:59:22
Nagios的介绍: 1、Nagios是一个监控系统运行状态和网络信息的监控系统。它能监控所指定的本地或远程主机的系统状态以及运行的服务,同时提供异常通知的功能。 2、 Nagios可运行在Linux/Unix平台之上,同时提供一个可选的基于浏览器的WEB界面以方便系统管理人员查看网络状态,各种系统问题,以及日志,性能图表等等。 Nagios的功能: 1、 监视网络服务 (mysql,http,ping等) 2、 监视主机资源 (进程, 磁盘 等) 3、 简单的插件扩展功能 4、 异常通知功能 (通过email,短信等) 5、 WEB界面使系统管理人员能够随时查看网络服务状态,系统问题等等 6、 可以通过手机查看系统监控信息 Nagios的安装:   一:安装前的准备     1:安装环境:  centos操作系统     2:所需软件: nagios-3.0.3.tar.gz //nagios程序安装包             httpd-2.2.2.tar.gz //apache安装包             nagios-plugins-1.4.tar.gz //nagios插件安装包             nrpe-2.12.tar.gz //nagios的扩展,它安装在被监控的服务器上,向nagios提供该服务器的运行情况。 二:nagios安装     1

ubuntu下nagios配置

风流意气都作罢 提交于 2019-12-20 09:07:23
参考文献: http://www.cnblogs.com/mchina/archive/2013/02/20/2883404.html http://my.oschina.net/duangr/blog/183160 声明 本文是我参照上述两篇参考文献做nagios配置的一个记录,当中的理论部分内容大多数拷贝自上述两篇文章。如果想看详细内容,可以参考上述两篇文章。 一、Nagios简介   Nagios是一款开源的电脑系统和网络监视工具,能有效监控Windows、Linux和Unix的主机状态,交换机路由器等网络设置,打印机等。在系统或服务状态异常时发出邮件或短信报警第一时间通知网站运维人员,在状态恢复后发出正常的邮件或短信通知。   Nagios原名为NetSaint,由Ethan Galstad开发并维护至今。NAGIOS是一个缩写形式: "Nagios Ain't Gonna Insist On Sainthood" Sainthood 翻译为圣徒,而"Agios"是"saint"的希腊表示方法。Nagios被开发在Linux下使用,但在Unix下也工作得非常好。 主要功能 网络服务监控(SMTP、POP3、HTTP、NNTP、ICMP、SNMP、FTP、SSH) 主机资源监控(CPU load、disk usage、system logs),也包括Windows主机(使用

快速搭建ELK日志分析系统

跟風遠走 提交于 2019-12-20 07:20:24
原文 https://www.cnblogs.com/yuhuLin/p/7018858.html 一、ELK搭建篇 官网地址:https://www.elastic.co/cn/ 官网权威指南:https://www.elastic.co/guide/cn/elasticsearch/guide/current/index.html 安装指南:https://www.elastic.co/guide/en/elasticsearch/reference/5.x/rpm.html ELK是Elasticsearch、Logstash、Kibana的简称,这三者是核心套件,但并非全部。 Elasticsearch是实时全文搜索和分析引擎,提供搜集、分析、存储数据三大功能;是一套开放REST和JAVA API等结构提供高效搜索功能,可扩展的分布式系统。它构建于Apache Lucene搜索引擎库之上。 Logstash是一个用来搜集、分析、过滤日志的工具。它支持几乎任何类型的日志,包括系统日志、错误日志和自定义应用程序日志。它可以从许多来源接收日志,这些来源包括 syslog、消息传递(例如 RabbitMQ)和JMX,它能够以多种方式输出数据,包括电子邮件、websockets和Elasticsearch。 Kibana是一个基于Web的图形界面,用于搜索、分析和可视化存储在

Unable to capture changes to log file via nagios check_logwarn plugin command invoked via PHP exec() triggered via Jenkins

空扰寡人 提交于 2019-12-19 23:29:06
问题 I am using nagios check_logwarn to capture changes to log files. In order to test my setup, I have been manually adding the following log line to the concerned log file - [Mon Mar 20 14:24:31 2017] [hphp] [12082:7f238d3ff700:32:000001] [] \nFatal error: entire web request took longer than 10 seconds and timed out in /var/cake_1.2.0.6311-beta app/webroot/openx/www/delivery/postGetAd.php on line 483 The above should get caught by the following nagios command, because it contains the keyword

nagios 新增磁盘监控

廉价感情. 提交于 2019-12-18 11:44:26
1 进入对应需要监控磁盘的服务器 cd /usr/local/nagios/etc vi nrpe.cfg 2 加上下面这句话 因为我要监控的 是vdc 不知道改成什么可以 查看 df -h command[check_vdc]=/usr/local/nagios/libexec/check_disk -w 14% -c 10% -p /dev/vdc 3 输入 “ps -ef | grep nrpe”命令查找出nagios的进程id 4.输入“ kill -9 8516”命令杀掉进程,8516就是进程id 5 .重启nrpe /usr/local/nagios/bin/nrpe -c /usr/local/nagios/etc/nrpe.cfg -d 6 进入主监控服务器messi服务器 7 cd /usr/local/nagios/etc/objects 8 修改对应配置文件 vi 101.201.80.50 9 加上下面这句话 保存退出 define service{ use generic-service host_name online_server service_description desk_vdc check_command check_nrpe!check_vdc max_check_attempts 5 normal_check_interval 300

Getting the Limit of AWS Accounts using BOTO3

二次信任 提交于 2019-12-18 09:44:44
问题 I need to monitor my infrastructure on AWS. For this, I am writing boto3 functions to know the limits of my account. However, I am not able to achieve the following things: Limit of EBS Volumes (Not able to find any method from where I can know the max number of Volumes I can create) Limit of total Number of Security Groups Limit of Security rules per Security group Max number of Elastic IPs. Since I have different AWS accounts and limits vary for each of these accounts. I need to take it

New Nagios BASH plugin output error: “Such Instance currently exists at this OID: integer expression expected”

冷暖自知 提交于 2019-12-14 04:08:58
问题 I'm trying to write my first Nagios plugin to check the statuses on WLAN Controllers APs. The goal was to make a kind of "universal" plugin but I'm getting an error: .1.3.6.1.4.1.14179.2.2.1.1.3.0.: Unknown Object Identifier () /usr/lib/nagios/plugins/check_wlc_ap_state.sh: line 50: [: Such Instance currently exists at this OID: integer expression expected /usr/lib/nagios/plugins/check_wlc_ap_state.sh: line 53: [: Such Instance currently exists at this OID: integer expression expected /usr

Best way to make argument parser accept absolute number and percentage?

試著忘記壹切 提交于 2019-12-13 22:33:26
问题 I am trying to write a Nagios style check to use with Nagios. I have working script that takes in something like -w 15 -c 10 and interprets that as "Warning at 15%, Critical at 10%". But I just realized that in the built-in Nagios plugins, the same arguments would mean "Warning at 15MB, Critical at 10MB"; I would instead need to enter -w 15% -c 10% to get the above behavior. So my question is, what is the best way to make my script behave like the built-in Nagios scripts? The only way I can