nagios

2.监控系统-Nagios(难够死)

假装没事ソ 提交于 2019-12-04 18:39:43
什么是Nagios? Nagios是一款开源的网络及服务的监控工具,功能强大,灵活性强,需要注意的是,其服务端只能在linux上面安装。 Nagios可以进行分布式监控。 这里主要解释一下什么叫分布式?什么是集群?什么是分布式计算? 分布式:不同的业务模块部署在不同的服务器上或者同一个业务模块分拆多个子业务,部署在不同的服务器上,解决高并发的问题。 集群:同一个业务部署在多台机器上,提高系统可用性。 所谓分布式计算是一门计算机科学,它研究如何把一个需要非常巨大的计算能力才能解决的问题分成许多小的部分,然后把这些部分分配给许多计算机进行处理,最后把这些计算结果综合起来得到最终的结果。 打个比方,一个任务由5个子任务组成,暂且五个子任务都是独立的,异步的。一个子任务如果需要1个小时完成,那么我只需要将5个子任务分配到5个机器上,那么就是一小时完成了这个任务,这就是分布式,解决的是高并发。 那么集群,就是将一群机器集合起来,完成一个任务。如果一个任务的机器跨了,可以通过其他机器替代,讲究的是可用性。 在网上看到,现在讲的各种云计算,说白了就是集群和分布式的一些应用。 分布式是指将不同的业务分布在不同的地方。 而集群指的是将几台服务器集中在一起,实现同一业务。分布式中的每一个节点,都可以做集群。 而集群并不一定就是分布式的。(也可以是分布式,比如你布置多个集群咯!) 举个例子:

Centos 6.2 nagios监控服务器集群 系列之PNP集成篇

五迷三道 提交于 2019-12-04 17:34:04
本来这个应该是最后写的,但是今天刚配置好了,所以今天先写这个了....至于监控windows和linux的部分,稍后.... 这个pnp可算是把我折磨的不轻啊..... 总算,从网上的教程+回复中终于搞定了.... 主要参考网址:http://allanfan.blog.51cto.com/520839/684169 首先安装rrdtool yum install rrdtool 安装完成后下载pnp进行安装,这个地方最好也安装下php perlyum安装即可 wget http://sourceforge.net/projects/pnp4nagios/files/PNP-0.6/pnp4nagios-0.6.15.tar.gz/download tar zxvf pnp4nagios-0.6.15.tar.gz 然后编译 ./configure 此处报错: yum install perl-Time-HiRes 解决缺少软件问题 再次编译 成功! make&&make install 完成后:根据提示进行如下操作 make install-config make install-init make install-webconf 然后 然后把相关后缀带sample文件变更成无sample后缀 cd /usr/local/pnp4nagios/etc/ mv

在LAMP环境上安装nagios服务

六月ゝ 毕业季﹏ 提交于 2019-12-04 13:20:38
在LAMP环境上安装nagios服务 Nagios : 是一款开源的免费网络监视工具,能有效监控Windows、Linux和Unix的主机状态,交换机路由器等网络设置,打印机等。在系统或服务状态异常时发出邮件或短信报警第一时间通知网站运维人员,在状态恢复后发出正常的邮件或短信通知。 Nagios可运行在Linux/Unix平台之上,同时提供一个可选的基于浏览器的WEB界面以方便系统管理人员查看网络状态,各种系统问题,以及日志,性能图表等等。 下面是我在 LAMP 环境上搭建 nagios 监视工具,因为 LAMP 环境我之前已经搭建好了,也做了相关的笔记,有需要的话可以参看: http://www.wdlinux.cn/bbs/thread-3193-1-1.html 如果为了操作简单、方便、稳定、安全,可以用 lamp 一键安装包安装 lamp 环境, 可以 到这个论坛 http://www.wdlinux.cn/bbs/forum-5-1.html 下载一键安装包。 1 、安装 nagios 下载源码包 [root@wdOS ~]# cd /usr/local/src wget -c http://nchc.dl.sourceforge.net/project/nagios/nagios-3.x/nagios-3.0.5/nagios-3.0.5.tar.gz [root

PostgresQL Automating VACUUM FULL for bloated tables

牧云@^-^@ 提交于 2019-12-04 11:34:01
问题 We have a product using PostgreSQL database server that is deployed at a couple of hundred clients. Some of them have gathered tens of gigabytes of data over the years. So in the next version we will introduce automated cleanup procedures which will gradually archive and DELETE old records during nightly batch jobs. If I understand correctly, autovacuum will kick in and analyze and reorganize the tuples, so the performance will be like it was when fewer records existed. The actual disk space

How to set downtime for any specific nagios host for certain time from commandline through curl?

为君一笑 提交于 2019-12-04 08:41:06
I need to set a schedule downtime for specific nagios host from the commandline by curl..how do I do that? here is something I am already using for service/host notification enable/disable from commandline. curl -d "some input here" url "user:pass" Like way I need to do the thing for schedule downtime.Now the problem is that downtime option takes more options i.e starttime,endtime,comment etc. So how do I get it done by curl from the commandline? curl -d " some key value pair(hostname,servicename" url "username:passowrd" which will do the service/host notification on and off from the

k8s yaml文件详解

有些话、适合烂在心里 提交于 2019-12-04 05:53:47
apiVersion: extensions/v1beta1 kind: Deployment metadata: name: nagios2 labels: app: nagios2 spec: replicas: 3 selector: matchLabels: app: nagios2 template: metadata: labels: app: nagios2 spec: containers: - name: nagios2 image: docker.io/jasonrivers/nagios ports: - containerPort: 80 volumeMounts: - mountPath: /opt/nagios/etc/ name: etc - mountPath: /opt/nagios/var/ name: var - mountPath: /opt/Custom-Nagios-Plugins name: plugins - mountPath: /opt/nagiosgraph/var name: nagiosgraph - mountPath: /opt/nagiosgraph/etc name: nagiosetc volumes: - name: etc hostPath: path: /data/nagios/etc type:

How to print out Nagios Service UP Time Percentage from Nagios-Report Perl Module

前提是你 提交于 2019-12-04 05:24:16
I can print out Host UP Time percentage from Nagios-Report Perl Module with following code: #!/usr/bin/perl use strict ; use Nagios::Report ; my $x = Nagios::Report->new(q<local_cgi localhost nagiosadmin>) or die "Can't construct Nagios::Report object." ; $x->mkreport( [ qw(HOST_NAME PERCENT_TOTAL_TIME_UP) ], sub { my %F = @_; my $u = $F{PERCENT_TOTAL_TIME_UP}; $u =~ s/%//; }, 0, sub { my $F = shift @_ ; } ) ; $x->debug_dump ; But How can I only print out Service UP Time Percentage? I mean only output the percentage value. I tried many options but couldn't get it right. This will produce

资源汇集:跟着ttlsa学习zabbix监控

|▌冷眼眸甩不掉的悲伤 提交于 2019-12-03 18:43:26
从2009年开始接触zabbix,当时版本在1.8,经过差不多5年的时间,zabbix历经2.0,2.1,2.2数个版本,虽然大多数功能保持不变,但是还是有非常明显的改变。 Zabbix VS Nagios指数 我们来看看zabbix的发展趋势,打开http://index.baidu.com/?tpl=trend&word=zabbix,可以看到这个月的日平均指数在258,整体同比增长928%,环比增长10%。 nagios 月平均指数在308,同比增长13%,环比24%,可以看出zabbix虽然不及nagios的指数高,但是按这个趋势,大有超过nagios之势。 以上是2014年3月份写的,现在zabbix百度指数600多,nagios百度指数500多,如我所言,已经超过他了。 Zabbix VS Nagios岗位需求 来观察下zabbix和nagios的岗位需求数,在51job上搜索zabbix相关的岗位,共计有272个,nagios共计668. 目录 zabbix简介 (1) zabbix特性 (2) zabbix进程构成 (3) zabbix硬件、软件需求 (4) zabbix安装 (5) zabbix数据库需要多大硬盘?我告诉你 (6) zabbix升级版本过程(7) zabbix汉化方法(8) zabbix用户管理(9) zabbix监控第一台服务器(10)

nagios/passive_check

给你一囗甜甜゛ 提交于 2019-12-03 10:45:44
术语 被监控机(MC:Monitor Client) 监控机 (MS:Monitor Server) 被动模式工作原理: 在被 MC 上面,使用nagios-plugins提供的插件,得出监数据,将数据发送到 MS 端,MS上面运行的daemon(常见的是nsca,或 nrdp,mod_gearman )用来接收这些数据,按照预定义的格式传递给nagios,nagios核心进程将会对数据进行处理(前台展示,警报)。 nsca 插件采用的是将检测结果写入外部命令文件,该文件是一个管道文件,也是nagios主程序的一个接口(用来接收监控数据),(ubuntu14.04 nagios 默认配置是 “/var/lib/nagios3/rw/nagios.cmd”); nrdp 插件除了将检测结果写入外部命令文件,还可以将检测结果直接写入到Nagios内核的spool目录,(ubuntu14.04 nagios 默认配置是 “/var/lib/nagios3/spool/checkresults”); mod_gearman 使用事件代理模式,会将结果注入nagios结果环形缓冲区数据结构中,不会被FIFO的IO限制 原理图 优缺点 优点:相比与主动模式,被动模式能很大程度地降低nagios负载 缺点:当监控的主机规模进一步扩大,会被"外部命令文件"I/O局限所拖累,(事件代理模式除外)

Nagios - Could not open command file /usr/local/nagios/var/rw/nagios.cmd’ for update

匿名 (未验证) 提交于 2019-12-03 08:54:24
可以将文章内容翻译成中文,广告屏蔽插件可能会导致该功能失效(如失效,请关闭广告屏蔽插件后再试): 问题: I'm trying to disable active check for a service through Nagios web interface, but I cant make it. The Nagios instance is running on a Centos 5 distribution Each time I try to stop the service I get this message : Could not open command file ‘/usr/local/nagios/var/rw/nagios.cmd’ for update! Although I tried several proposals found on the web : usermod -a -G nagios apache chmod 666 /usr/local/nagios/var/rw/nagios.cmd chown nagios.nagcmd /usr/local/nagios/var/rw chmod u+rwx /usr/local/nagios/var/rw chmod g+rwx /usr/local/nagios/var/rw chmod g