nagios

开源系统监控工具Nagios、Zabbix和Open-Falcon的功能特性汇总及优缺点比较

别等时光非礼了梦想. 提交于 2020-04-27 20:42:18
Nagios Nagios 全名为(Nagios Ain’t Goona Insist on Saintood),最初项目名字是 NetSaint。它是一款免费的开源 IT 基础设施监控系统,其功能强大,灵活性强, 能有效监控 Windows 、Linux、VMware 和 Unix 主机状态,交换机、路由器等网络设置等。Nagios核心功能是监控报警,告警能力很不错,但是图形展示效果很差。 同时nagios更加灵活,很多功能都要通过插件化来实现,对于技术能力没那么强的同学,上手会有些困难。当然,对于运维老手,上手会很快。 Nagios 的功能特性如下: • 监控网络服务(SMTP、POP3、HTTP、NNTP、PING等); • 监控主机资源(处理器负荷、磁盘利用率等); • 简单地插件设计使得用户可以方便地扩展自己服务的检测方法; • 并行服务检查机制; • 具备定义网络分层结构的能力,用"parent"主机定义来表达网络主机间的关系,这种关系可被用来发现和明晰主机宕机或不可达状态; • 当服务或主机问题产生与解决时将告警发送给联系人(通过EMail、短信、用户定义方式); • 可以定义一些处理程序,使之能够在服务或者主机发生故障时起到预防作用; • 自动的日志滚动功能; • 可以支持并实现对主机的冗余监控; • 可选的WEB界面用于查看当前的网络状态、通知和故障历史

DevOps工程师技能

此生再无相见时 提交于 2020-04-27 10:18:48
技术背景 DevOps工程师必须持有计算机科学、工程或其他相关领域的学位。2年以上工作经验。这包括开发人员、系统管理员或devops驱动的团队成员的工作。这是一个重要的需求,同时也是对所有IT操作的理解。 自动化工具的经验 了解用于测试和部署的开源解决方案是DevOps工程师必须具备的知识。如果您使用的是云服务器,请确保您的候选人具有使用GitHub、Chef、Puppet、Jenkins、Ansible、Nagios和Docker等工具的经验。此职位的候选人还必须具有使用公共云(如Amazon AWS、Microsoft Azure和谷歌云)的经验。 编程技能。 工程师不仅要知道现成的工具,还要有编程经验,包括脚本和编码。脚本编制技能通常需要Bash或PowerShell脚本的知识,而编码技能可能包括Java、c#、c++、Python、PHP、Ruby等,或者至少是其中一些语言。 数据库系统知识。 在部署阶段,工程师处理数据处理,这需要有SQL或NoSQL数据库模型的经验。 沟通和人际交往能力 虽然一个好的候选人必须精通技术方面,但是DevOps专家必须有很强的沟通才能。他/她必须确保团队有效运作,接收和分享反馈以支持持续交付。结果——一个产品——取决于他/她与所有团队成员有效沟通的能力。 参考 https://www.altexsoft.com/blog

LDAP-openldap服务部署和测试(YUM安装)

跟風遠走 提交于 2020-04-26 14:49:21
1. 概述 2. 服务端部署过程 2.1 软件包说明 2.2 部署过程 2.3 配置过程 3. 测试 4. 生成LDIF格式文件 4.1 安装migrationtools工具 4.2 用migrationtools生成ldif文件 4.3 添加ldif到ldap数据库 5. 日志配置 5.1 openldap的日志级别 5.2 配置日志功能 6. 客户端配置 6.1 基础环境准备 6.2 配置nslcd客户端 7. 添加系统用户 7.1 添加用户 7.2 产生ldif文件 7.3 添加ldif文件至LDAP数据库中 7.4 验证 1. 概述 本篇博客主要记录如何部署一台LDAP服务器,用于在内网集群节点中,进行全局用户认证。 注:有关LDAP的理论部分,参见博客《LDAP协议详解.md》 本篇博客主要的部署环境为:CentOS6.5_x86_64部署openldap,通过YUM安装相关环境。 2. 服务端部署过程 2.1 软件包说明 软件包 软件包说明 openldap 服务端和客户端必须用的库文件 openldap-clients 在LDAP服务端使用,用户增删改查的命令行环境 openldap-servers 用于启动服务和配置,包括单独的LDAP后台守护进程 openldap-servers-sql 支持SQL模块 compat-openldap openldap兼容性库环境

智能运维中的关键一步——告警管理

╄→гoц情女王★ 提交于 2020-04-23 22:28:06
在复杂的运维工作中,如何将告警有效的管理是运维工作中关键而重要的一步,有效的告警管理可以将大大提高运维人员的工作效率;睿象云智能告警平台Cloud Alert(简称CA)快速接入各类事件,通过人工智能算法自动发现、诊断、修复IT系统运行事故,并能帮助企业形成最佳事件管理流程,让业务运行更加安全可靠;接下来就来详细的说下吧~ ● 支持多平台应用 一体化 管理 用户可以将多个监控平台接入到CA当中进行统一管理,目前支持的平台有 Zabbix 、Prometheus、 Nagios 、Open-Falcon、AWS、阿里云、 Cacti 、solarwinds、睿象云、监控宝、Grafana 、Vmware、Site24x7、如果上述都没有支持你的监控系统,那还可以用通用集成Rest API和邮箱集成 ● 通知协作 用户可以指定告警以特定的方式通知到接收告警的人 - 自定义分派 用户可以在分派策略中添加筛选条件,将指定的告警分派给指定的人,也可以分派给钉钉、值班人员、小组;并且可以添加分派升级策略,当告警指定时间内未被认领或关闭时,会通知到第二负责人。 - 多样化通知方式 用户可以根据告警不同的状态、不同的时间、不同的级别,以不同的方式,通知到指定的人,目前支持的通知方式有电话、 短信 告警 、微信、邮件、APP。用户也可也选择是否延迟通知。 ● 智能降噪 - 告警的压缩与降噪(事中)

Linux监控系统之Nagios

怎甘沉沦 提交于 2020-04-07 00:03:21
Linux监控系统之Nagios Nagios工作原理 Nagios的功能是监控服务和主机,但是其自身并不包括这部分功能,所有的监控、检测功能都是听过各种插件去完成的。在启动Nagios后,它会周期性地去自动调用插件去检测服务器状态,同时Nagios会维持一个队列,所有插件返回的状态信息都进入队列,Nagios每次都会将从队首读取信息,进行处理后,再将状态结果通过web显示出来。 Nagios模式 被动模式:就如同上图所显示的那样,客户端起nrpe进程,服务端通过check_nrpe插件向客户端发送命令,客户端根据服务端的指示来调用相应的插件,插件可以获取到本机的相关信息,并把获取到的结果发送给服务端。因为需要调用客户端的插件去等带客户端返回的信息,所以叫做被动模式 主动模式:主动模式不需要调用客户端的插件,而是通过自己的插件主动去探测客户端的相关信息。 那么,因为主动模式和被动模式的区别这两种模式所擅长监控的服务也是不同的。 Nagios功能 监控网络服务(SMTP、POP3、HTTP、NNTP、PING等); 监控主机资源(处理器负荷、磁盘利用率等); 简单地插件设计使得用户可以方便地扩展自己服务的检测方法; 并行服务检查机制; 具备定义网络分层结构的能力,用"parent"主机定义来表达网络主机间的关系,这种关系可被用来发现和明晰主机宕机或不可达状态;

一个人想着一个人 提交于 2020-04-06 18:35:04
一. mysql安装和基本操作 1.安装mysql包5.7版本(不能于mariadb共存)默认端口3306 yum -y install perl-Data-Dumper perl-JSON perl-Time-HiRes(依赖包) 再安装mysql包(官网下载) 2.启服务,开机自启mysqld 3.查看服务: systemctl status mysqld 查看服务状态 netstat -antpu | grep mysql 查看服务端口 ps -C mysqld 查进程 ps aux | grep -i mysqld 查看进程所有者 4.本地登入数据库; 初次登陆需手动查看mysql随机密码 grep 'temporary password' /var/log/mysqld.log 用该密码登录到服务端后,必须马上修改密码,不然会报错; 修改密码前先修改密码规则: mysql>set global validate_password_policy=0; (关闭密码策略) mysql<set global validate_password_length=6; (修改密码长度) 以上修改为临时修改,永久生效要修改配置文件/etc/my.cnf [mysqld](手动添加) validate_password_policy=0 validate_password_length=6

Nagios 安装及微信短信提醒

孤街浪徒 提交于 2020-03-29 22:48:24
引言 Nagios 作为业界非常强大的一款开源监视系统。 监控网络服务(SMTP、POP3、HTTP、NNTP、PING 等); 监控主机资源(处理器负荷、磁盘利用率等); 简单地插件设计使得用户可以方便地扩展自己服务的检测方法;这一点是 Nagios‘er 们非常喜欢的。 当服务或主机问题产生与解决时将告警发送给联系人(通过 EMail、短信、用户定义方式);需要配套的邮件服务器和短信网关对接。 另外还支持 Cacti 、 Ganglia、OpenTSDB 告警接入,强大的 Nagios 还有什么做不到的?作为一个告警平台,Nagios 已经是很强大了,然而在通知方面,特别是微信、短信、电话提醒通知方面还是短板,下面以目前最新版Nagios4.0.8+OneAlert 实现监控和微信提醒。 安装说明 如果你从来没有接触过 Nagios,请按照以下步骤安装 Nagios,如果你对 Nagios 非常熟悉或者机器中有 Nagios,请跳过安装步骤,直接进入 OneAlert 的报警设置。 也可以参考 Nagios 官网 。 Nagios 服务器: 10.128.6.38 CentOS 6.5 64bit 被监控机器: 10.128.14.102 CentOS 6.7 64bit 安装 Nagios 和 Nagios 插件(安装过程中标红的操作为安装 Apache,方便我们后面的调试

监控平台cacti+nagios集成短信平台

浪尽此生 提交于 2020-03-25 01:06:56
3 月,跳不动了?>>> 这几天运维的同事提了一个需求:生产的监控平台cacti+nagios目前通过网络上流行的飞信接口对接,当服务器有问题,会及时发送短信通知。但是用飞信发短信很不稳定,几乎每天都需要换校验码才行。于是提出将 nagios监控报警发送短信 接入公司自己的短信平台。 简单说下思路:1、原飞信都是在 commands.cfg配置shell脚本执行的,我们可以沿用原来的消息格式; 2、短信平台可以开放一个URL调用接口,通过shell调用; 3、Linux中有curl指令,可以通过其使用post方式调用短信平台的Servlet; 4、于是,说干就干。。。。。 1、修改/usr/local/nagios/etc/objects/commands.cfg文件 ################ ##### #####fetion ##### ##### ###########a##### define command{ command_name host-notify-by-fx command_line curl -d "orgid=0001&userid=test&msg=Host $HOSTSTATE$ alert for $HOSTNAME$! on $LONGDATETIME$&telno=$CONTACTPAGER$" http://127.0.0.1:8080

nagios微信报警配置

自作多情 提交于 2020-03-19 12:54:15
==nagios微信报警系统添加流程== 1.编写微信报警脚本 2.编辑/usr/local/nagios/etc/objects/templates.cfg 添加报警源: define service { service_description   generic-zzcbj name    generic-zzcbj contacts    zzcbj check_period    24x7 notification_period    24x7 max_check_attempts    1 check_interval    3 retry_interval    1 notification_interval    5 notification_options    w,u,c,r,f first_notification_delay    0 register    0 active_checks_enabled    1 passive_checks_enabled    1 notifications_enabled    1 } 3.编辑/usr/local/nagios/etc/objects/contacts.cfg 添加报警选项: define contact { contact_name    zzcbj alias    zzcbj email  

nagios检控硬盘健康状态

可紊 提交于 2020-03-19 08:01:35
简单脚本实现: #!/bin/bash DEVICES="sda sdb" #有几块硬盘就写几块 SMARTCTL=/usr/sbin/smartctl SMART_TMP_FILE="/opt/nagios/tmp/.smart" for DEV in $DEVICES do REL=`sudo $SMARTCTL -H /dev/$DEV |egrep -i '(Health status|test result)' |awk -F: '{print $2}' |awk '{print $1}'` echo -n "${DEV}:${REL} " >> $SMART_TMP_FILE done >> /tmp/eeee.log 2>&1 egrep -i '(FAILED|err)' $SMART_TMP_FILE RETVAL=$? if [ $RETVAL -ne 0 ] then echo "OK - `cat $SMART_TMP_FILE`" rm -f $SMART_TMP_FILE exit 0 else echo "CRITICAL - `cat $SMART_TMP_FILE`" rm -f $SMART_TMP_FILE exit 2 fi 脚本很简单,不过要执行起来不容易,root用户执行此脚本,测试一切没问题,可是用nagios用户运行问题就来了