zabbix

Zabbix监控平台的搭建

旧城冷巷雨未停 提交于 2021-01-01 08:34:13
目录 1.Linux监控平台介绍 2.zabbix监控介绍 3.安装zabbix 4.忘记admin密码如何做 5.主动模式和被动模式 6.添加主机 7.添加自定义模板 8.处理图形中的乱码 9.自动发现 10.添加自定义监控项目 11.配置邮件告警 12.测试告警 扩展 1.Linux监控平台介绍 常见的开源监控软件: cacti、nagios(不需要mysql的支持)、zabbix(最流行,配置简单)、smokeping(监控网络设备)、open-falcon等等 cacti、smokeping偏向于基础监控,成图非常漂亮(需要mysql的支持);cacti、nagios、zabbix服务端监控中心,需要php环境支持,其中zabbix和cacti都需要mysql作为数据存储,nagios不用存储历史数据,注重服务或者监控项的状态,zabbix会获取服务或者监控项目的数据,会把数据记录到数据库里,从而可以成图 open-falcon为小米公司开发,开源后受到诸多大公司和运维工程师的追捧,适合大企业,滴滴、360、新浪微博、京东等大公司在使用这款监控软件,值得研究。 zabbix支持web界面。 2.zabbix监控介绍 C/S架构,基于C++开发,监控中心支持web界面配置和管理 单server节点可以支持上万台客户端 最新版本3.4, 官方文档 5个组件 zabbix

zabbix--自动注册

允我心安 提交于 2020-12-30 09:01:56
Active agent自动注册 agent 自动注册就是实现一台新的服务器配置好 agent 端,自动在服务器端注册,无需在服务器上进行手动配置便可以直接启动对新的host的监控。 参考官档: https://www.zabbix.com/documentation/4.0/zh/manual/discovery/auto_registration 具体步骤: agent 端 ,首先在 agent 端安装zabbix-agent ,然后配置server端地址、agent端主机名等 # vim /etc/zabbix/ zabbix_agentd.conf Server = 120.79 .xx.xx ServerActive = 120.79 .xx.xx: 10051 Hostname = courtoap.net HostMetadataItem =system. uname # service zabbix -agent start Web界面配置 进入:配置 -> 动作 -> 右上角选择自动注册 -> 创建动作 触发条件:主机元数据 -> 包含 -> Linux 操作一:与模板关联 -> 关联一个模板(这个模板可以是自己创建的,或者使用默认的Linux那个模板) 操作二:发送消息 -> 发送给指定的用户或者群组 说明:页面操作是主机元数据的值, uname可以查看到系统

Zabbix自动发现与自动注册.

早过忘川 提交于 2020-12-30 07:59:33
一, 自动发现与自动注册   自动发现? 当场景中出现要添加很多台主机的时候,一台台添加难免太过于繁琐,zabbix提供自动注册,自动发现,可以实现主机的批量添加,    zabbix的发现包括三种类型: # 自动网络发现 (Network discovery) # 主动客户端自动注册,(Active agent auto-registration) # 低级别发现(low-level discovery) 1.1 zabbix自动网络发现   zabbix 提供非常有力和灵活的自动网络发现功能,通过网络发现,可以实现加速zabbix部署,简化管理,在不断变化的环境中使用zabbix而不需要过多的管理   zabbix 网络发现机遇以下信息: IP段自动发现 可用的外部服务(FTP,SSH,WEB,POP3,IMAP,TCP等) 从zabbix客户端接收到的信息 从SNMP客户端接收到的信息   (1) 自动发现的原理     网络发现由两个步骤组成: 发现和动作(action)     zabbix周期性地扫描在网络发现规则中定义的IP段,根据每一个规则配置自身的检查频率,每一个规则都定义了一个对指定IP段的服务检查集合.     动作是对发现的主机进程相关的设置过程, 常用的动作有添加,或删除主机,启用或停用主机,添加主机到某一个组中,发现通知等等.   (2)

zabbix 自动发现/zabbix自动发现规则

心不动则不痛 提交于 2020-12-29 13:24:55
zabbix通过自动发现规则,根据脚本自动动态的定义监控的key,再根据key获取值 discovery.py动态获取key # !/usr/bin/env python import json import sys def get_ip(): a = { " data " :[ { " {#IP} " : " 127.0.0.4 " }, { " {#IP} " : " 127.0.0.5 " }, { " {#IP} " : " 127.0.0.6 " } ] } print json.dumps(a,sort_keys=True, indent=2 ) get_ip() 脚本模拟动态获取访问最多的ip,并通过zabbix自动发现把ip作为key。这个脚本数出来的格式必须是json格式,用于zabbix去识别发现,而且里面的键要是data。 # !/usr/bin/env python import sys a ={ " 127.0.0.4 " :1, " 127.0.0.5 " :2, " 127.0.0.6 " :3 } ip =sys.argv[1 ] print a[ip] 此脚本模拟根据key获取value 配置zabbix的配置文件 UserParameter=discovery_gsd_ip_num,/opt/script/ discovery.py

Linux运维岗位有哪些?具体工作是什么?

微笑、不失礼 提交于 2020-12-29 07:33:51
  Linux是操作系统之一,也是现在大多数企业都比较喜欢使用的系统,可以从事的岗位有很多,为就业者提供广阔的发展空间。那么Linux相关岗位有哪些?具体工作内容是什么?   1、Linux运维工程师   一般从企业入门到中级Linux运维工程师的工作大致有:挑选IDC机房及带宽、购买物理服务器或云服务、购买及使用CDN服务、搭建部署程序开发及用户的访问系统环境、对数据进行备份及恢复、处理网站运行中的各种故障、对网站的故障进行监控、解决网站运行的潜在安全问题、开发自动化脚本程序提高工作效率、规划网站架构、程序发布流程和规范,制定运维工作制度和规范、配合开发人员部署及调试产品研发需要的测试环境、代码发布等工作需求,公司如果较小可能还会兼职网管、网络工程师、数据库管理员、安全工程师、技术支持等职责。   2、Linux运维架构师   1)自动化代码上线(SVN/GIT+Jenkins+MVN)解决方案;2)云计算部署架构及Docker微服务架构方案;3)服务自动化扩容方案(KVM/OpenStack/Docker+Ansible+Zabbix);4)10万并发的网站架构、秒杀系统的架构及解决发你个案;5)多IDC机房互联方案、全网数据备份解决方案、账号统一认证方案;6)数据库、存储及各重要服务节点的集群和高可用方案;7)各网络服务的极端优化方案、服务解耦/拆分;8)运维流程、制度

zabbix—自动发现端口并监控

梦想与她 提交于 2020-12-29 03:00:11
自动批量检查agent开放的端口 PS:如果服务器上的应用都是固定的,不会随机产生的都可以使用自动发现端口来监控;    如果服务器会随机出现端口且每次启动程序都会改变,可以采用第二种方法,来监控指定的端口 约定 zabbix所有执行的脚本统一放置在 /etc/zabbix/ scripts 目录下 #cd /etc/zabbix/ #mkdir scripts #chown root:zabbix -R /etc/zabbix/scripts/ #chmod 755 /etc/zabbix/scripts/ zabbix-agent操作 1、脚本内容 scripts]# vim discovery.sh # !/bin/ bash portarray =(`netstat -tnlp|egrep -i " $1 " |awk { ' print $4 ' }|awk -F ' : ' ' {if ($NF~/^[0-9]*$/) print $NF} ' |sort| uniq`) length = ${#portarray[@]} printf " {\n " printf ' \t '" \"data\":[ " for ((i= 0 ;i<$length;i++ )) do printf ' \n\t\t{ ' printf " \"{#TCP_PORT}\":\"$

Zabbix实现自动发现端口并监控

谁说我不能喝 提交于 2020-12-29 02:31:58
转自天宇骑士博客随笔,表示感谢 # vim discovertcpport.sh #!/bin/bash port_array=(`netstat -tnlp|egrep -i "$1"|awk {'print $4'}|awk -F':' '{if ($NF~/^[0-9]*$/) print $NF}'|sort |uniq 2>/dev/null`) length=${#port_array[@]} printf "{\n" printf '\t'"\"data\":[" for ((i=0;i<$length;i++)) do printf '\n\t\t{' printf "\"{ #TCP_PORT }\":\"${port_array[$i]}\"}" if [ $i -lt $[$length-1] ];then printf ',' fi done printf "\n\t]\n" printf "}\n" 2、 客户端增加discovery的key UserParameter=tcpportlisten[*],/usr/local/zabbix_agent/sbin/discovertcpport.sh "$1" 我实验环境是zabbix 3.0 在tcpportlisten后面必须加上[*],否则会显示Item does not allow

zabbix 端口自动发现

我的梦境 提交于 2020-12-29 02:01:35
比较实用针对基础服务运行状态检测,自动端口发现加入监控与告警,稍作修改 脚本 python port_discover.py #!/usr/bin/python # -*- coding: utf-8 -*- # 使用python2 commands模块 import re import commands import json DROP_LIST = ['22','25','111'] # 排除端口 def filterList(): DROP_str = "|".join(DROP_LIST) CMD="sudo netstat -pntl | awk '{print $4,$7}'|grep [0-9] |egrep -vw '%s'" % (DROP_str) Result_Str = commands.getoutput(CMD) #print (Result_Str) tmp_list = Result_Str.split("\n") #每行加入列表 new_dict = {} for line in tmp_list: # print (line) PORT_REG = re.search(r"(127.0.0.1:|:::|0.0.0.0:)(\d+).+\d+/(\S+)",line) if PORT_REG is not None: match_line =

keepalived高可用简介与配置

早过忘川 提交于 2020-12-27 00:26:22
##keepalived简介 ###keepalived介绍 Keepalived 软件起初是专为LVS负载均衡软件设计的,用来管理并监控LVS集群系统中各个服务节点的状态,后来又加入了可以实现高可用的VRRP功能。因此,Keepalived除了能够管理LVS软件外,还可以作为其他服务(例如:Nginx、Haproxy、MySQL等)的高可用解决方案软件。 Keepalived软件主要是通过VRRP协议实现高可用功能的。VRRP是Virtual Router RedundancyProtocol(虚拟路由器冗余协议)的缩写,VRRP出现的目的就是为了解决静态路由单点故障问题的,它能够保证当个别节点宕机时,整个网络可以不间断地运行。 所以,Keepalived 一方面具有配置管理LVS的功能,同时还具有对LVS下面节点进行健康检查的功能,另一方面也可实现系统网络服务的高可用功能。 ###keepalived的重要功能 keepalived 有三个重要的功能,分别是: 管理LVS负载均衡软件 实现LVS集群节点的健康检查 作为系统网络服务的高可用性(failover) ###keepalived高可用故障转移的原理 Keepalived 高可用服务之间的故障切换转移,是通过 VRRP (Virtual Router Redundancy Protocol ,虚拟路由器冗余协议)来实现的

DBA必须要会使用zabbix

冷暖自知 提交于 2020-12-23 10:57:42
早些年的DBA都是通过采购商业监控工具来监控数据库,DBA根本不需要会监控,但是现在一切都在变,DBA要会使用监控工具,自己去监控数据库,比如Oracle、MySQL等数据库,所以学习监控工具也是必然。 首先,监控数据库工具首推zabbix,也是我们一直在使用的,非常好用。 先来了解一下。 zabbix监控的方式主要有以下三种类型 Zabbix agent 在被监控机上面安装zabbix agent,zabbix agent将被监控机采集到的数据发送给zabbix server。这种方式最常用,一般用来采集服务器的cpu、内存等信息。 SNMP 一些网络设备如交换机,上面无法安装zabbix agent,所以只能通过snmp的方式收集监控数据如端口状态,流量等。 External check 在zabbix server上面运行查询脚本,直接查询被监控机上的数据。此种方式在被监控机上面不需要做任何部署,所有查询全部从zabbix server上面发出,所以对zabbix server的性能要求较高, 官方不推荐大量使用该方式 。对于少量的oracle数据库服务器,可以采用该方式。 来源: oschina 链接: https://my.oschina.net/u/4404709/blog/4831293