zabbix版本:4.1 DB为Mysql
过程:
1,为了增加邮件报警功能,按照网上文章,开始增加发送邮件模块。先停postfix,后安装mailx和sendmail。
systemctl list-unit-files | grep post
systemctl stop postfix
systemctl disable postfix
yum -y install mailx sendmail
2,设置邮箱信息,vi /etc/mail.rc。
3,测试邮箱echo "zabbix test " |mail -s "zabbix" sss@aaa.com.cn
4,在zabbix web配置中报警媒介类型,停用Jabber和SMS;启用Email。用户内增加email.
5,动作Report problems to Zabbix administrators内增加操作:发送消息给用户群组。
开始测试。发现邮件无法收到。于是停止某个主机的agent来看看是否发送邮件报警信息。未果。
发展:
在继续配置其他信息后,需要重启服务器,发现server无法正常启动。
vi /var/log/zabbix/zabbix_server.log
多次检查后,发现报 server #2 started [alerter #1] 错误,服务重启。有时候报alerter #2错误。
17996:20190403:202634.460 Starting Zabbix Server. Zabbix 4.2.0alpha2 (revision 88094).
17996:20190403:202634.460 ****** Enabled features ******
17996:20190403:202634.460 SNMP monitoring: YES
17996:20190403:202634.460 IPMI monitoring: YES
17996:20190403:202634.460 Web monitoring: YES
17996:20190403:202634.460 VMware monitoring: YES
17996:20190403:202634.460 SMTP authentication: YES
17996:20190403:202634.460 Jabber notifications: YES
17996:20190403:202634.460 Ez Texting notifications: YES
17996:20190403:202634.460 ODBC: YES
17996:20190403:202634.461 SSH2 support: YES
17996:20190403:202634.461 IPv6 support: YES
17996:20190403:202634.461 TLS support: YES
17996:20190403:202634.461 ******************************
17996:20190403:202634.461 using configuration file: /etc/zabbix/zabbix_server.conf
17996:20190403:202634.476 current database version (mandatory/optional): 04010004/04010004
17996:20190403:202634.477 required mandatory version: 04010004
17996:20190403:202634.754 server #0 started [main process]
18001:20190403:202634.757 server #1 started [configuration syncer #1]
18002:20190403:202634.759 server #2 started [alerter #1]
18003:20190403:202634.760 server #3 started [alerter #2]
18004:20190403:202634.762 server #4 started [alerter #3]
18005:20190403:202634.763 server #5 started [housekeeper #1]
18006:20190403:202634.765 server #6 started [timer #1]
18002:20190403:202635.172 Got signal [signal:11(SIGSEGV),reason:1,refaddr:0x50]. Crashing ...
18002:20190403:202635.172 ====== Fatal information: ======
18002:20190403:202635.172 Program counter: 0x7f59c68f080f
18002:20190403:202635.172 === Registers: ===
解决:
1,在配置文件中vi /etc/zabbix/zabbix_server.conf将alerter设置为0,以为能解决问题:错误,问题没有解决。Server没有alerter不能启动。设置为1也不行,还是报同样的错误。
2,网上搜索一番,没有类似的答案。想来应该是邮箱配置问题,将mailx和sendmail卸载,重启还是同样的错误。
3,将web配置信息全部禁用,还是报alerter错误。
4,想到服务器上已经有很多监控信息,决定先备份数据库。
5,用以前的系统恢复zabbix,然后启动检查,server正常。停止后还原数据库。发现还是出现问题。
6,判断应该是配置问题,在mysql中将alert表中的数据全部删除。
7,服务重启后,开始变得正常了。
蠢,耗时1天!!!
来源:oschina
链接:https://my.oschina.net/u/4341235/blog/3586059