[背景]在前两天公司的cacti监控服务器硬盘出现损坏,导致系统不停得重复启动,服务无法正常运行。心乱如麻啊,因为我也面临着近700台服务器的监控,这个数字,吓人。与是就想到了恢复,可数据还在这块硬盘里啊!怎么办呢?挂盘吧,问了一圈发现,我这台监控机是较差的一台Dell1850,没有与其类型相同的服务器,没办法,哎,就想再申请一台一样型号的机子做个bsd系统后,再挂。申请完后,IDC人帮我去领机子,我逞这时,下去拿硬盘,我带着不死心,又重新登录到freebsd的单用户下执行了fsck,哈哈,按着它一路的要求做下来,居然系统可以正常运行了,乐得我呀!但我知道,也不能指望它跑多久了,因为,我从网上看到好多说发生这种状况,已经判定为死刑了(而且我的判定是明智的,因为第二天,这台服务器正式完蛋了)。所以,我还是快把数据备份下来吧!
进入主题
[流程]
备份Cacti
(1)cacti文件的备份
这个简单就是备份cacti文件的目录(除rra目录外)
(2)mysql备份
mysqldump -p cacti >/tmp/cacti.sql.20090823
(3)备份rra目录
dumprrd.sh
#!/bin/sh
rrddump="/usr/local/bin/rrdtool dump"
xmldir="/tmp/mysqlbackup/rraxml"
xmlbackup="/tmp/mysqlbackup/rrabak"
mysqlbackupDIR="/tmp/mysqlbackup"
eMailFile=$mysqlbackupDIR/email.txt
rrdpath="/usr/local/share/cacti/rra/"
DATE=`date +"%y-%m-%d"`
if [ ! -e ${xmldir} ];then
mkdir ${xmldir}
fi
if [ ! -e ${xmlbackup} ];then
mkdir ${xmlbackup}
fi
echo "" >$eMailFile
echo $(date +"%y-%m-%d %H:%M:%S") >> $eMailFile
#create rra => xml
for file in `find /usr/local/share/cacti/rra/ -mtime -2 | awk -F\/ '{print $NF}'`
do
${rrddump} ${rrdpath}${file} > ${xmldir}/${file}.xml
done
if [ `ls /tmp/mysqlbackup/rraxml/|wc -l` -ge 2 ];then
#tar backup
cd ${mysqlbackupDIR}
tar czvf ${xmldir}.${DATE}.tar.gz rraxml >/dev/null 2>&1
mv ${xmldir}.${DATE}.tar.gz ${xmlbackup}
#delete file&dir
if [ $? -eq 0 ];then
echo "rraxml.${DATE}.tar.gz Backup Success!">> $eMailFile
rm -fdr ${xmldir}
mkdir ${xmldir}
/usr/bin/find ${mysqlbackupDIR}/rrabak -type f -ctime +2 | /usr/bin/xargs /bin/rm >/dev/null 2>&1
echo "Rra Backup is ok!" >> $eMailFile
fi
else
echo "Rra Backup is fail!" >> $eMailFile
fi
/soft/mail.pl "Cacti Backup of rra backup!"
恢复cacti
(1)安装cacti环境
这个不在话下,安装freebsd(为什么我选择它呢,因为,我觉得安装cacti很方便,哈哈。所以就选择这款操作系统了。)注意,
rrdtool的版本一定要高与或者等同与你原先备份的版本.所以,我需要升级ports,在升级ports前,我先把系统升级下。
升级freebsd
freebsd-update fetch install
重启
升级ports
portsnap fetch extract
重启
[后期更新ports
portsnap fetch update ]
过后,安装便可以参考
http://5ydycm.blog.51cto.com/115934/113305
在这里添加下,安装spine和monitor插件(注意,如果你原先没有monitor插件看这个,如果有的话,就没必要安装了,因为你已经备份了文件与数据库,就基本上支持了这个插件安装环境了)
spine安装
whereis cacti-spine
cd /usr/ports/net-mgmt/cacti-spine
make install clean
monitor插件的安装,需要先安装cacti-plugin-arch
从http://cactiusers.org/下载,过后解压
将其cacti-plugin-xxxxxx.diff 复制到cacti安装目录下,并且在其cacti安装目录下执行
patch -p1 -N < cacti-plugin-xxxxxx.diff
完了吗?没有,还有一步啊,
mysql cacti < pa.sql(需要操作)
<后期
到User Managemant=》admin下把Plugin Management选中
过后,就可以在cacti安装目录下的include/global.php
添加$plugins[] = 'monitor';
好了。环境基本ok了。>
(2)恢复cacti文件
简单,上传到网站目录下,如/usr/local/share/cacti
(3)恢复mysql的cacti数据库
mysql cacti <cacti.sql.20090823
GRANT ALL ON cacti.* TO cactiuser@localhost IDENTIFIED BY 'somepassword';(自己修改匹配你原来的用户)
flush privileges;
(4)恢复rra
restorerra.sh
#!/bin/sh
rrdrestore="/usr/local/bin/rrdtool restore"
xmldir=/tmp/rraxml/
for file in `find ${xmldir} | awk -F\/ '{print $NF}' | sed s/.xml//g`
do
echo $file
${rrdrestore} ${xmldir}${file}.xml /usr/local/share/cacti/rra/${file}
done
chown -R cacti:cacti /usr/local/share/cacti/rra
OK,再给log授权。在这里提醒大家注意,权限的问题,不过,这些小的细节大家只要多注意事项观察日志都应该能解决掉的。
好了,到此为止,我已经将公司的监控服务器恢复好了,现在观察,运行不错。700台,9000个监控元素,只跑了60s,不错。大功告成,闪了。
如果想了解更多,请关注我们的公众号
公众号ID:opdevos
扫码关注
来源:oschina
链接:https://my.oschina.net/u/4277082/blog/4339667