何谓自动化运维,即在最少的人工干预下,结合运用脚本与第三方工具,保证业务系统7*24小时高效稳定运行。这应该是所有业务系统运维终极目标。
我们对运维的要求通常是:
1、事前预警
在故障出现之前,管理人员应该能在任何时间,任何地点接收到告警信息,并及时处理问题,把故障隐患扼杀在摇篮中。
2、事中恢复
天有不测风云,即使是再完美的方案也可能有预料之外的故障,为保证在最短时间内恢复业务,关键数据不因故障丢失,我们需要有完整备份方案来应对自如。
3、事后存档
要实现以上三个要求,并不是一件容易的事情。需要一个经验丰富且高效的运维服务团队,随着我们的业务系统不断增加,业务量的不断上升,成熟的运维服务基本会借助第三方工具,高效的进行软件的部署与运维。对于企业来说,要特别关注两类自动化运维工具:一是IT运维监控和诊断优化工具;二是运维流程自动化工具。
这两类工具主要应用于:
1、监控自动化,是指对重要的IT设备实施主动式监控,如路由器、交换机、防火墙等。
2、配置变更检测自动化,IT设备配置参数一旦发生变化,将触发变更流程转给相关技术人员进行确认,通过自动检测协助IT运维人员发现和维护配置。
3、维护事件提醒自动化,通过对IT设备和应用活动的时时监控,当发生异常事件时系统自动启动报警和响应机制,第一时间通知相关责任人。
4、系统健康检测自动化,定期自动地对IT设备硬件和应用系统进行健康巡检,配合IT运维服务团队实施对系统的健康检查和监控。
5、维护报告生成自动化,定期自动的对系统做日志的收集分析,记录系统运行状况,并通过阶段性的监控、分析和总结,定时提供IT运维服务的可用性、性能、系统资源利用状况分析报告。
在可预见的未来,运维的角色将变得越来越重要,自动化运维工具不仅能满足我们对运维的要求,解放生产力,还能使我们的运维管理更加规范化,标准化,从而真正意义上的实现自动化运维。
来源:oschina
链接:https://my.oschina.net/u/1411872/blog/187904