近日,因核心运维人员的个人精神、生活等原因,执行了恶意操作,某互联网公司的生产环境和客户数据受到了极其严重的破坏,生产环境和数据的破坏为该公司本身及其客户带来了极大的不可挽回的损失,且遭受的破坏无法即时修复,其影响尚会持续一段时间,损失仍在持续发生。
IT资产及数据安全涉及企业的核心利益,其重要性不言而喻。可是为何删库跑路的现象还是屡有发生?为此,我们也进行了一些思考:
1、关于运维授权控制,从根子上来说,如果运维人员无权限做删库操作,其实删库事件是不会发生的,这里就涉及权限授予的问题,需要为运维人员授予合适粒度的权限,所授予的权限既满足运维人员运维操作所需,又要防止误操作、恶意操作的发生;
2、关于运维过程控制,运维过程中,可能会执行很多的运维指令,我们无法做到关注每一条指令的执行,但有一些关键设备、关键指令却是常见的,特别是会对操作系统或应用系统产生破坏性、甚至不可逆的指令是应该采取手段防止误执行、误操作或恶意操作的,应该控制运维过程中此类指令和操作的执行;
3、以时光机来保障数据安全,故障一旦发生,以最快速度恢复系统的服务能力,最大程度降低甚至挽回损失必定是首要考虑的事项,如果服务系统和运维系统具备时光机功能,即使发生了不可逆转的故障,我们也能够通过时光机快速恢复系统的服务能力;
4、运维过程的全程审计,无论做何种运维操作,均需要全程录像审计,全程审计为事后回溯和追责提供依据,全程录像不仅可以用于知识积累、知识传递,一旦发生事故,其也将为故障分析带来巨大帮助;
5、故障定位能力的重要性,事故一旦发生,为恢复系统的服务能力、为避免日后重蹈覆辙,不光要分析故障原因,高效快速地定位到具体的破坏性操作也是十分关键的,定位到具体操作,以具体操作发生点追溯故障发生的整个过程,将能更有效的排除故障、恢复系统的服务能力。
行云管家作为业界知名的一款运维利器,能有效应对删库跑路事件的发生,其全面的能力足以保障IT资产和运维安全。
行云管家具备完善的运维授权能力,可将操作功能以及作为资源的IT资产分别授权予运维人员、组织单元和角色,通过策略控制实现了分时授权能力,保证合适的人在合适的时间合适的地点对合适的IT资源进行合适的操作。
行云管家对运维人员的整个运维过程实行控制,管理者可随时监控、介入甚至终止运维人员的运维操作。
行云管家支持指令审批功能,对于敏感、高危指令实行警告、审批和阻断,甚至直接中断运维操作会话。
通过行云管家时光机,可将某个磁盘下的快照以时间轴的形式展示,用户可以以时间的维度来查看快照并决定回滚哪个快照。
行云管家对运维过程进行全程审计,在行云管家中所进行的运维操作均会以日志的形式记录下来,支持审计的运维操作有:主机访问(会话)、文件传输、数据库操作、应用操作、批量作业、任务编排、主机登录凭证修改等。
行云管家支持审计过程中的指令检索及指令定位,根据指令关键字、指令类型进行全文检索,可快速的将录像定位到相应的时间点。
综上,行云管家的系列功能,专为安全运维而打造,通过行云管家进行IT资产的运维,能有效的杜绝删库跑路,让运维操作变得合规、安全、可控,从而保障企业IT数据和运维操作安全,避免“删库跑路”等事件的再次发生。
导航:百度搜索“行云管家”
来源:51CTO
作者:堡垒机123
链接:https://blog.51cto.com/13728988/2473884