企业IT服务的反脆弱能力建设
一场突如其来的疫情让我的生活节奏慢了下来,有更多时间学习和思考,这两天有些想法一直在我的脑海中萦绕,现在整理成文字与大家分享。 纳西姆·塔勒布写过一本《反脆弱》,说的是如何应对不确定性,从不确定性中获利。IT是企业业务的核心支柱与保障,但IT服务的连续性如何保障呢?企业IT是否具有脆弱性?如何提升企业IT应对突发事件的能力? 总体而言,反脆弱能力建设的目标有以下几点:第一是系统健壮性建设,尽力降低内部和外部事件对系统的影响,确保系统的完整性不被破坏,企业的数字资产得到保护;第二是IT服务可用性建设,为服务对象提供不间断服务,以保障企业业务连续性;第三是系统可管理性建设,确保管理人员可随时执行系统管理任务,如策略管理、配置变更、故障响应和性能优化等。第四是系统持久性建设,即系统的技术升级和改造,基于即发事件的经验总结和潜在风险预测来改进系统。 鉴于企业IT的复杂性及个人能力所限,下面我将围绕四个关键组件来展开话题,他们分别是:应用的开发与运维,企业级网络与安全,云服务与平台建设,以及最终用户的服务体验。 第一节 应用的开发与运维 在与脆弱性的斗争中,应用的转型是非常积极且富有成效的。大家经常用“宠物”和“牲畜”来比喻传统企业应用和新型的云原生应用。“宠物”型应用无疑是脆弱的,非常依赖底层平台的呵护。转型为“牲畜”型应用就是为了反脆弱。云原生应用的设计原则中有几条与反脆弱有关