第一章 SRE与DevOps之间的联系
作者:By Niall Richard Murphy,Liz Fong-Jones, and Betsy Beyer,with Todd Underwood, Laura Nolan,and Dave Rensin 翻译:张翔 校验:妙晓光 王运祥 王文勤 徐梦茹 齐凯华 郭晓东 运维是一门很难的学科。 不但没有解决如何很好地运行系统,即便那些已经在使用的最佳实践也是高度依赖环境且未被广泛采纳的。 并且最重要的,没有解决如何良好地管理运维团队这一问题。人们普遍认为,对这些问题的详细分析源于二战期间致力于改善盟军军事进程和产出的作战研究,但事实上,长期以来我们一直都在思考如何更好地实践。 尽管有这么多的努力和想法,可靠的生产运维仍然是难以保障的,特别是在信息技术和软件可操作性领域, 例如: 企业通常将运维视为成本中心, 这使得对结果进行有意义的改进变得困难甚至不可能。 这种短视的方法还没有被广泛理解, 但对它的不满却已经引发了IT领域对如何组织工作方面的一场革命。 这场革命源于试图解决一系列普遍问题, 并诞生了两个不同的解决方案: DevOps 和 SRE(Site Reli‐ability Engineering)。 尽管单从描述上看,他们是企业完全不同的两个方面,需要单独讨论,但事实上,它们的相似之处,要远比我们想象的多。 但首先,我们需要来了解一下每种原则的背景。