在谈话中Futureestack:纽约2017年,Google网站可靠性工程师Liz Fong-jones注意到标准化的重要性 - 对过程和工具的重要性 - 为实现相对较小的站点可靠性工程(SRE)团队来支持更大的组织。

As Liz told Matthew Flaming, New Relic vice president of software engineering, “One SRE team is going to have a really difficult time supporting 50 different software engineering teams if they’re each doing their own separate thing, and they’re each using separate tooling.”

SRE工具的标准化

这是绝对有意义的——标准化是成功的SRE实践和DevOps原则的正确实现的关键。但是SREs应该使用什么工具进行标准化呢?每个团队需要决定什么对他们来说是最好的。好消息是:他们绝对有选择。

就像在每个组织中,SREs并没有一个通用的工作描述, SRE角色也没有一个标准的工具集。New Relic的现场可靠性工程师Jason Qualman说,从建筑风格的角度考虑可能比从工具的角度考虑更有帮助。

集装箱和微服务在新的遗物中发挥着重要作用,例如码头工人容器编排是我们的SRE工具集中不可或缺的部分。“我认为SREs目前使用的最大工具是一个管弦乐队,比如Kubernetes.或者介质圈在美国,你基本上有一个巨大的机器,你可以把盒子扔过去,然后它决定把盒子放哪儿——如果它们走了,它就把它们放回去,”杰森说。“这是一个巨大的系统,确保你的服务始终存在。”

新遗物的Sre Toolchain还包括外部和本土SRE工具。“我们建立了很多自己的基础设施,用于管理建筑和包装以及应用程序部署,”说亨利·夏皮罗公司副总裁兼总经理新的遗物基础设施。例如,新的遗物SRE和其他团队成员依赖于称为Grand Central的内部系统,以释放和维护其应用程序的生命周期。另一个工具,名为Gatekeeper,函数是“用于部署的飞行前检查器”。

为DevOps的每个阶段提供最好的SRE工具

它应该毫不奇怪,SRE Toolchain看起来很像各种迭代DevOps工具链,特别是如果你认为SRE的角色是,正如Matthew所说的,“可能是DevOps原则的最纯粹的升华到单个角色。”

Henry Shapiro指出,DevOps工具链可以帮助团队选择他们需要的工具来计划、创建、验证、打包、发布、配置和监控他们构建的软件。

DevOps工具链的各个阶段

显示阶段的例证在devops toolchain-by kharnagy

在循环的每个阶段,有工具Devops团队用于执行工作,并且SRE工具集可能非常相同,具体取决于角色在特定组织中的角色。例如,在新的遗物SRES上扮演越来越重要的角色,将责任结合在传统的DEV和OPS团队中。结果,在我们的组织中“Devops Toputchain”与“Sre Toolchain”之间的差异变得模糊。

每个阶段的SRE工具包括:

计划。项目管理和跟踪工具贾拉或者关键的追踪或其他任务管理工具。

创造。集成开发环境(ide)、文本编辑器、共享库和组件——“用于实际构建应用程序的构建块,”Henry说。即使在这里,SREs也扮演着重要的角色,例如鼓励开发团队避免从头开始构建一切,以重用可靠的代码或第三方库。

像GitHub和Subversion这样的源代码控制工具消除了开发和操作角色之间的界限,并且在负责管理部署环境和流程的SREs中非常受欢迎。

核实。构建和连续集成/连续交付(CI / CD)工具如詹金斯或者Circleci.或者新的遗物的本质上的家庭制造工具 - 更多的内容。

包中。工具管理包装,发布分段和批准过程,例如Jfrog.

释放。管理版本和应用程序的生命周期的工具,如新的遗产的大中心。

配置。工具喜欢起程拓殖Ansible.符合“自动化,自动化,自动化”SRE哲学,使团队能够在基础架构和应用程序中自动化和管理配置。SRES在确定这些配置应该是从健康和可靠性的角度来看的越来越多的作用,以及自动化以前需要实现这些规则和流程所需的大部分手工工作。

Henry和Jason都指出,容器使用的增加最终可能会减少许多组织对这些工具的需求。因为容器化的应用程序在不可变的配置中包含了它们所有的依赖和配置,所以像Docker这样的容器平台和像Kubernetes这样的编配工具对SREs来说是不可或缺的。

班长。对于很多人来说,监控意味着很多事情,但Henry指出,这个阶段包括像New Relic这样的工具,它们从应用程序和基础设施、某种形式的日志或分析数据收集指标,并通过仪表板对数据发出警报。

健康地图和新的遗物见解:SRES的新遗物工具

Henry认为有两种新的Relic工具特别适合SRE工具链,主要用于监控空间,但也与验证相交叉。

Devops,Containers和Cloud平台模糊应用程序和基础架构之间的线条。容器,特别是在抽象的图层中打包应用程序和所有依赖关系,该层需要组合的基础架构和应用程序。“世界在应用监测和基础设施监测方面碰撞,”亨利说 - 创建一个SRE辛劳和需要工具的新区域。

“碰撞”是新遗物的成因健康地图特性,亨利说。健康地图是在今年早些时候发布的,它是“一个高密度的视图,显示了一个给定应用程序正在运行的所有实例,”Henry解释说。“它给出了所有实例的状态,以及在其中运行的容器,以及应用程序与基础设施相关的状态。”

亨利说,SRE需要了解如何提供和管理基础设施,以支持他们与之合作的应用程序。“健康地图对他们来说是一种很好的方式来获得这种洞察力。这是关于应用健康和基础设施健康的这种综合观点。“

New Relic的见解与此同时,亨利说,正在成为SRES的进入分析工具。除了帮助建立开发实践的可靠性外,推出火灾也是SRE工作的一部分。没有什么是失败,但具有实时分析数据可以帮助解决问题并最大限度地减少其影响。

洞见在两方面对SREs特别有用。首先,New Relic查询语言(NRQL)使新的遗物客户能够在问题的特定方面创建蜂窝查询。聚合或更高级别的指标可能会告诉您问题所在,但并非总是存在它。NRQL使SRES和其他操作专业人员能够将特定问题的“为什么”三角定义为原始事件数据。

New Relic Insights也帮助SREs创建和监控自定义数据集。例如,如果SRE无法将新的Relic代理放置在特定类型的主机上,它们仍然可以从该主机获取日志,并根据该数据构建警报,以便进行特别分析或其他用途。

对于sre,没有什么是石头

很多公司都在努力定义他们对SRE角色的期望而且Sre Toolchain,就像角色本身一样,继续发展。在任何给定时间的工具使用的工具将取决于组织在SRE旅程中的位置。较少的成熟组织将倾向于使用更多专业化的操作工具,而更多成熟的组织将在SRE和软件工程工具中看到更多的收敛性。因此,虽然确信没有“单尺寸适合 - 所有”的工具,但SRE将在寻求新的,高效的方法以为他们所做的一切带来更高的可靠性时进行实验并调整正确的工具。

Kevin Casey为各种出版物和公司提供技术和业务。他赢得了Azbee奖,由美国商业出版社编辑,为他的信息周见故事给出,“你太老了吗?”他还在小型企业影响者奖项中的前社区选择荣誉。查看帖子

对新遗物博客的写作有兴趣吗?亚搏体育登入网送我们一个球场!