作为我们“新Relic的生活博客系列中,我们最近采访了Josh Biggley,他是TechOps战略咨询团队的行动策略师。在这个职位上,Josh和他的团队拥有从电信到科技初创企业、医疗保健到管理服务的经验,他们与客户和潜在客户会面,以加强对其他Ops中小企业的采纳。Josh于2019年11月从Cardinal Health加入New Relic,在那里他是企业监控团队的高级工程师。

Josh Biggley的照片

Josh Biggley

新遗物:市场上有很多谈话推特可观察性。你如何定义可观察性?

杰克:我的背景和成名的原因是SolarWinds十多年的主题专家。我是其中之一50 MVPS.在全球范围内,对于他们的用户社区来说,我辞职的角色加入了新的遗物和加拿大唯一的MVP。当我过来新的遗物时,球场是“是的,[新遗物]可以带来猎户座平台数据[进入NRDB]。“证明了这一理论,我撰写了第1部分博客系列,专注于太阳风中小型企业的可观测性策略。

对我来说,可观察性是关于数据的民主化。如果数据是遥测数据或业务数据并不重要。我们需要分解数据孤岛,并将所有数据带到一起进行明智的决策。

作为客户,我向我们的架构和帐户团队传讲了这种民主的数据。我们的首席执行官,卢Cirne,使用“单一的真理来源”短语,这也产生了共鸣。对我来说,可观察性是关于提出两种格式的数据:

  1. 关于我的数据,我知道我需要问些什么?
  2. 有哪些事情是我甚至不知道的,我要问我的数据,我能做到吗?

然后,它由几个参数驱动,包括数据基数、数据保真度和数据粒度。如果我们能勾选这些选项,我们就能回答那些“已知已知”的问题,更重要的是,那些“未知未知”的问题。

新遗物:您所说的是什么需要满足?

杰克:对于很多组织来说,可观察性需要改变文化。我们支持技术部分,以更细粒度的时间间隔收集数据,从5分钟和10分钟减少到10秒,或者甚至查看我们的跟踪产品,同时进行head和亚博最新版直播基于尾部的追踪所以我们拥有一切。但是你可以拥有最好的平台,我谈到了这个网络研讨会我们所做的,你可以有纳米堆栈和粒度数据,但是如果你不改变你追求大众化的文化在你的组织,对数据的访问,使团队提问开始,采取行动的问题,你问你的数据,你错过了可观测性的本质在试图实现它的技术现状。就像DevOps一样,可观察性既是一种技术运动,也是一种文化和基于人的运动。

新遗物:平均开发人员和不同的团队有兴趣进入民主数据吗?每个人都想要这个吗?

杰克:我认为每个人都想要它,只要他们有正确的心态。不幸的是,组织内的一些团队通过数据把关来衡量他们的价值。这是可观察性的对立面。

可观察性是关于摧毁大门的。

所以,如果我们可以分解那些盖茨,那么这是正确的事情。我不能专门对开发人员的角色发言,但我可以使用我的主体健康角色的一个例子。对于红衣主教健康的主要网络架构师来说,这种情景频繁地播放了他的团队。

因此,应用程序开始遇到问题。申请业主跳上,开始执行他们的三环,立即看到这些问题,并责怪网络团队。然后网络团队必须跳上,收集一些遥测数据,开始做一些数据包捕获,然后对这些数据包捕获进行一些分析。然后他们回到了申请团队并说:“不,这不是我们。这是我们所看到的,“像失败的握手或其他东西一样。“这不是我们。这不是一个网络问题,我们拥有所有这些带宽。“

这主要架构师对我说,“杰克,我爱这个想法的可观测性,因为这意味着我可以立即采取网络数据我们已经收集和显示我们的应用程序团队说,“嘿,你希望这么多带宽和这种延迟阈值下的错误,这样你就可以确定在一开始你的网络故障诊断,这不是问题。”

所以你不会在大半夜叫别人。你不能剥夺我团队的周期,完成他们需要完成的项目。你只是让我们专注于我们需要优先处理的事情,即解决与网络相关的问题,同时也让你的团队能够更快地行动。不需要等待网络工程师跳上去做他们的分析。

通过分解数据孤岛和民主化访问该数据,您可以通过“它是网络”的归咎游戏或“这是代码”。如果我们谈论网络数据,数据库性能,前端,后端或中间件并不重要。这是关于将所有数据带到一起,让人们问,“嘿,是网络吗?是我的存储,基础设施还是应用程序?“或者是一个用户抱怨,但只是对我们的CIO大声抱怨,事情被破坏了?

New Relic:如此迅速地发现问题所在,减少MTTR,获得睡眠是非常重要的好处。

杰克:是的。我想说的是,我们在这个行业中谈论得还不够的是两者之间的区别平均检测,平均地理解的时间,以及平均解决时间。通常情况下,您知道问题是什么,并可以采用某种策略来缓解它,但您无法解决更广泛的问题,直到您遇到维护窗口。在New Relic,可观测性使我们能够做平均时间的检测和平均时间的理解。这将使客户有希望减少问题保持打开的整个窗口——从问题开始到理解和解决问题所需的时间。

但是科技的影响是有限的。这意味着解决问题的时间完全取决于文化。你会允许我在今天中午推进一个代码更新吗?我们相信自己能做到吗?我可以改变我的动态环境吗?许多传统的组织会说,“不行,你必须等到维护窗口。这对工程师、对公司、最重要的是对客户来说都很糟糕。

New Relic:作为一个运营人员,一个客户,一个负责确保系统运行的人,拥有可观察性会让你有什么感觉?

杰克:我最近意识到,可观察性让我成为一个讲数据故事的人。我是个数据狂人。我喜欢数据。我喜欢讲故事,我发现最好的故事是当你将一个故事和引人注目的数据交织在一起的时候。这就是为什么数据的大众化访问会改变游戏规则。没有什么比试图讲述一个故事却无法获得我需要讲述这个故事的数据更糟糕的了。

可观察性使我能够通过访问所有数据来成为数据讲述者。它让我成为一个更好的领导者,在组织内汇编必要的支持,实现目标。

数据可以说出任何你想要的东西,这就是你需要受信任的讲故事者的原因。关于数据的最喜欢的报价是世界上有三种类型的谎言:谎言,该死的谎言和统计数据。不幸的是,它非常准确。但在一个组织中,数据讲故事者告诉令人信服的故事将使组织在这种可观察性的路径上向前移动。

New Relic:你能告诉我们一个关于实践可观察性的轶事或故事吗?

杰克:在卡迪纳健康的最后一年,我参加了一项领导力培训计划,面向高绩效、高潜力的个人。我的团队面临的挑战是减少我们收集的数据量GCP.在不影响业务的情况下。

所以我必须为我们收集的数据编织这个业务期望的叙述。和工程师要全部数据,对吧?因为他们的说法是“存储很便宜,所以把你所有的数据都给我们就行了。”“现实情况是,当你开始以多拍字节的规模收集数据时,即使是像Cardinal Health这样的大型组织,它也会变得昂贵。

当我们开始看数据时,我们开始围绕这个问题编织故事,数据开始告诉我们什么?我们碰到了一堆阻滞剂。保安说:“不,数据告诉我们这个故事。云架构师说:“不,数据告诉我们另一个故事。”“最后,我们找到了一条共同的线索。

这就是为什么讲故事的人如此重要,因为你听到这两个故事,然后你突然可以重叠它们,并将数据映射到重叠的部分。正是通过将数据映射到重叠部分,我们才得以做一个简单的改变,从而减少了大约65%的成本。这是最好的部分,因为我们找到了重叠的线索。

所以我们做了改变,没有一个技术团队争论我们做的改变。他们没有注意到我们作了改变。很明显,财务人员做到了,因为那是我们的目标:降低成本。降低成本,无技术影响。但是,是的,我们做了改变,我们找到一些技术人员说,“好吧,所以我们做了改变。他们说:“什么时候?”“好像几天前。””“哦,好的。就这样。

最好的数据分析师是你最好的故事讲述者。我认为每个人都需要成为数据分析师,这就是为什么可观察性很重要。在这种情况下,我们正在为一个非常特定的业务需求查看一个非常特定的数据集。可观察性使每个人都成为数据讲述者。按照卢的观点,这是一个可信的数据集。

New Relic:我们能谈谈另一个大的话题吗——监控与可观察性?

杰克:见鬼,是啊!监视告诉你什么时候出了问题,可观察性让你问为什么。监视就是要预先预测系统将如何失败。我曾听人说过,如果您正在监视一个故障,为什么不从一开始就修复它,而不是等待事情发生故障?就像是,“哦,我知道那东西要倒了。”我会一直看着它,直到它掉下来,然后我就跳下去。“我认为这是被动监视和可观察性是主动方法之间的争论。

可观测性是什么?

请继续关注“新遗迹生活”的第二部分。要了解更多关于可观察性的信息,请点击2020年的可观察性:一份宣言

Tricia Kerr是新遗物的高级技术内容编辑器。查看帖子

对新遗物博客的写作有兴趣吗?亚搏体育登入网给我们发一份建议书!