这篇文章的一个版本曾被转载过Diginomica

推特圈一直在尝试定义可观测性,但是还有一个所有软件团队和公司都应该解决的更重要的问题:您如何知道什么时候已经实现了可观察性?观察力甚至是你“完成”和完成的东西,就像在某个时刻达到高潮,天空打开,铙钹叮当响?还是你每天都在练习?

为了明确起见,New Relic将可观察性简单地定义为“您对复杂系统的理解程度”。在大型机和静态操作的时代,很少有已知的系统故障模式,所以监控工具是可视化和故障排除系统故障的有效方法。

快进到今天,我们以速度和规模的名义创造的复杂性迫使你调整你监控这些系统的方式。对传统监视通过度量、指示板和警报(例如,“已知的未知”)提供的“已知的未知”有一个后视图的理解已经不够了。,当我的服务器CPU达到某个特定阈值时警告我)。

因为系统变更(相对于稳定性)是分布式环境的规范,所以您需要灵活地查询这些动态系统的“未知的未知”。您需要能够找到在系统设置时无法预测的问题的答案。简而言之,您需要可观察性。

你从可观察性中获得什么

可观察性让您看到所有应用程序及其底层服务和系统是如何关联的,因此您可以了解跨组织边界的依赖关系,并更快地进行故障诊断和解决问题。可观察性为您提供了上下文,并帮助您理解问题发生的原因。

在现实中,您的软件的健康状况直接影响您的客户的数字体验和您的业务的健康状况,可观察性给您信心和可见性所需:

  • 尽量减少理解系统行为的时间
  • 了解系统和代码级更改如何影响业务
  • 减少发现、调查和解决问题根源的时间

最近的研究,四分之三的受访者(75%)表示,他们同意或强烈同意他们的“组织对所有系统如何在一个平台上执行和交互有一个实时的视图”。,可观察性平台)。"任何理性的人都会将其解释为75%的人在实践可观察性,对吧?

那么为什么其他数据表明它们不是呢?例如:

  • 只有8%的受访者认为他们知道系统和软件为什么不能工作的能力“非常好”。知道“为什么”和“什么”出错是可观察性的标志。
  • 四分之三的人不满意检测和修复软件和系统问题所花费的时间(并指出过于复杂的it环境是关键因素)。
  • 只有4%的公司在很大程度上将他们的软件和系统性能数据与终端用户浏览器和移动性能数据进行了整合。所以他们有盲点——他们不能看到整个风景或理解依赖关系。
  • 大多数公司使用超过10种工具来测试他们的IT系统,平均来说,测试了不到一半的IT系统。10个工具代表了9个需要切换的屏幕,9个需要管理的筒仓。

你是在假装吗?

许多公司声称自己具有可观测性,但实际情况却并非如此。没有结果验证它的存在。那是假的。

那么,真正的可观察性是什么样子的呢?它是你实现的还是你练习的?是后者,因为变化是恒定的。软件更新每天会被多次推向生产环境(每日部署)第四次,50次,有时数千次,取决于公司)。

在所有相互关联和相互依赖的过程、系统和应用程序中获得可观察性需要持续的警惕。

那些表现出色的受访者研究中所有的软件卓越标记都为真正的可观察性提供了线索,尤其是当你将他们的结果与表现糟糕的底层25%的人进行比较时。

可观察性证据

领导人 落后者
他们认为可观测性软件开发的核心而不是事后栓上的东西 94% 56%
他们学习由可观察性造成的服务中断技术vs.客户或员工 78%
12%
他们集成前端web和浏览器性能数据与后端软件和系统数据 100% 20%
他们的经验少于5次大的中断每个月 83%
3%
当它们确实发生事故或停机时,它们就会30分钟内解决 75%
1%
他们已经检测更软件和系统,正在收集更多的数据 58% 42%
他们同意他们可以“很快”理解变化的结果软件” 99% 38%

所以,你有了清晰的指示,你在练习可观察性。如果你像研究中的领导者一样,你的生意就会受益。因为这些领导者在软件方面的表现优于其他公司,在包括财务在内的各种指标上的表现也更好。

欲了解更多有关这项研究及其发现,请参见《比数字更深入:更完美的软件为何以及如何推动商业成功

没有čnica费用serverless Dev提倡New Relic的专业。她经常为新栈和Dev.to做出贡献。在休息时间,她喜欢鼓机和木工。查看贴子

有兴趣为新遗迹博客写作吗?亚搏体育登入网给我们发个广告!