这篇文章的版本以前跑了Diginomica

Twittersphere一直在尝试定义可观察性,但是有一个更重要的问题所有软件团队和公司都应该解决:你怎么知道你什么时候达到可观察性?是可观察性甚至是你“实现”和完整的东西,就像在时间的时间点,天堂开放和钹铿cl?或者是你每天练习的东西吗?

要清楚,新的遗物简单地定义了可观察性,就像“你能理解你的复杂系统一样。”在大型机和静态操作的日子里,已知的系统故障模式很少,因此监控工具是可视化和故障排除系统故障的有效方法。

快进到今天,我们以速度和规模的名义创造的复杂性迫使您调整监控这些系统的方式。对传统监控通过指标、仪表板和警报(例如,当服务器CPU达到特定阈值时提醒我)提供的“已知的未知因素”进行全面了解已经不够了。

由于系统更改(与稳定性)是分布式环境的常态,因此您需要灵活地查询这些动态系统的“未知未知”。您需要能够找到在设置系统无法预测的问题的答案。简而言之,您需要可观察性。

你从可观察性获得了什么

可观察性可以让您了解所有应用程序及其底层服务和系统之间的关系,这样您就可以理解跨组织边界的依赖关系,并更快地进行故障排除和解决问题。可观察性为您提供上下文,并帮助您理解问题发生的原因。

在您的软件健康直接影响客户的数字经验和您的业务的健康状态的现实中,可观察性使您提供了信心和可见性:

  • 尽量减少理解系统如何运行的时间
  • 理解系统和代码级更改如何影响业务
  • 减少时间来发现、调查和解决问题的根本原因

最近的研究四分之三(75%)的受访者表示,他们同意或非常同意他们的“组织对所有系统在单一平台(即可观察性平台)上的执行和交互有实时的看法。”任何一个理性的人都会认为这意味着75%的人都在实践可观察性,对吗?

那么为什么其他数据表明他们不是?例如:

  • 只有8%的受访者的评分为“非常好”,他们知道为什么系统和软件无法正常工作。知道“为什么”与“什么”出错的是一个可观察性的标志。
  • 四分之三的人对检测和修复软件和系统问题所需的时间不满意(并指出过于复杂的it环境是关键因素)。
  • 只有4%的公司在很大程度上将软件和系统性能数据与终端用户浏览器和移动设备性能数据进行了整合。所以它们有盲点——它们无法看到整个景观或理解依赖关系。
  • 大多数公司使用超过10个工具来仪器系统,平均而言,仪表均不到一半的IT系统。十个工具是九个太多屏幕,在九个筒仓之间切换到九个筒仓。

你在伪造吗?

许多公司声称具有可观察性,但他们的实践表明。没有结果验证其存在。他们假装它。

那么真正的可观察性是什么样的?这是你实现的还是练习的东西?这是后者,因为改变是恒定的。软件更新每天多次推进生产(每日部署四号,50,有时数千次,取决于公司)。

在所有相互关联和相互依赖的过程、系统和应用程序上获得可观察性需要持续保持警惕。

那些表现出色的受访者在研究中的所有软件卓越标志上都提供了一个真正可观测性的线索,特别是当您将其结果与底部25%进行比较时,谁表现不佳。

可观察性证据

领导者 落后者
他们考虑可观察性软件开发的核心,而不是以后用螺栓的东西 94% 56%
他们了解可观察性的服务中断技术vs.客户或员工 78%
12%
他们整合前端web和浏览器性能数据与后端软件和系统数据 100% 20%
他们经历少于5次大故障每个月 83%
3%
当发生事故或停电时,他们在30分钟内解决它 75%
1%
他们已经仪器仪表显着软件和系统并收集更多数据 58% 42%
他们同意他们可以“很快”做到理解更改的结果到软件“ 99% 38%

这样,你就有了明确的指示,表明你正在实践可观察性。如果你和这项研究中的领导者一样,你的企业也会从中受益。因为领导者在软件方面的表现优于其他公司,并在包括财务在内的各种指标上报告了更好的表现。

阅读更多关于研究及其发现的信息,见比数字更深:为什么和更完美的软件如何推动商业成功

Nočnica Fee是专注于无服务器的New Relic的开发倡导者。她是新栈和Dev.to的频繁贡献者。在闲暇时间,她喜欢鼓机和木工。查看贴子

有兴趣为New Relic博客写作吗?亚搏体育登入网送我们一个球场!!