李优秀 发表于 4 天前

基于确定性AI的智能可观测性及自动修复



可观测性有助于企业实现应用程序业务代价最大化,这一点已经在业界的不断实践中得到验证。随着可观测性的概念在数字化领域不断深入,Gartner 今年进一步明白了关于「可观测性」的8条核心定义,企业对于可观测性的认知和实践也愈发精进。
究竟上,要真正实现可观测性,既要「统一」,又要「智能」。


Gartner 2023年对于「可观测性」的8条核心定义:


1. 通过对应用完整交易行为的观测
2. 自动检测和匹配应用和底子架构部件
3. 监控通过欣赏器,手机应用和 API 交付的应用
4. 识别和分析应用性能问题及对业务的影响
5. 与自动化和服务管理工具以及公有云服务商的集成
6. 业务运动的 KPI 及用户旅程的监控和分析
7. 多种测量技术的性能交互探测和分析能力(链路、指标、日志)以“检测未知的未知”,也即识别和解释预料外的事件和异常的能力
8. 应用安全,例如识别受监视应用程序中的已知漏洞以及阻止使用这些漏洞尝试的能力




9月21日,Dynatrace 做客红帽八点一“课”直播间,Dynatrace 资深技术顾问马伟与红帽首席架构师张家驹一同拆解基于确定性 AI 的可观测性。




统一的可观测性平台
冲破数据壁垒










在没有统一的数据平台和尺度的数据规范的情况下,不同的团队和不同的工具收集的数据每每会出现数据孤岛现象。这使得不同团队对数据的解释和理解变得困难,很难在同一个构造内部做出信息的整合和综合的分析。因此,建立统一的数据平台和定义尺度的数据规范是解决这个问题的关键。
Dynatrace 的统一平台将广泛而深入的可观测性和持续的运行时应用程序安全性与先进的 AIOps 相结合,提供基于大规模数据的答案和智能自动化。这使创新者能够实现云运维的现代化和自动化,更快、更安全地交付软件,并确保优异的数字体验。








确定性 AI
打造智能可观测性






可观测性不但是需要关注数据采集和底层数据格式,而不去关注结果。观测者要以业务目的为导向,明白自己的目的——快速发现和解决问题,实现业务目的。在分析和解决问题时,需要将视角从数据层面转向业务和应用层面,以得出更正确和全面的结论。




Dynatrace 则能够使用确定性 AI 技术持续为企业提供代码级别的确定性分析,对企业的所有网络、应用程序和服务之间的关系进行映射和理解。所谓确定性 AI,可以通过故障树分析的方式根据组件级故障确定体系级故障,确定不同事件确切的根本原因和潜在影响。开发人员无需重现错误即可解决问题,团队也能够凭此开发有用的自动化干预模型。
通过确定性 AI,Dynatrace 打造的感知——思考——举措(Sense-Think-Act)模型能独立形成一个闭环,进行自主修复,不需要人工参与。其中,感知部门可以收集可观测性数据,感知应用状态。思考部门通过 AI 算法和模型分析这些数据,描述出应用的状态,分析问题的原因和环节。举措部门会根据分析的结论,触发一个动作去解决这个问题,形成一个完整的 Ip 运维流程的闭环。这个闭环可以自动发现应用出现的问题并找到根本原因,触发操纵进行修复,使指标规复到正常状态。








Dynatrace 携手红帽
深度实现 AIOps






Dynatrace 开放的 API 能够融入企业现有的生态体系中,推动企业实现从开发、发布到云运营另有业务流程等各个方面的自动化。Dynatrace 与全球开放混合云领军企业红帽深度合作,依附确定性 AI 打造的智能可观测性赋能红帽明星产品 Ansible,助力企业深化 AIOps 实践。


2016年,Dynatrace 成为红帽认证合作同伴,深入了解已部署的应用。
2017年,Dynatrace 使用 Ansible Tower 实行自我修复功能,同年成为唯一的红帽 OpenShift 启动合作同伴以及红帽容器技术认证合作同伴。
2018年,Dynatrace能够基于OneAgent Operator对红帽OpenShift 进行智能自动化部署。
2019年,Dynatrace 与红帽 Ansible集成,提供自动驾驶的云生态体系。
2020年,Dynatrace Managed 通过红帽企业级 Linux(RHEL) 8.x 发行版认证,并与红帽 Ansible 开启了 EDA(Event-Driven Ansible)的下一篇章。




直播的后半段,马伟老师、张家驹老师共同讲解并演示了怎样将 Dynatrace 的可观测性能力与红帽 Ansible Automation Platform 的自动化部署和配置管理能力相结合,实现应用的自愈。


免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!
页: [1]
查看完整版本: 基于确定性AI的智能可观测性及自动修复