阿里云可观测链路 OpenTelemetry 版

阿里云服务器

什么是阿里云可观测链路 OpenTelemetry 版

阿里云可观测链路 OpenTelemetry 版是基于 OpenTelemetry 开源标准的一种服务,专为分布式应用开发者提供完整的调用链路还原、调用请求量统计、链路拓扑、应用依赖分析等工具。这个服务有助于开发者快速分析和诊断分布式应用架构下的性能瓶颈,从而缩短异常定位时间,提高在微服务框架下的开发诊断效率。

阿里云可观测链路 OpenTelemetry 版支持多种开源社区的 SDK,并且兼容 OpenTracing 标准。通过集成这些 SDK,客户端的应用程序可以上报服务调用数据到可观测链路 OpenTelemetry 版控制台。在接收到这些数据后,服务会进行实时聚合计算和持久化,形成链路明细、性能总览、实时拓扑等监控数据,供开发者进行问题排查与诊断。

此外,该服务还提供了动态真实的拓扑结果,可以根据链路上报信息实时绘制,结果准确且真实反映应用情况。同时,它还支持直接上报和间接上报两种方式,以适应不同场景的需求。

要使用阿里云可观测链路 OpenTelemetry 版,开发者需要开通服务,并在应用监控中选择该服务。在配置完成后,就可以开始享受该服务提供的各种功能了。

请注意,由于服务可能会进行更新和升级,具体的功能和操作流程可能会有所变化。因此,建议在使用前仔细阅读官方文档或联系阿里云技术支持以获取最新信息。

产品功能

分布式调用链诊断是一种强大的工具,用于跟踪和分析复杂分布式系统中的用户请求。这些系统通常由多个服务、组件和基础设施组成,跨多个节点和层次。通过分布式调用链诊断,开发者和运维人员可以深入了解用户请求从发起到完成的整个过程,包括经过的所有服务、接口、云组件以及基础设施。

诊断分布式调用链的主要功能包括:

跟踪端到端用户请求:从用户终端开始,跟踪请求通过网关、微服务应用、云组件和基础设施的整个旅程,汇总和组装这些信息,以还原完整的请求轨迹和状态。

调用链筛选:允许用户根据请求状态、耗时、应用名称、接口名称和主机地址等维度快速筛选调用链。这有助于聚焦特定条件下的调用行为,比如错误调用或慢调用。

调用链详情:选择一条特定的调用链,查看其详细信息,包括链路中的所有接口、链路开始时间、总耗时、接口是否异常,以及每个接口的调用耗时。

调用链分析:通过实时聚合和分析上亿条调用链,可以快速发现错误和慢调用的分布特征。此外,支持多种分析视图,如散点图、全链路聚合等,以更直观地展示分析结果。

应用性能实时监控:实时统计应用、接口、主机地址等多维度的调用情况,提供开箱即用的监控大盘和告警规则,以便快速发现应用性能问题。

应用概览:提供应用维度的总体情况,包括请求量、耗时和错误时序曲线变化,以及TopN接口状态等,帮助用户快速了解应用的整体性能。

依赖服务分析:展示接口维度的调用情况,支持对比分析,帮助用户理解服务间的依赖关系和性能瓶颈。

数据库分析:提供数据库SQL调用情况的监控,以便快速治理慢SQL等常见性能问题。

异常分析:查看Exception等异常信息,支持聚合统计和堆栈详情,帮助用户快速定位和解决问题。

全景拓扑:通过动态发现和实时绘制应用或接口的上下游依赖拓扑,帮助用户快速定位性能瓶颈。

智能告警:提供完善的告警能力,支持静态阈值、动态基线类型的告警规则,以及灵活匹配的通知策略与渠道。告警事件的分析与大盘等功能可以帮助用户快速响应业务系统的问题。

通过这一系列的功能,分布式调用链诊断不仅能够提高开发者和运维人员的工作效率,还能显著缩短问题定位和修复的时间,从而提升整个分布式系统的稳定性和性能。