AI Agent遥测告别“狂野西部”，Arize与谷歌云共推标准化

现代企业软件堆栈的本质可组合性，为架构设计带来了极大的自由。软件开发者可以充分利用组件化和容器化的逻辑，来创建高度优化的代码部署，这些部署本身还能在跨多云实例的工作负载之间灵活迁移。

如今，AI Agent功能也正在享受类似的高度自由度，但缺乏标准化的AI Agent遥测系统，却使我们面临如同“狂野西部”般的混乱局面。

在生产环境中，开发者们正赋予Agent调用多个系统工具的能力、连接各种AI模型（无论是语言、视觉模型，还是大型、小型模型）的能力，甚至还能“优化”用户请求，并将工作移交给其他领域特定的Agent。

这对系统适应性而言无疑是好消息，但对于Agent遥测来说，却预示着一场潜在的噩梦。

正如Arize的Richard Young所说：“当你使用OpenTelemetry和OpenInference这样的标准时，你可以在不失去可见性的前提下，保持可选性……即使堆栈发生变化，追踪格式也能保持一致。”

为何Agent遥测至关重要

在更广阔的可观测性范畴内，这种级别的遥测能够让软件工程师清楚地了解Agent的存在位置、它们被授权连接哪些系统，以及它们执行了哪些操作。

AI Agent工程公司Arize的合作伙伴解决方案架构技术总监Richard Young指出，Agent遥测的挑战并非在于集成点是否存在，他认为“重要的部分是可移植性”，这不仅适用于Agent本身，也适用于我们用来衡量它们的遥测标准。

Young在他的组织博客中写道：“当你使用OpenTelemetry和OpenInference等标准时，你可以在不失去可见性的前提下，保留可选性。标准化的Agent遥测允许你更改框架、模型、工具或观测后端，而无需每次都重新构建你的仪表化。即使堆栈发生变化，追踪格式也能保持一致。”

在Young看来，真正的故事并非简单的点对点集成，而是推动Agent迈向一个共享遥测模型。

谷歌云与Arize AI的合作

在谷歌云上月推出Gemini企业Agent平台后，Arize正在与谷歌云展开合作。Arize AX企业Agent开发平台不仅接收来自Gemini Agent服务的追踪（软件执行事件历史的时间记录），还将Agent遥测与OpenTelemetry和OpenInference对齐。这样做是为了确保软件工程团队能够一次性仪表化Agent，持续分析其行为，并避免将关键的观测数据锁定在单一平台中。

云资源优化公司EfficientEther的首席执行官Ryan Mangan告诉The New Stack，在任何实时生产软件部署中，“你看不到的东西就无法操作”，对于Agent来说更是如此。

一次Agent运行可能包括请求重写、检索、多次工具和模型调用、重试以及任务移交，所有这些步骤都需要强大的、标准化的遥测，才能实现有效的管理和调试。

AI Agent遥测告别“狂野西部”，Arize与谷歌云共推标准化

为何Agent遥测至关重要

谷歌云与Arize AI的合作

相关工具与资源推荐

相关技能市场

Matt Pocock's AI Skills

推荐插件

Opik