News

AI Agent遥测告别“狂野西部”,Arize与谷歌云共推标准化

AI Agent遥测告别“狂野西部”,Arize与谷歌云共推标准化

现代企业软件堆栈的本质可组合性,为架构设计带来了极大的自由。软件开发者可以充分利用组件化和容器化的逻辑,来创建高度优化的代码部署,这些部署本身还能在跨多云实例的工作负载之间灵活迁移。

如今,AI Agent功能也正在享受类似的高度自由度,但缺乏标准化的AI Agent遥测系统,却使我们面临如同“狂野西部”般的混乱局面。

在生产环境中,开发者们正赋予Agent调用多个系统工具的能力、连接各种AI模型(无论是语言、视觉模型,还是大型、小型模型)的能力,甚至还能“优化”用户请求,并将工作移交给其他领域特定的Agent。

这对系统适应性而言无疑是好消息,但对于Agent遥测来说,却预示着一场潜在的噩梦。

正如Arize的Richard Young所说:“当你使用OpenTelemetry和OpenInference这样的标准时,你可以在不失去可见性的前提下,保持可选性……即使堆栈发生变化,追踪格式也能保持一致。”

为何Agent遥测至关重要

在更广阔的可观测性范畴内,这种级别的遥测能够让软件工程师清楚地了解Agent的存在位置、它们被授权连接哪些系统,以及它们执行了哪些操作。

AI Agent工程公司Arize的合作伙伴解决方案架构技术总监Richard Young指出,Agent遥测的挑战并非在于集成点是否存在,他认为“重要的部分是可移植性”,这不仅适用于Agent本身,也适用于我们用来衡量它们的遥测标准。

Young在他的组织博客中写道:“当你使用OpenTelemetry和OpenInference等标准时,你可以在不失去可见性的前提下,保留可选性。标准化的Agent遥测允许你更改框架、模型、工具或观测后端,而无需每次都重新构建你的仪表化。即使堆栈发生变化,追踪格式也能保持一致。”

在Young看来,真正的故事并非简单的点对点集成,而是推动Agent迈向一个共享遥测模型。

谷歌云与Arize AI的合作

在谷歌云上月推出Gemini企业Agent平台后,Arize正在与谷歌云展开合作。Arize AX企业Agent开发平台不仅接收来自Gemini Agent服务的追踪(软件执行事件历史的时间记录),还将Agent遥测与OpenTelemetry和OpenInference对齐。这样做是为了确保软件工程团队能够一次性仪表化Agent,持续分析其行为,并避免将关键的观测数据锁定在单一平台中。

云资源优化公司EfficientEther的首席执行官Ryan Mangan告诉The New Stack,在任何实时生产软件部署中,“你看不到的东西就无法操作”,对于Agent来说更是如此。

一次Agent运行可能包括请求重写、检索、多次工具和模型调用、重试以及任务移交,所有这些步骤都需要强大的、标准化的遥测,才能实现有效的管理和调试。

↗ 阅读原文