⚡ News

谷歌I/O最强发布:Gemini API 托管Agent运行时正式亮相

谷歌I/O最强发布:Gemini API 托管Agent运行时正式亮相

每一届 Google I/O 都有其引人瞩目的焦点。更快的模型、更炫酷的 Demo、以及让开发者既兴奋又焦虑的新功能。在 Google I/O 2026 上,这样的时刻同样层出不穷:Gemini 3.5 Flash 展现了强劲的基准测试性能,WebMCP 给开放 Web 社区带来了野心勃勃的讨论议题,而 AI Studio、Chrome、搜索和 Gemini 本身也都在向 Agent(智能体)领域深度迈进。

然而,对于开发者而言,最重要的一项发布却并不是声量最高的那一个。那就是 Gemini API 中的托管 Agent(Managed Agents)

这听起来可能没有新模型那么光鲜亮丽,但这也恰恰是其重要性所在。如果说模型是引擎,那么托管 Agent 就是底盘、变速箱、仪表盘、维修团队和紧急制动器。正是这套运行时(Runtime)系统,将“模型能够进行推理和使用工具”的理论,转化为了“我的应用程序可以要求 Agent 执行具体工作、观察其行为、保留状态、收集中间产物并在此基础上继续运行”的工程现实。这是一种截然不同的产品,对开发者来说,可能也是更重要的一个。

真正的瓶颈从来不是智力。在过去几年中,Agent 的 Demo 演示总是遵循着一套陈旧的套路:模型接收任务、调用所需工具、规划并编写代码、运行代码并检查结果,最后自我纠错。每个人看后都点头称赞。然而,当开发者试图在生产环境中构建相同的功能时,立刻就会撞上真正的工程壁垒。

难点不仅在于让模型“思考”,更在于给它一个“工作的场所”。一个真正实用的 Agent 需要一个运行时系统——它需要沙箱、文件系统、工具边界、内存或状态管理。它需要可观测的中间执行步骤,以及对网络访问、凭证安全、成本开销和资源清理的精细控制,更不用说还需要保证开发者的易用性,避免每个团队都去从零重复构建相同的编排层。这正是托管 Agent 试图填补的空白。

谷歌的这一发布并不仅仅是声明“Gemini 可以使用工具”,更本质的突破在于:谷歌将 Agent 循环(Agent Loop)本身包装成了一个托管的开发者原语(Primitive)。通过托管 Agent,代号为 Antigravity(反重力)的托管 Agent 可以在谷歌托管的 Linux 环境中运行,执行代码、管理文件、访问网页、保持环境状态,并通过 Interactions API 返回可观测的执行轨迹。这彻底改变了开发者的工作流:你不再需要自己去构建复杂的运行时,而是可以直接基于托管的 Agent 环境,将精力集中在围绕其构建的产品边界上。

在 I/O 2026 上,谷歌在 Gemini API 中推出了托管 Agent 服务的公开预览版,率先提供了名为 Antigravity 的 Agent 体验。该 Agent 由 Gemini 3.5 Flash 驱动,并通过 Interactions API 和 Google AI Studio 向外输出。这套托管服务提供了安全隔离的 Linux 代码执行环境、持久化的文件和状态管理能力,以及精细化的网络 and API 权限控制,极大降低了构建生产级 Agent 的门槛。

【AgentUpdate 深度解析】谷歌推出托管 Agent 标志着 AI 生态正从“模型即服务(MaaS)”向“运行时即服务(RaaS)”演进。此前,开发者需依赖 LangChain 等框架自建沙箱与状态机,面临极高的安全与运维门槛。谷歌将运行时直接下沉至基础设施层,提供安全 Linux 沙箱与状态保持,直接对标 OpenAI Assistants API。此举不仅大幅降低了企业级 Agent 的落地门槛,也将倒逼整个 AI 中间件生态重新思考自身定位。未来,Agent 生态的竞争重点将不仅是模型智能,更是运行时的安全、低延迟与高可观测性。

↗ 阅读原文