在最新一届的 Google I/O 大会上,谷歌展示了其全线产品 AI 化的最新进展。目前,Gemini 官方应用月活跃用户已突破 9 亿,每月 Token 处理量达 3200 万亿。谷歌正在将 Gemini 从一个单一的应用,转变为贯穿其整个生态系统(包括搜索、Chrome、开发工具和眼镜硬件)的核心 AI 底层能力。
此次发布会的核心看点聚焦于多模态与 Agent(智能体)生态。首先亮相的是 Gemini Omni。DeepMind 团队将其定义为“通往世界模型”的关键一步。它不仅能进行多模态生成,还能理解重力、动能等物理规律。在演示中,用户只需通过简单指令,即可将抽象的“蛋白质折叠”概念生成高质量的黏土动画,甚至能通过对话式交互对视频进行深度编辑,将普通画面转化为极具戏剧感的视觉效果。目前,Gemini Omni Flash 已上线,Omni Pro 也将在未来推出。
在开发者生态方面,谷歌推出了主打高速度、低成本和强执行力的 Gemini 3.5 Flash。该模型专门针对 Agentic Coding(智能体编程)和长周期任务进行了优化。在输出速度上,3.5 Flash 比其他前沿模型快 4 倍,在特定优化环境下甚至可达 12 倍。同时,其代码处理能力和逻辑推理能力较前代有显著提升。
配合该模型的发布,开发平台 Antigravity 2.0 迎来了颠覆性升级。它从一个辅助编码的 IDE 升级为了一个“Agent 优先”的独立桌面应用。通过全新集成的 CLI、SDK 以及多 Agent 协同系统,开发者可以实现完全自主的开发流。发布会展示了一个惊人的案例:由 93 个子 Agent 并行协作,在 12 小时内发起 1.5 万次模型请求(消耗约 26 亿 Token),从零构建了一个可以运行 Doom 游戏和 SL 小火车的完整操作系统,而 API 成本不到 1000 美元。
最后,谷歌重构了 AI 搜索体验。除了将搜索框升级至 Gemini 3.5、实现多模态输入和多轮对话无缝衔接外,谷歌还推出了 Search Agents(搜索智能体)。用户可以创建专属的常驻 Agent,用于长期跟踪特定条件的信息(如监控特定财务指标的生物科技股、租房房源或潮流单品)。一旦条件触发,Agent 将自动推送整合后的报告。此外,搜索还能针对复杂科学问题直接生成交互式界面。
【AgentUpdate 深度解析】 此次 Google I/O 释放了一个明确的信号:AI 正在从“辅助工具(Copilot)”时代全面跨入“自主 Agent”时代。Antigravity 2.0 展示的 93 个 Agent 协同构建操作系统的案例,是多智能体系统(Multi-Agent System)在复杂软件工程中落地的里程碑。这证明了当推理成本(如 Gemini 3.5 Flash 所示)大幅下降、速度指数级提升后,大规模 Agent 涌现和容错性设计在商业上已具备可行性。同时,Search Agents 的推出打破了传统“搜索-呈现”的单向交互,转变为“委托-监听-反馈”的主动服务模式。这表明,未来的 AI 竞争不再只是基座模型参数的军备竞赛,而是谁能更早、更稳固地构建起能够执行复杂真实世界任务的 Agent 生态网络。