在最新一期的 Last Week in AI 播客中,主持人们深入探讨了近期 AI 领域的爆发式进展,其中谷歌 I/O 2026 大会无疑是绝对的主角。谷歌正式发布了新一代 AI 模型 Gemini 3.5(重点强调了主打极速与基准测试优势的 3.5 Flash),以及常驻型 AI 智能体 Gemini Spark。Spark 运行在 Google Cloud 上,原生支持模型上下文协议(MCP)工具,标志着谷歌全面拥抱开放的智能体生态。此外,谷歌还展示了多模态视频生成与编辑模型 Gemini Omni,可将图像、音频和文本无缝转化为视频。其他更新还包括 Antigravity 2.0(包含更新的桌面端和 CLI 工具)、专为科学研究工作流设计的 Gemini 工具,以及能利用街景(Street View)和 Waymo 模拟数据重建真实街景的 Genie 世界模型。
在代码智能体(Coding Agent)领域,竞争已进入白热化。Cursor 推出 Composer 2.5,该版本基于月之暗面(Moonshot)的 Kimi K2.5 进行微调,能以极低的成本匹配 Claude 4.7 和 GPT-5.5 的基准测试水平。与此同时,xAI 紧随其后推出了 Grok Build 的早期版本。播客中还探讨了 Cursor 与 xAI 潜在的合作关系,以及 xAI 面临的人才流失和算力利用率瓶颈问题。
商业与法律层面同样波澜不断。埃隆·马斯克因超出诉讼时效而输掉了针对 OpenAI 的诉讼。同时,OpenAI 与苹果的合作关系被曝出现裂痕,可能引发潜在的法律纠纷。在管理层震荡中,Greg Brockman 正式接管 OpenAI 的产品部门。而竞争对手 Anthropic 则表现强劲,不仅同意了一笔 300 亿美元的融资协议(估值高达 9000 亿美元),预测迎来首个盈利季度,还成功吸引了 OpenAI 联合创始人 Andrej Karpathy 加入其预训练团队。此外,芯片独角兽 Cerebras 在 IPO 中股价飙升约 90%。
在前沿研究与安全领域,OpenAI 成功攻克了一个拥有 80 年历史的埃尔德什(Erdős)几何难题。研究人员还揭示了训练中存在的“否定忽视”(negation neglect)现象,以及可解释性研究中发现的单项能力对应多个冗余电路的特征。在安全保障方面,针对智能体的基准测试(如 Terminal World)纷纷涌现,《下架法案》(Take It Down Act)强化了对深度伪造的打击,而关于 AI 自主黑客攻击和自我复制能力的演示,也再次引发了业界对 AI 快速提升的网安能力的担忧。
【AgentUpdate 深度解析】 谷歌 Gemini Spark 对 MCP(Model Context Protocol)的原生支持,是 AI Agent 生态走向标准化与互操作性的里程碑事件。在此之前,各家智能体工具生态碎片化严重,而谷歌作为巨头的入局,将加速 MCP 成为行业通行的“智能体 USB 接口”。同时,Cursor Composer 2.5 与 xAI Grok Build 的硬核对决,预示着代码智能体已从单纯的“API 搬运工”演变为深度理解上下文、自主解决复杂系统级工程的端到端协作者。未来,AI Agent 的核心竞争力将不再局限于基础大模型的能力,而在于其与云端基础设施、标准化协议以及多模态现实世界仿真(如 Genie 世界模型)的深度融合能力。这不仅会重塑开发者工具链,更将构建起一个无缝连接物理世界与数字空间的全新智能体经济体。