在周二举行的年度谷歌 I/O 2026 大会上,谷歌宣布为其 Gemini 应用推出一系列重磅更新。其中包括全新的“每日简报”(Daily Brief)功能、彻底重构的设计界面、名为 Gemini Omni 的全新 AI 视频模型,以及名为 Gemini Spark 的全新个人 AI 智能体(Agent)。
这些更新标志着谷歌正全力将 Gemini 从一个单纯的聊天机器人,转型为多功能的通用 AI 中心(AI Hub),以此增强其与 ChatGPT 和 Claude 等竞品的竞争力。
谷歌将新的“每日简报”功能描述为个性化的每日摘要,旨在成为用户每天早晨的第一站。它能够从用户的收件箱、日历和最重要任务中提取信息,并将其整理成清晰的全局概览。谷歌强调,Daily Brief 不仅能提炼信息,还能对任务进行优先级排序并建议下一步行动,最关键的事项将被置顶展示。该功能目前已面向美国的 Google AI 订阅用户推出。
目前 Gemini 应用已拥有极其庞大的用户基础。谷歌透露,该应用月活跃用户已突破 9 亿,覆盖 230 多个国家,支持 70 多种语言。尽管如此,谷歌显然希望在维系老用户的同时吸引更多新用户。
为此,谷歌从底层重构了该应用。新版应用采用了被称为“神经网络表现力”(Neural Expressive)的设计语言,带来了流畅的动画、鲜活的色彩、全新的排版以及触觉反馈。此外,Gemini 的回答不再是大多数 AI 聊天机器人常见的那种“文字墙”,而是将关键信息加粗置于顶部,随着用户向下滑动,才会呈现更多文本、图像和时间线等细节元素。
在个人智能体方面,谷歌推出了 Gemini Spark。谷歌将其定义为可以 24 小时协助用户打理数字生活的个人 AI 智能体。Spark 让 Gemini 从一个被动的助手转变为能够代表用户执行实际工作的主动合作伙伴。由于 Spark 运行在云端,即使在手机锁屏状态下,它也能在后台持续工作。通过 Gemini Spark,用户将能够在 Gemini 应用中构建专属的自定义工作流。该功能目前处于测试阶段,预计下周向 Google AI Ultra 订阅用户开放。
同时亮相的还有全新 AI 视频模型 Gemini Omni。它将 Gemini 的多模态能力与谷歌的生成式媒体模型相结合,能够生成基于事实知识的高质量视频。用户只需输入类似“用粘土动画解释蛋白质折叠”的简单提示词,并上传音频、图像或视频,模型即可输出具有连贯性的高品质视频。该模型正在逐步推送到 Google Flow 和 YouTube Shorts,供 Google AI 订阅用户使用。
【AgentUpdate 深度解析】谷歌此次推出的 Gemini Spark 标志着消费级 AI Agent 迈出了关键一步:从“前台交互式对话”向“后台异步自主执行”演进。Spark 依托云端运行、锁屏不中断的特性,彻底打破了传统 App 必须保持活跃的限制,这正是 Agent 迈向全时在线(Always-on)实体的底层范式转移。横向对比来看,这比 ChatGPT 目前需要用户主动唤醒的交互模式更具主动性,而相比 Claude 的 Computer Use 方案,Spark 更偏向轻量化的个人流协同。然而,Google 真正的野心在于利用其庞大的 Android 生态与 Workspace 账户体系建立天然的 Agent 护城河。一旦 Spark 深度打通系统级 API 与底层服务,其构建出的“云端个人主动代理”将极大地压缩第三方垂直 Agent 应用的生存空间。对于开发者而言,如何在巨头的 OS 级 Agent 缝隙中寻找高壁垒的场景,将成为下一阶段 AI 创业的残酷考验。