News

谷歌Gemini图像生成升级:融合个人数据,打造专属智能体验

谷歌Gemini图像生成升级:融合个人数据,打造专属智能体验

谷歌已为其Gemini模型的“Personal Intelligence”功能增添了由Nano Banana驱动的图像生成能力。这意味着Gemini现在可以利用用户的Gmail、Google相册、日历、云端硬盘及其他谷歌应用数据来创作图像,使AI生成的内容不仅基于文本提示,更能融入用户个人背景和日常活动。

此功能将首先面向美国的Gemini Plus、Pro和Ultra订阅用户推出,免费用户预计在未来几周内获得访问权限。谷歌计划将其扩展到桌面版Chrome上的Gemini,并推广到更多市场,但值得注意的是,Personal Intelligence的首次全球发布不包含欧洲地区。

Nano Banana是谷歌为Gemini模型系列开发的原生图像生成能力,与谷歌专用的文本转图像产品Imagen有所区别。Imagen侧重于图像质量、迭代速度和专业工作流,而Nano Banana则专为Gemini界面内的对话式图像生成设计,支持文本、图像或两者结合作为输入。

Nano Banana系列目前包含三个版本:最初的Nano Banana基于Gemini 2.5 Flash构建,负责基础的对话式图像生成;Nano Banana 2于2026年2月随Gemini 3.1 Flash发布,它结合了Pro版的先进特性与更快的迭代速度;Nano Banana Pro则基于Gemini 3 Pro,将该模型的完整推理能力和现实世界知识融入图像生成,其产出更能体现对提示的深层理解,而非仅仅停留在表面模式匹配。

谷歌声称,Nano Banana的技术优势在于它能够利用Gemini模型的语言理解能力,捕捉提示中的细微差别,这是独立的图像生成器难以做到的。由于图像生成功能原生集成于Gemini,而非作为独立系统附加,模型在生成图像前可以对用户的意图进行推理,并从对话及现在已加入的个人数据中获取上下文信息。

“Personal Intelligence”是谷歌构建的一个框架,旨在将Gemini与用户的谷歌账户数据连接起来。该功能于2026年1月推出,允许Gemini访问来自Gmail、日历、云端硬盘、Google相册、YouTube、搜索、地图及其他谷歌第一方应用中的文本、照片和视频。此功能是选择性加入的,用户可以控制Gemini访问哪些应用数据,谷歌也明确表示AI不会利用这些个人数据进行模型训练。

↗ 阅读原文