谷歌Gemini图像生成升级：融合个人数据，打造专属智能体验

谷歌已为其Gemini模型的“Personal Intelligence”功能增添了由Nano Banana驱动的图像生成能力。这意味着Gemini现在可以利用用户的Gmail、Google相册、日历、云端硬盘及其他谷歌应用数据来创作图像，使AI生成的内容不仅基于文本提示，更能融入用户个人背景和日常活动。

此功能将首先面向美国的Gemini Plus、Pro和Ultra订阅用户推出，免费用户预计在未来几周内获得访问权限。谷歌计划将其扩展到桌面版Chrome上的Gemini，并推广到更多市场，但值得注意的是，Personal Intelligence的首次全球发布不包含欧洲地区。

Nano Banana是谷歌为Gemini模型系列开发的原生图像生成能力，与谷歌专用的文本转图像产品Imagen有所区别。Imagen侧重于图像质量、迭代速度和专业工作流，而Nano Banana则专为Gemini界面内的对话式图像生成设计，支持文本、图像或两者结合作为输入。

Nano Banana系列目前包含三个版本：最初的Nano Banana基于Gemini 2.5 Flash构建，负责基础的对话式图像生成；Nano Banana 2于2026年2月随Gemini 3.1 Flash发布，它结合了Pro版的先进特性与更快的迭代速度；Nano Banana Pro则基于Gemini 3 Pro，将该模型的完整推理能力和现实世界知识融入图像生成，其产出更能体现对提示的深层理解，而非仅仅停留在表面模式匹配。

谷歌声称，Nano Banana的技术优势在于它能够利用Gemini模型的语言理解能力，捕捉提示中的细微差别，这是独立的图像生成器难以做到的。由于图像生成功能原生集成于Gemini，而非作为独立系统附加，模型在生成图像前可以对用户的意图进行推理，并从对话及现在已加入的个人数据中获取上下文信息。

“Personal Intelligence”是谷歌构建的一个框架，旨在将Gemini与用户的谷歌账户数据连接起来。该功能于2026年1月推出，允许Gemini访问来自Gmail、日历、云端硬盘、Google相册、YouTube、搜索、地图及其他谷歌第一方应用中的文本、照片和视频。此功能是选择性加入的，用户可以控制Gemini访问哪些应用数据，谷歌也明确表示AI不会利用这些个人数据进行模型训练。

谷歌Gemini图像生成升级：融合个人数据，打造专属智能体验

推荐阅读

Anthropic发布Claude Opus 4.7：编程与智能体性能领跑基准

Claude要用户验证身份？Anthropic启用Persona引争议

Next.js渲染策略如何影响SEO索引：工程师指南

相关工具与资源推荐

相关技能市场

Matt Pocock's AI Skills