微软MAI-Image-2.5追平谷歌Nano Banana 2，文生图性能新突破

微软对其MAI图像模型进行了更新，推出了MAI-Image-2.5。据MAI团队称，该模型目前在Arena的文生图排行榜上名列第三，这表明其性能已与谷歌的Nano Banana 2持平，尽管仍与OpenAI的Image-2存在一定差距。

微软称MAI-Image-2.5是迄今为止最强大的MAI图像模型，在文本渲染、风格化插画和商业视觉效果方面相对于MAI-Image-2取得了显著进步。据介绍，新模型能更紧密地遵循用户提示，并生成更一致的光照、景深和空间关系。微软正积极将其推广用于专业应用场景，例如产品摄影和品牌设计。

根据Arena的排名数据，MAI-Image-2.5在前代模型的基础上，在所有八个类别中均表现出明显优势，尤其在文本渲染、肖像和商业主题方面表现突出。

MAI-Image-2.5现已在Arena平台上线，并预计将在两周内推广到MAI Playground和Foundry平台。

【AgentUpdate 深度解析】 微软MAI-Image-2.5的发布及其在文生图基准测试中追平谷歌Nano Banana 2的表现，不仅彰显了其在图像生成技术上的飞跃，更预示着AI Agent生态系统在视觉交互和内容创作方面将迎来质的提升。当前，以Stable Diffusion、Midjourney和DALL-E 3为代表的图像生成模型正在迅速进化，MAI-Image-2.5的入局无疑加剧了市场竞争，并将技术标准推向新高。对于AI Agent而言，这意味着它们不再仅仅停留在文本理解和生成层面，而能更高效、更精准地实现“所思即所见”。未来，AI Agent将能够充当专业的“视觉设计师”或“创意总监”，无论是为品牌生成高度定制化的广告图像，为报告自动配图，还是在虚拟世界中实时构建场景，都将变得触手可及。这种能力将极大拓展AI Agent的应用边界，使其能够深入到更多依赖视觉表达的专业领域，例如建筑设计、时尚趋势预测、游戏内容生产等。同时，它也对Agent的决策能力提出了更高要求，即如何根据复杂的用户意图和上下文，智能地选择并组合这些强大的视觉生成能力。可以预见，随着图像生成模型与多模态Agent技术的深度融合，我们将迎来一个视觉驱动的、更加智能和自主的AI Agent时代。

微软MAI-Image-2.5追平谷歌Nano Banana 2，文生图性能新突破

推荐阅读

Meta AI聊天机器人推出付费订阅服务

谷歌员工涉嫌利用内部数据在预测市场获利120万美元被控欺诈

机器人迈向“ChatGPT时刻”？中国AI投资与挑战

相关工具与资源推荐

相关技能市场

Antigravity Awesome Skills

Awesome Agent Skills

Anthropic Agent Skills