News

谷歌Gemma 4模型家族发布,首次采用Apache 2.0许可证

谷歌Gemma 4模型家族发布,首次采用Apache 2.0许可证

谷歌正式发布了Gemma 4,这是其迄今为止最强大的开放模型家族。Gemma 4的四款新模型可以运行在从智能手机到工作站的各种设备上,并且首次以完全开放的Apache 2.0许可证发布。

这些模型基于谷歌专有模型Gemini 3的相同技术构建,并采用商业友好的Apache 2.0许可证发布,赋予开发者对其数据、基础设施和模型的完全控制权。此前的Gemma版本采用的是限制性更强的谷歌专有许可证。

谷歌表示,所有Gemma 4模型在多步推理和数学任务上均有显著改进。对于智能体(agentic)工作流,它们原生支持函数调用、结构化JSON输出和系统指令,这使得自主智能体能够利用各种工具和API。

Gemma 4模型家族涵盖了从边缘设备到工作站的四种尺寸:Effective 2B (E2B)、Effective 4B (E4B)、一个26B混合专家(MoE)模型和一个31B密集(Dense)模型。这四款模型都超越了简单的聊天功能,能够处理复杂的逻辑和智能体工作流。

模型Active parameters架构上下文窗口目标硬件离线操作视觉输入音频输入消费级GPU量化Arena AI 排名 (开放)特殊功能
E2B“有效” 20亿-128K tokens智能手机, Raspberry Pi, Jetson Orin Nano--边缘设备计算和内存效率高
E4B“有效” 40亿-128K tokens智能手机, Raspberry Pi, Jetson Orin Nano--边缘设备计算和内存效率高
26B MoE38亿 activeMoE高达 256K tokens个人电脑, 消费级GPU (量化), 工作站, 加速器-#6优化延迟, 38亿 active parameters, 快速token生成
31B Dense-Dense高达 256K tokens个人电脑, 消费级GPU (量化), 工作站, 加速器-#3最高质量, 微调基础

目前,在Arena AI文本排行榜上,31B模型位列全球所有开放模型的第3位,而26B MoE模型排名第6。谷歌表示,Gemma 4的性能超越了其体积20倍的模型。对于开发者而言,这意味着在显著降低硬件要求的同时,获得高性能的结果。

基准Gemma 4 31B IT ThinkingGemma 4 26B A4B IT ThinkingGemma 4 E4B IT ThinkingGemma 4 E2B IT ThinkingGemma 3 27B IT
Arena AI (文本) (截至 24/2/6)14521441--1365
MMLU (多语言问答) (无工具)85.2%82.6%69.4%60.0%67.6%
MMMU Pro (多模态推理)76.9%73.8%52.6%44.2%49.7%
AIME 2026 (数学) (无工具)89.2%88.3%42.5%37.5%20.8%
LiveCodeBench v6 (编程竞赛)80.0%77.1%52.0%44.0%29.1%
GPQA Diamond (科学知识) (无工具)84.3%82.3%58.6%43.4%42.4%
τ2-bench (智能体工具使用) (零售)86.4%85.5%57.5%29.4%6.6%

两个较大的模型主要面向工作站和服务器。31B模型的未量化bfloat16权重可以部署在单个80 GB NVIDIA H100 GPU上,这为本地高性能部署提供了可能。

↗ 阅读原文