SOURCE // NEWS

英伟达发布 Nemotron 3.5 护航企业级 AI:多模态多语言安全分类器

英伟达发布 Nemotron 3.5 护航企业级 AI:多模态多语言安全分类器

在过去两年中,NVIDIA 的内容安全技术栈已经从一个专注于英文的文本分类器,发展成为一个庞大的专用模型家族——每个模型都在不断扩展对新模态、多语言以及推理模式的支持。于 2026 年 3 月发布的 Nemotron 3 Content Safety 首次在单个 4B 参数模型中结合了多模态与多语言能力。而今天,英伟达正式发布了 Nemotron 3.5 Content Safety。该模型实现了这一演进的终极闭环:在单次推理调用中,完美统一了多模态输入、全球化多语言覆盖、自定义企业策略执行以及可审计的推理链。

首先,该模型实现了统一的多模态评估 (Unified Multimodal Evaluation)。此前版本的 Nemotron 3 引入了图像理解,而 Nemotron 3.5 则进一步加深了这种多模态的深度整合。模型能够将用户 Prompt、可选图像以及可选的助手响应(Assistant Response)整合在同一个上下文窗口中进行评估,并对合并后的输入输出连贯的安全判定。这种“三合一”的评估方式有效弥补了多模态安全场景中的常见漏洞——即那些只有在文本和图像结合,或者请求与响应交互时才会显现的安全违规行为,现在可以通过单次前向传播直接捕获。

其次,该模型具备全球化的多语言覆盖 (Global Language Coverage)。Nemotron 3.5 不仅保留了前代模型明确训练过的 12 种核心语言(包括中文、英文、法文、西班牙文、德文、日文、韩文、阿拉伯文、印地文、俄文、葡萄牙文和意大利文),还继承了来自 Gemma 3 基座模型的强大零样本(Zero-shot)泛化能力,覆盖全球约 140 种语言。这意味着,即使在训练数据稀缺的市场(如东南亚、斯堪的纳维亚以及资源较少的非洲语言地区),部署该模型的企业无需进行额外的微调,就能直接受益于基座模型的多语言迁移能力。

此外,最具变革性的架构升级在于支持自定义策略执行 (Custom Policy Enforcement)。与 Nemotron 3 相比,这是 3.5 版本中最显著的升级。在实际的生产部署中,企业很难仅通过单一通用的安全分类标准来运行。例如,医疗健康平台与金融服务聊天机器人、开发者 IDE 工具或儿童教育应用,其面临的安全风险和合规要求截然不同。Nemotron 3.5 允许在输入的同时传入自定义安全策略规范。模型在生成判定结果时,会动态推理并遵循这些自定义策略,而不再完全依赖于预置的静态分类体系。这一举措将此前在 Nemotron Content Safety Reasoning 4B 中引入的技术成果成功扩展到了完整的双语/多模态和多语言场景中。

最后,模型引入了推理轨迹 (Reasoning Traces),即支持 THINK 模式。这使得安全过滤不再是一个“黑盒”决策,而是提供了可审计的推理步骤,极大地提高了企业安全合规团队的调试效率与信任度。

AgentUpdate 深度解析

随着 AI Agent 从“单轮问答”迈向复杂的“多模态自主决策”,安全边界的定义已被彻底重构。传统的静态内容过滤或后置 API 拦截,在面对 Agent 复杂的多模态交互、动态环境感知和工具调用链时,已显得力不从心。英伟达 Nemotron 3.5 Content Safety 的推出,正是迎合了 AI Agent 时代对“动态安全护栏 (Dynamic Guardrails)”的迫切需求。其最大亮点在于将“自定义策略”与“思维链推理 (THINK 模式)”引入安全层。这使得 Agent 系统能够根据当前执行的具体任务场景(如金融转账与闲聊),动态加载不同的安全准则,并像人类安全员一样论证拦截逻辑。这种可解释、低延迟的多模态安全架构,不仅降低了 Agent 因多模态“幻觉”或“提示词注入”而失控的风险,也为构建符合行业合规、透明可追溯的高阶 AI Agent 生态奠定了坚实的技术底座。