英伟达发布 Nemotron 3.5 护航企业级 AI：多模态多语言安全分类器

在过去两年中，NVIDIA 的内容安全技术栈已经从一个专注于英文的文本分类器，发展成为一个庞大的专用模型家族——每个模型都在不断扩展对新模态、多语言以及推理模式的支持。于 2026 年 3 月发布的 Nemotron 3 Content Safety 首次在单个 4B 参数模型中结合了多模态与多语言能力。而今天，英伟达正式发布了 Nemotron 3.5 Content Safety。该模型实现了这一演进的终极闭环：在单次推理调用中，完美统一了多模态输入、全球化多语言覆盖、自定义企业策略执行以及可审计的推理链。

首先，该模型实现了统一的多模态评估 (Unified Multimodal Evaluation)。此前版本的 Nemotron 3 引入了图像理解，而 Nemotron 3.5 则进一步加深了这种多模态的深度整合。模型能够将用户 Prompt、可选图像以及可选的助手响应（Assistant Response）整合在同一个上下文窗口中进行评估，并对合并后的输入输出连贯的安全判定。这种“三合一”的评估方式有效弥补了多模态安全场景中的常见漏洞——即那些只有在文本和图像结合，或者请求与响应交互时才会显现的安全违规行为，现在可以通过单次前向传播直接捕获。

其次，该模型具备全球化的多语言覆盖 (Global Language Coverage)。Nemotron 3.5 不仅保留了前代模型明确训练过的 12 种核心语言（包括中文、英文、法文、西班牙文、德文、日文、韩文、阿拉伯文、印地文、俄文、葡萄牙文和意大利文），还继承了来自 Gemma 3 基座模型的强大零样本（Zero-shot）泛化能力，覆盖全球约 140 种语言。这意味着，即使在训练数据稀缺的市场（如东南亚、斯堪的纳维亚以及资源较少的非洲语言地区），部署该模型的企业无需进行额外的微调，就能直接受益于基座模型的多语言迁移能力。

此外，最具变革性的架构升级在于支持自定义策略执行 (Custom Policy Enforcement)。与 Nemotron 3 相比，这是 3.5 版本中最显著的升级。在实际的生产部署中，企业很难仅通过单一通用的安全分类标准来运行。例如，医疗健康平台与金融服务聊天机器人、开发者 IDE 工具或儿童教育应用，其面临的安全风险和合规要求截然不同。Nemotron 3.5 允许在输入的同时传入自定义安全策略规范。模型在生成判定结果时，会动态推理并遵循这些自定义策略，而不再完全依赖于预置的静态分类体系。这一举措将此前在 Nemotron Content Safety Reasoning 4B 中引入的技术成果成功扩展到了完整的双语/多模态和多语言场景中。

最后，模型引入了推理轨迹 (Reasoning Traces)，即支持 THINK 模式。这使得安全过滤不再是一个“黑盒”决策，而是提供了可审计的推理步骤，极大地提高了企业安全合规团队的调试效率与信任度。

AgentUpdate 深度解析

随着 AI Agent 从“单轮问答”迈向复杂的“多模态自主决策”，安全边界的定义已被彻底重构。传统的静态内容过滤或后置 API 拦截，在面对 Agent 复杂的多模态交互、动态环境感知和工具调用链时，已显得力不从心。英伟达 Nemotron 3.5 Content Safety 的推出，正是迎合了 AI Agent 时代对“动态安全护栏 (Dynamic Guardrails)”的迫切需求。其最大亮点在于将“自定义策略”与“思维链推理 (THINK 模式)”引入安全层。这使得 Agent 系统能够根据当前执行的具体任务场景（如金融转账与闲聊），动态加载不同的安全准则，并像人类安全员一样论证拦截逻辑。这种可解释、低延迟的多模态安全架构，不仅降低了 Agent 因多模态“幻觉”或“提示词注入”而失控的风险，也为构建符合行业合规、透明可追溯的高阶 AI Agent 生态奠定了坚实的技术底座。

英伟达发布 Nemotron 3.5 护航企业级 AI：多模态多语言安全分类器

推荐阅读

英伟达发布具身智能新工具，打通物理AI与智能体工作流

SpaceX上市估值狂飙 1.77 万亿，xAI 才是其 AI 核心底牌

AI巨头掀IPO狂潮：Anthropic股权可直接买房