News

DeepSeek-V4重磅发布:百万Token上下文,华为云首发适配

DeepSeek-V4重磅发布:百万Token上下文,华为云首发适配

2026年4月24日,备受期待的DeepSeek-V4模型正式发布并开源,华为云宣布首发适配。DeepSeek-V4在多项关键能力上实现了国内与开源领域的领先,尤其突出的是其百万Token的超长上下文处理能力,以及在AI Agent能力、世界知识和推理性能上的显著提升。

此次发布的DeepSeek-V4模型系列中,DeepSeek-V4-Flash版本备受关注。其参数量优化至284B,不仅显著降低了推理成本,更以更小的模型参数和激活量,提供了更加快捷、经济的API服务,有效推动了百万Token上下文的普惠应用。

华为云MaaS(模型即服务)平台目前已为广大开发者提供了便捷服务,支持免部署、一键调用DeepSeek-V4-Flash API的Tokens服务。为确保此次新模型的快速适配与高性能落地,华为云在系统层、算子层和集群层进行了深度协同,分别从调度效率、计算效率和数据流转效率三个维度进行了全面优化。

针对DeepSeek-V4的独特架构,华为云率先适配了模型分层注意力压缩机制,实现了在V4注意力机制下KVCache的高效分配与管理。同时,华为云还提供了TopK、SWA、CFA等超过10种昇腾高性能融合算子,并结合框架异步调度、MTP(多步投机)等多步投机执行等框架优化,确保了原生百万Token长上下文的高性能推理。

华为云致力于以高效的AI基础设施为核心,打造“硅基黑土地”生态,开放接纳包括自研和第三方主流大模型以及众多智能体。此举旨在帮助企业有效解决难题,显著提升生产效率。据悉,金山办公和360等知名企业已通过华为云接入DeepSeek新模型。此外,DeepSeek-V4-Pro版本也预计将于近日上线,带来更多期待。

↗ 阅读原文