News

梁文锋巨资押注,DeepSeek首轮融资或达500亿,V4.1模型6月亮相

梁文锋巨资押注,DeepSeek首轮融资或达500亿,V4.1模型6月亮相

据报道,DeepSeek首轮融资目标高达500亿元人民币,其中创始人梁文锋个人出资最高达200亿元人民币。如果最终落地,这将是中国大模型公司有史以来最大的一轮融资,而其V4.1模型也计划在6月发布。

DeepSeek的估值在短短三周内经历了剧烈飙升。从4月初启动融资时的约100亿美元,到4月22日超过200亿美元(腾讯、阿里等巨头洽谈投资),再到5月6日约450亿美元(国家集成电路产业投资基金洽谈领投),部分最新报道甚至指出最终估值可能高达500亿美元。

DeepSeek曾以“不融资、不商业化、不路演”的研究优先姿态示人。然而,进入2026年,这种“技术理想主义”模式面临三重现实挑战,促使其进行战略性转向。

首先是算力需求剧增。前沿模型(如推理能力、Agent能力、超长上下文、企业级稳定性)对算力提出更高要求。DeepSeek V4系列已将上下文长度提升至1M,并开始测试视觉模式,这些高级能力在企业级应用中需要持续的算力支持。

其次是顶尖人才竞争。DeepSeek已出现明星研究员流失,如郭达雅、王炳宣、魏浩然等,他们跳槽后获得了更高的薪酬。在当前激烈的AI人才竞争中,仅靠理想主义已不足以完全留住人才,薪酬、股权和未来收益变得至关重要。融资能够为员工期权提供明确估值,使其“与公司共同成长”的愿景更具吸引力。

第三是产品化压力。DeepSeek正开始积极向各行业企业推广模型,希望将技术转化为可收费的产品和服务。这意味着公司需要从仅关注模型指标转变为关注客户、收入、交付、成本和人才结构等商业要素。

这些转向的答案已在DeepSeek V4和V4.1中初现轮廓。V4系列(deepseek-v4-pro和deepseek-v4-flash)于4月24日上线,均支持1M上下文。对企业而言,1M上下文对应的是长文档、长代码库、多轮任务和复杂工作流,再结合工具调用和JSON输出,接入真实业务流程的障碍已基本扫清,这是商业化的基础。

据消息称,DeepSeek计划在6月推出V4.1。新版本将为企业用户提供更多工具,更好地支持行业通用的MCP协议,并计划增加图像和音频的多模态处理能力。融资也正在倒逼其发布节奏,过去DeepSeek可以等到完全满意再发布,但现在公司计划加快发布节奏以更接近行业常规速度。

因此,这轮融资表面是资金,底层却是公司形态的变化。DeepSeek不再只是一个模型研发团队,它开始像一家重资产AI公司转型,其关键词变为算力、数据中心、产品团队、企业客户、期权和发布节奏。这将赋予DeepSeek更强的火力,但也将带来更明确的商业压力。

从AI产业格局看,DeepSeek的定位也随之改变。模型、芯片、国产算力、企业应用,不再是几条平行线,而是在它身上开始交叉。这也解释了为何这轮融资会被外界放大。大模型竞争,正在从轻资产的模型竞赛,进入算力、人才、资本、商业化一起上桌的阶段。尽管融资仍在洽谈中,DeepSeek尚未对相关报道置评,但其战略方向已十分清晰。

↗ 阅读原文