中国AI圈很久没有出现让整个投资界集体肾上腺素飙升的时刻了。2026年5月6日,这一刻到了。
多家媒体报道确认,国家集成电路产业投资基金——业内俗称“国家大基金”——正在洽谈领投DeepSeek的首轮外部融资,此轮估值可能达到约450亿美元。同一时间,腾讯、阿里等互联网巨头也被曝正在谈判桌上抢座,而创始人梁文锋本人亦计划以个人名义出资。消息人士对媒体表态谨慎:“双方确实在进行洽谈。但估值还未最终确认。”
从4月22日首次传出融资风声时的200亿美元估值,到5月6日的450亿美元,短短半个月翻了一倍多。这并不是泡沫吹气球,而是DeepSeek在4月24日做了一件关键的事——发布了V4预览版模型。
V4系列包含两个版本:V4-Pro拥有1.6万亿总参数,49B激活参数;V4-Flash为284B参数,13B激活。两款模型均支持1M token上下文,采用全新的混合注意力架构,在1M上下文下单token推理算力仅为V3.2的27%,KV缓存降至10%。这个性能,直接把DeepSeek在Agent能力上推到了开源模型的最佳水平,而推理性能已经对标全球顶级闭源模型。
模型一出来,估值跟着跳涨。但450亿美元这个数字,放在整个AI赛道里到底算什么分量?横向对比一目了然:Kimi母公司月之暗面刚刚完成约20亿美元融资,投后估值突破200亿美元;已上市的两家大模型公司中,MiniMax最新市值约2517亿港元,智谱约4140亿港元。DeepSeek若以450亿美元(约合3065亿元人民币)的估值完成首轮融资,将一举跳过上市流程,直接追平国内第一梯队。
但真正让这次融资与众不同的,不是金额本身,而是谈判桌上的阵容。国家大基金三期注册资本高达3440亿元,此前主投半导体设备、材料和先进制程,从未公开投资过大模型公司。这次破例领投DeepSeek,是一步经过长期铺垫、意义深远的棋。
DeepSeek V4之所以能拿到国家队的背书,根子打在模型对国产AI芯片的深度兼容上。业界已有消息指出,V4的训练框架实现了从英伟达向国产芯片的迁移,部署的是国产算力。当算法能与国产芯片协同跑出接近国际前沿的性能时,过去“有硬件没生态”的死结就被打开了。一位投资人对此一言以蔽之:DeepSeek的低成本训练路线恰好契合了“用算法换算力”的国家战略意图。融资只是序章,真正的看点是通过这笔钱把“模型+芯片”的国产闭环夯实,加速从软件到硬件的全栈协同。
而对梁文锋来说,启动融资也是他创办DeepSeek以来最大的一次理念转向。在此之前,他立了三年“不融资、不上市、不被商业化时间表绑架”的规矩。幻方量化是底气——2025年幻方量化平均收益率高达56.6%,管理规模超700亿元,每年用数亿元利润支撑DeepSeek的研发。
但2025年底到2026年初,变化来了。V4越做越重,模型架构从基础语言模型升级为万亿参数MoE、百万上下文、原生多模态的系统级工程,训练验证复杂度陡然上升。与此同时,核心人才开始流失——AI才女罗福莉被小米挖走,第一代大语言模型核心作者王炳宣转投腾讯,多模态方向核心阮翀和OCR系列魏浩然也相继离开,至少5名关键研发人员出走。一个没有外部融资、没有市场化估值锚点的公司,给员工的期权许诺落不了地,大厂的报价却动辄千万上亿。不融资,抢人都抢不过。
盘和林的分析点到了最核心的层面:幻方不差钱,但AI不是有钱就能一直赢的游戏。DeepSeek需要的是应用生态,需要商业化落地场景,需要能让尖端模型持续变现的产业纵深,而这些单靠量化交易的利润是养活不了的,“一定要引入战略投资者”。
“同时进行融资谈判的潜在投资方还有很多,互联网巨头、国资基金都在列。”消息人士这句话,说明梁文锋手上有得挑。一个从来不融钱的公司,一旦敞开门,资本市场的紧迫感就倒过来了——不是DeepSeek在找钱,是钱在追DeepSeek。
450亿美元这个数字到底贵不贵?如果对标海外——Anthropic最新一轮融资目标估值9000亿美元——DeepSeek还差着一大截。但在全球大模型竞争进入拼落地、拼成本、拼生态的下半场时,钱不投向能打通硬件层与算法层协同创新的公司,还能投向哪里?国家大基金领投的意义,就在于此:它把DeepSeek从一个技术理想主义的极客实验室,正式送上了中国AI产业全栈战略的核心位置。
当“国家队”的资金到位,当腾讯、阿里的生态接口打开,当一个从不向资本弯腰的理想主义者开始主动站到谈判桌前——中国AI竞争的下半场发令枪,已经打响了。最终决定成败的,早已不是模型本身跑分多高,而是谁能率先完成从底层芯片到上层应用的纵向贯通。拿到用户的钱是本事,但能拿到国家级战略资本的首轮信任,这在中国科技创业史上,鲜有先例。