文章作者:王兆洋
文章来源:硅星人Pro
这轮融资最大的误读,是把它当成一家模型公司的融资来看。
三周之内,在公开报道里DeepSeek的估值四次改写:
4月初约100亿美元“启动融资”,4月22日的报道称其估值超过200亿美元,5月6日传出“大基金”洽谈领投,估值约450亿美元,而上周最新传出的估值上限是超500亿美元——若成真,这会是中国AI公司有史以来最大的单轮融资。
而根据报道,此轮融资中最大的一张支票,不是来自VC或互联网巨头,而是来自DeepSeek创始人梁文锋本人:他个人可能出资最高200亿元人民币,占融资总额的40%,据称,他通过增资将直接持股从1%提升至34%,加上间接持股,合计控制约84.29%股权。
而全称国家集成电路产业投资基金的“大基金”,投出过中芯国际、长江存储的半导体产业核心资本,此前从未公开注资大语言模型厂商,一旦本轮融资落地,也将是首次。
DeepSeek过去最鲜明的标签之一就是不融资、不商业化、不路演,因为母公司幻方量化的资金储备一直够用。它商业化方面的主动动作几乎为零,也让这种高估值对比其他模型公司已经挺夸张的“市梦率”时依然显得神奇。
当你把这些事实放在一起,会发现用模型公司的框架解释不了这一次备受关注的融资——为什么估值能在三周翻五倍?为什么大基金会进来?为什么创始人自己出最大那笔钱?
这次融资需要另一套框架才能读懂。
DeepSeek不是又一家“更好的模型公司”,它更像是一家长得像模型公司的基础设施公司。这个定位在这次融资里彻底体现出来。
梁文锋2024年谈到融资时说过一句话:“我们面临的问题从来不是钱,而是高端芯片被禁运。”
模型公司的核心命题是数据、算法、人才,芯片是成本项,不是战略项。把芯片说成核心问题,意味着DeepSeek从第一天起除了思考“怎么把模型做得更好”外,更多注意力就已经放在“怎么在算力受制于人的条件下重建一套能跑起来的东西”。
如果回溯DeepSeek所有最重要的技术创新,从MLA到MoE,从FP8训练到极致推理效率,本质上都是同一个问题的不同解法:怎么用更少、更受限的算力,做出顶级模型。这已经从模型公司的思考方式变为基础设施公司的研发逻辑。
如果DeepSeek不是模型公司,该给它什么定价?参考谁?答案不是Kimi,不是智谱,不是MiniMax。此次传出的融资结构可以给出判断思路。
4月24日,DeepSeek-V4发布,技术报告第一次把华为昇腾NPU和英伟达GPU写进同一份硬件验证清单——“我们在英伟达GPU和华为昇腾NPU两个平台上均验证了细粒度EP方案”,万亿参数级别的模型,第一次在正式文档中完成了对国产AI芯片的官方认定,发布当天,包括华为昇腾、寒武纪在内的8家国产芯片即完成适配,打破了以往需要数月调试的惯例,而为了这一行字,DeepSeek团队过去数月与华为及寒武纪密切合作,一些报道称这也是它专门推迟发布计划的重要原因。它对模型底层进行了大量调整与重写。
而融资就在这期间启动:时间点很有意思,其他公司融资是为了做到某件事,DeepSeek融资是因为某件事已经做到了,而且是以公开可验证的方式做到的,相当于梁文锋用一个模型发布,完成了通常需要几轮会议才能完成的尽职调查。
而接下来的融资里其实有三笔钱,三种逻辑,互不交叉。
大基金——全称国家集成电路产业投资基金,半导体行业最重要的国家级产业资本——历史上的投资对象是中芯国际、长江存储,它投的是”中国不能没有“的半导体基础设施。大基金的使命是补齐半导体制造、设备与材料的硬件短板,大模型公司此前从未进入它的射程。
它此前之所以对投模型公司有顾虑,就是模型的商业回报周期不确定,用投半导体的逻辑投模型说不通。而现在这被DeepSeek用一个动作解开,V4用国产芯片适配证明了它不是一个模型公司,大基金现在可以用另一套语言描述这笔投资了,投的是国产算力生态能不能跑通这个战略节点,用顶尖模型带动国产算力的应用迭代,构建“国产芯片+国产模型”的自主闭环——这件事在它的逻辑里,和投中芯国际是同一类问题。
传言中很可能入股的腾讯等产业资本那部分,则是另一套动机:确保自己不被排除在中国AI基础设施之外,因为如果DeepSeek最终成为那个底层,不在股权结构里意味着身份只能是付费用户,而它带来的不只是钱,是生态入口、企业客户、云资源——恰好是DeepSeek商业化最薄弱的地方。
这也解释了其他同样有基础设施野心的另外几个大厂,可能最终不会入股的原因。DeepSeek已经被视为潜在的基础设施竞争对手,而不只是一家可以入股的模型公司。
这就带来一种“割裂”感:一边锁定国家战略资本,确认基础设施身份;一边引入产业生态资本,打开商业化入口——这两件事在很多时候在很多公司身上会是矛盾的,但从这次融资结构来看,DeepSeek试图让它彼此完全独立运转,互不拖累。
也就是说,DeepSeek的融资之后,商业化进展快慢,和宏大叙事能不能做成,彼此不相干。
大基金那部分对应的是长期命题——算力自主、国产芯片生态,时间周期是五年十年,不需要季度回报;腾讯等产业资本对应的是另一条线,商业化节奏紧跟其他模型公司即可。
在人们讨论它商业化困境的时候,似乎总是忽略一些事实:DeepSeek的API定价已击穿行业底线——V4-Flash缓存命中输入低至0.02元/百万词元,综合成本仅为GPT-5.5的1%左右,推理成本被压到这种地步,让DeepSeek可以保证自己API这门生意本身不亏钱;而a16z最新一版《Top 100 Gen AI Consumer Apps》报告里,DeepSeek依然是跨越了中美用户分布的产品——网页流量在中国(33.5%)、美国(6.6%)之间分布,在模型更新“拖累”了应用迭代的情况下,移动端用户基本盘没有出现外界以为的那种崩塌。这意味着理论上其他模型公司能赚钱的方式它都能跟上,而且边际成本更低。
其实这种割裂,是DeepSeek区别于其他公司的一大特质,是他主动设计出来的,而且从幻方时代就存在。
幻方量化赚钱,DeepSeek做研究,这是它从第一天就运行的结构。幻方不需要DeepSeek给它带来商业回报,DeepSeek不需要向幻方证明自己的ARR增长——这种关系,外人很难找到对应的参照,更接近一家自营交易公司决定把利润投进基础研究:研究本身就是它存在逻辑的一部分,不是一个待变现的项目。
这种割裂依赖的就是梁文锋一个人同时握着两边的方向盘,但其实越往后,这越是脆弱的,它是人格化的,不是结构化的——一旦外部资本进来,平衡被打破的风险第一次真实存在。
所以这次融资在做的反而是把这种依赖个人意志的割裂,第一次变成股权结构里写死的东西。幻方和DeepSeek之间的那种关系,被复制到了一个更大的尺度上:幻方对DeepSeek是第一层割裂,DeepSeek内部商业化对算力基础设施研究是第二层割裂,两层割裂有同一个逻辑和同一个设计者。
因此,此次融资里,在这两笔钱之外,更独特的就是第三笔钱,梁文锋自己的出资。
报道称,梁文锋个人出资最高200亿元人民币,约28亿美元。与之对比,月之暗面Kimi刚完成的这轮融资总额约20亿美元——也就是,梁文锋自己一个人出的钱,已经够匹配大多数模型公司单独一轮融资了。
所以外部那60%进来,不是为了让DeepSeek作为模型公司“活下去”或者“继续训练模型”,幻方的钱够,梁文锋自己的钱也够。每一个外部投资方进来,都是因为DeepSeek不再是个模型公司了。
而这笔个人出资买的是对整个结构的锁定权,无论引入多少外部资本,核心决策不会被稀释。
另外,此次融资此前被外界认为的最大原因是人才流失。但仔细观察后,会发现它的人才流失情况可能被夸大了。
走的人确实重要——王炳宣去了腾讯,郭达雅去了字节跳动Seed,罗福莉被以千万年薪挖至小米,阮翀加入了元戎启行,覆盖基座模型、推理、OCR、多模态四条核心技术主线。
但根据《财经》最近整理的非常详尽的一份数据看,27篇论文出现频率最高的15人里只有2人离职,DeepSeek-LLM发布时的86人,仍有71位出现在V4论文名单中,300人走10个,离职率3.3%——关注AI公司们人才争夺的人会知道这个数值有多低。
期权定价对留人有真实价值,但它是融资顺带解决的问题,做正确的长期的事,连留人这件事也在过程中顺带解决了——这其实是理解DeepSeek所有决策的一个通用逻辑:它从来不为解决眼前的具体问题而行动,但长期的事做成之后,眼前的问题往往也跟着消解。
最后,要彻底理解它的融资和估值逻辑,还有一个重要的话题,就是DeepSeek的竞争对手究竟是谁。
英伟达定义了AI时代算力的游戏规则,所有模型公司——无论中美——都活在这个边界里,而DeepSeek是一家试图重新划定这个边界的公司,V4昇腾适配落地的那一刻,是这个判断第一次被公开验证。DeepSeek最在意的是英伟达。
500亿美元估值,定价的不是当前的模型能力,不是ARR,不是用户规模。全球可比的模型公司:Kimi刚完成的融资投后估值约200亿美元,半年内从43亿美元翻涨近四倍,有真实ARR支撑;Anthropic上一轮投后估值3800亿美元,年化收入已在2026年初突破300亿美元。DeepSeek商业化收入基本为零,估值去到Kimi两倍以上——而且这笔钱里最大的一部分来自半导体国家基金,不是来自押注模型公司未来ARR的成长型VC。
从投资人结构本身就能看出,差价定价的不是商业化预期,是基础设施溢价。
如果DeepSeek做成了它试图做的事——一套不依赖英伟达的前沿AI算力体系,一个以开源为基础的中国AI基础设施——比较对象应该是某个介于星际之门版的OpenAI和英伟达之间、目前还没有被定义过的位置:既做顶级前沿模型,又试图用新方法解决算力基础设施问题,全球找不到第二家这样的公司。
从这个坐标系看,500亿美元破纪录,但还是便宜的。
此次融资,定价的是一件还没有发生的事。这件事能不能发生,取决于梁文锋能不能做成他从第一天就在做的那件事,而从幻方到DeepSeek的整个路径来看,他是一个把长期主义执行得极为彻底的人,做正确且长期的事,很多具体的东西会在过程中自然解决。这轮融资可能是他第一次让外部世界看到这件事完整的轮廓。


