文章作者：王兆洋文章来源：硅星人Pro 这轮融资最大的误读，是把它当成一家模型公司的融资来看。三周之内，在公开报道里DeepSeek的估值四次改写： 4月初约100亿美元“启动融资”，4月22日的报道称其估值超过200亿美元，5月6日传出“大基金”洽谈领投，估值约450亿美元，而上周最新传出的估值上限是超500亿美文章作者：王兆洋文章来源：硅星人Pro 这轮融资最大的误读，是把它当成一家模型公司的融资来看。三周之内，在公开报道里DeepSeek的估值四次改写： 4月初约100亿美元“启动融资”，4月22日的报道称其估值超过200亿美元，5月6日传出“大基金”洽谈领投，估值约450亿美元，而上周最新传出的估值上限是超500亿美

究竟该如何给DeepSeek估值

来源：MetaEra

2026/05/11 10:50

阅读时长 19 分钟

如需对本内容提供反馈或相关疑问，请通过邮箱 crypto.news@mexc.com 联系我们。

文章作者：王兆洋

文章来源：硅星人Pro

这轮融资最大的误读，是把它当成一家模型公司的融资来看。

三周之内，在公开报道里DeepSeek的估值四次改写：

4月初约100亿美元“启动融资”，4月22日的报道称其估值超过200亿美元，5月6日传出“大基金”洽谈领投，估值约450亿美元，而上周最新传出的估值上限是超500亿美元——若成真，这会是中国AI公司有史以来最大的单轮融资。

而根据报道，此轮融资中最大的一张支票，不是来自VC或互联网巨头，而是来自DeepSeek创始人梁文锋本人：他个人可能出资最高200亿元人民币，占融资总额的40%，据称，他通过增资将直接持股从1%提升至34%，加上间接持股，合计控制约84.29%股权。

而全称国家集成电路产业投资基金的“大基金”，投出过中芯国际、长江存储的半导体产业核心资本，此前从未公开注资大语言模型厂商，一旦本轮融资落地，也将是首次。

DeepSeek过去最鲜明的标签之一就是不融资、不商业化、不路演，因为母公司幻方量化的资金储备一直够用。它商业化方面的主动动作几乎为零，也让这种高估值对比其他模型公司已经挺夸张的“市梦率”时依然显得神奇。

当你把这些事实放在一起，会发现用模型公司的框架解释不了这一次备受关注的融资——为什么估值能在三周翻五倍？为什么大基金会进来？为什么创始人自己出最大那笔钱？

这次融资需要另一套框架才能读懂。

DeepSeek不是又一家“更好的模型公司”，它更像是一家长得像模型公司的基础设施公司。这个定位在这次融资里彻底体现出来。

1

梁文锋2024年谈到融资时说过一句话：“我们面临的问题从来不是钱，而是高端芯片被禁运。”

模型公司的核心命题是数据、算法、人才，芯片是成本项，不是战略项。把芯片说成核心问题，意味着DeepSeek从第一天起除了思考“怎么把模型做得更好”外，更多注意力就已经放在“怎么在算力受制于人的条件下重建一套能跑起来的东西”。

如果回溯DeepSeek所有最重要的技术创新，从MLA到MoE，从FP8训练到极致推理效率，本质上都是同一个问题的不同解法：怎么用更少、更受限的算力，做出顶级模型。这已经从模型公司的思考方式变为基础设施公司的研发逻辑。

如果DeepSeek不是模型公司，该给它什么定价？参考谁？答案不是Kimi，不是智谱，不是MiniMax。此次传出的融资结构可以给出判断思路。

2

4月24日，DeepSeek-V4发布，技术报告第一次把华为昇腾NPU和英伟达GPU写进同一份硬件验证清单——“我们在英伟达GPU和华为昇腾NPU两个平台上均验证了细粒度EP方案”，万亿参数级别的模型，第一次在正式文档中完成了对国产AI芯片的官方认定，发布当天，包括华为昇腾、寒武纪在内的8家国产芯片即完成适配，打破了以往需要数月调试的惯例，而为了这一行字，DeepSeek团队过去数月与华为及寒武纪密切合作，一些报道称这也是它专门推迟发布计划的重要原因。它对模型底层进行了大量调整与重写。

而融资就在这期间启动：时间点很有意思，其他公司融资是为了做到某件事，DeepSeek融资是因为某件事已经做到了，而且是以公开可验证的方式做到的，相当于梁文锋用一个模型发布，完成了通常需要几轮会议才能完成的尽职调查。

而接下来的融资里其实有三笔钱，三种逻辑，互不交叉。

大基金——全称国家集成电路产业投资基金，半导体行业最重要的国家级产业资本——历史上的投资对象是中芯国际、长江存储，它投的是”中国不能没有“的半导体基础设施。大基金的使命是补齐半导体制造、设备与材料的硬件短板，大模型公司此前从未进入它的射程。

它此前之所以对投模型公司有顾虑，就是模型的商业回报周期不确定，用投半导体的逻辑投模型说不通。而现在这被DeepSeek用一个动作解开，V4用国产芯片适配证明了它不是一个模型公司，大基金现在可以用另一套语言描述这笔投资了，投的是国产算力生态能不能跑通这个战略节点，用顶尖模型带动国产算力的应用迭代，构建“国产芯片+国产模型”的自主闭环——这件事在它的逻辑里，和投中芯国际是同一类问题。

传言中很可能入股的腾讯等产业资本那部分，则是另一套动机：确保自己不被排除在中国AI基础设施之外，因为如果DeepSeek最终成为那个底层，不在股权结构里意味着身份只能是付费用户，而它带来的不只是钱，是生态入口、企业客户、云资源——恰好是DeepSeek商业化最薄弱的地方。

这也解释了其他同样有基础设施野心的另外几个大厂，可能最终不会入股的原因。DeepSeek已经被视为潜在的基础设施竞争对手，而不只是一家可以入股的模型公司。

3

这就带来一种“割裂”感：一边锁定国家战略资本，确认基础设施身份；一边引入产业生态资本，打开商业化入口——这两件事在很多时候在很多公司身上会是矛盾的，但从这次融资结构来看，DeepSeek试图让它彼此完全独立运转，互不拖累。

也就是说，DeepSeek的融资之后，商业化进展快慢，和宏大叙事能不能做成，彼此不相干。

大基金那部分对应的是长期命题——算力自主、国产芯片生态，时间周期是五年十年，不需要季度回报；腾讯等产业资本对应的是另一条线，商业化节奏紧跟其他模型公司即可。

在人们讨论它商业化困境的时候，似乎总是忽略一些事实：DeepSeek的API定价已击穿行业底线——V4-Flash缓存命中输入低至0.02元/百万词元，综合成本仅为GPT-5.5的1%左右，推理成本被压到这种地步，让DeepSeek可以保证自己API这门生意本身不亏钱；而a16z最新一版《Top 100 Gen AI Consumer Apps》报告里，DeepSeek依然是跨越了中美用户分布的产品——网页流量在中国（33.5%）、美国（6.6%）之间分布，在模型更新“拖累”了应用迭代的情况下，移动端用户基本盘没有出现外界以为的那种崩塌。这意味着理论上其他模型公司能赚钱的方式它都能跟上，而且边际成本更低。

其实这种割裂，是DeepSeek区别于其他公司的一大特质，是他主动设计出来的，而且从幻方时代就存在。

幻方量化赚钱，DeepSeek做研究，这是它从第一天就运行的结构。幻方不需要DeepSeek给它带来商业回报，DeepSeek不需要向幻方证明自己的ARR增长——这种关系，外人很难找到对应的参照，更接近一家自营交易公司决定把利润投进基础研究：研究本身就是它存在逻辑的一部分，不是一个待变现的项目。

这种割裂依赖的就是梁文锋一个人同时握着两边的方向盘，但其实越往后，这越是脆弱的，它是人格化的，不是结构化的——一旦外部资本进来，平衡被打破的风险第一次真实存在。

所以这次融资在做的反而是把这种依赖个人意志的割裂，第一次变成股权结构里写死的东西。幻方和DeepSeek之间的那种关系，被复制到了一个更大的尺度上：幻方对DeepSeek是第一层割裂，DeepSeek内部商业化对算力基础设施研究是第二层割裂，两层割裂有同一个逻辑和同一个设计者。

因此，此次融资里，在这两笔钱之外，更独特的就是第三笔钱，梁文锋自己的出资。

报道称，梁文锋个人出资最高200亿元人民币，约28亿美元。与之对比，月之暗面Kimi刚完成的这轮融资总额约20亿美元——也就是，梁文锋自己一个人出的钱，已经够匹配大多数模型公司单独一轮融资了。

所以外部那60%进来，不是为了让DeepSeek作为模型公司“活下去”或者“继续训练模型”，幻方的钱够，梁文锋自己的钱也够。每一个外部投资方进来，都是因为DeepSeek不再是个模型公司了。

而这笔个人出资买的是对整个结构的锁定权，无论引入多少外部资本，核心决策不会被稀释。

4

另外，此次融资此前被外界认为的最大原因是人才流失。但仔细观察后，会发现它的人才流失情况可能被夸大了。

走的人确实重要——王炳宣去了腾讯，郭达雅去了字节跳动Seed，罗福莉被以千万年薪挖至小米，阮翀加入了元戎启行，覆盖基座模型、推理、OCR、多模态四条核心技术主线。

但根据《财经》最近整理的非常详尽的一份数据看，27篇论文出现频率最高的15人里只有2人离职，DeepSeek-LLM发布时的86人，仍有71位出现在V4论文名单中，300人走10个，离职率3.3%——关注AI公司们人才争夺的人会知道这个数值有多低。

期权定价对留人有真实价值，但它是融资顺带解决的问题，做正确的长期的事，连留人这件事也在过程中顺带解决了——这其实是理解DeepSeek所有决策的一个通用逻辑：它从来不为解决眼前的具体问题而行动，但长期的事做成之后，眼前的问题往往也跟着消解。

5

最后，要彻底理解它的融资和估值逻辑，还有一个重要的话题，就是DeepSeek的竞争对手究竟是谁。

英伟达定义了AI时代算力的游戏规则，所有模型公司——无论中美——都活在这个边界里，而DeepSeek是一家试图重新划定这个边界的公司，V4昇腾适配落地的那一刻，是这个判断第一次被公开验证。DeepSeek最在意的是英伟达。

500亿美元估值，定价的不是当前的模型能力，不是ARR，不是用户规模。全球可比的模型公司：Kimi刚完成的融资投后估值约200亿美元，半年内从43亿美元翻涨近四倍，有真实ARR支撑；Anthropic上一轮投后估值3800亿美元，年化收入已在2026年初突破300亿美元。DeepSeek商业化收入基本为零，估值去到Kimi两倍以上——而且这笔钱里最大的一部分来自半导体国家基金，不是来自押注模型公司未来ARR的成长型VC。

从投资人结构本身就能看出，差价定价的不是商业化预期，是基础设施溢价。

如果DeepSeek做成了它试图做的事——一套不依赖英伟达的前沿AI算力体系，一个以开源为基础的中国AI基础设施——比较对象应该是某个介于星际之门版的OpenAI和英伟达之间、目前还没有被定义过的位置：既做顶级前沿模型，又试图用新方法解决算力基础设施问题，全球找不到第二家这样的公司。

从这个坐标系看，500亿美元破纪录，但还是便宜的。

此次融资，定价的是一件还没有发生的事。这件事能不能发生，取决于梁文锋能不能做成他从第一天就在做的那件事，而从幻方到DeepSeek的整个路径来看，他是一个把长期主义执行得极为彻底的人，做正确且长期的事，很多具体的东西会在过程中自然解决。这轮融资可能是他第一次让外部世界看到这件事完整的轮廓。

金、银、油——三大资产一次带走

200,000 USDT 奖池，100% 中奖！

免责声明: 本网站转载的文章均来源于公开平台，仅供参考。这些文章不代表 MEXC 的观点或意见。所有版权归原作者所有。如果您认为任何转载文章侵犯了第三方权利，请联系 crypto.news@mexc.com 以便将其删除。MEXC 不对转载文章的及时性、准确性或完整性作出任何陈述或保证，并且不对基于此类内容所采取的任何行动或决定承担责任。转载材料仅供参考，不构成任何商业、金融、法律和/或税务决策的建议、认可或依据。