成立两年的小公司，被黄仁勋炒到1728亿

2026-03-28

来源：元素elements

这支团队，做过AI史上最酷的事

“你不能指望仅仅通过prompt设计，就让一个Agent变得稳定、可靠。你需要的是能够‘犯错-纠正-在交互中持续改进’的模型，并在这个过程中发展出真正的推理能力。”

这句话出自Striker Venture Partners的合伙人Brian Zhan。2025年初，当AI市场都在聚焦Transformer的Scaling Law、热议参数与算力时，他领投了一家当时估值还不到6亿美元的小公司——Reflection AI。

在接受Z Potentials采访时，他表示他的判断依据很简单：这支团队把世界上最优秀的一批强化学习研究者聚到了一起，而强化学习（RL）才是让Agent基础模型真正“好用、可靠”的关键突破口。

十个月后，Reflection AI成为了2025年最耀眼的AI独角兽之一。再过去五个月，它的估值又翻了整整三倍。

2026年3月26日，《华尔街日报》爆料：Reflection AI正在进行新一轮融资，投前估值250亿美元，预计融资25亿美元。JPMorgan Chase计划通过其新成立的Security and Resiliency Initiative参与本轮投资，其早期投资者Disruptive也计划继续跟投。

而就在十天前，这家公司也刚刚成为英伟达Nemotron Coalition的创始成员——这是一个由英伟达牵头、旨在推动开源前沿模型发展的全球AI联盟。

从2024年3月成立至今，Reflection AI用了两年时间走完了从0到250亿美元（约1728亿元人民币）的估值跃迁。2024年它的收入还是0，2025年收入已经有2000万美元，而它的团队只有79个人。

同时，它也被誉为“美国版DeepSeek”，肩负着西方开源AI阵营对抗中国模型的“战略使命”。黄仁勋不仅为它投了8亿美元，还派出了工程师帮它优化芯片性能。前Google CEO Eric Schmidt、Zoom创始人Eric Yuan、光速创投、红杉资本……一众硅谷顶级资本也悉数入场给它投了钱。

Reflection AI，到底是一家怎样的公司？

从AlphaGo到Gemini：这支团队做过AI史上“最酷的事”

Reflection AI的故事要从两个人说起。

Misha Laskin，Reflection AI的创始人兼CEO，俄罗斯裔以色列人，耶鲁本科学的物理，同时也是芝加哥大学的理论物理博士。2017年，他入选福布斯30 under 30，那时候他刚结束第一段创业——一家做零售库存预测的Y Combinator公司，Claire。在与Manifold的采访中，他回忆那段创业经历时坦言：“我学到了很多，但主要是明白了自己不想要什么。”他发现自己对零售行业并没有“深层的共情”，而他职业生涯真正的转折点是在2016年——当他看到了AlphaGo。

“那改变了我的人生轨迹，”Misha说，“我当时就觉得，这是我这个时代最重要的科学。”他放下一切，自学编程，去UC Berkeley做博士后研究深度学习和强化学习。后来加入了Google DeepMind，领导Gemini项目的奖励模型开发。

在Manifold采访中，他回忆起ChatGPT发布的那天，他正在新奥尔良的一个会议上做演讲，“我突然有一种抽离感——我为什么要说这些话？”

那一刻他意识到，语言模型已经解决了AI的“泛化问题”。在此之前，强化学习算法虽然强大，但只能在非常狭窄的领域工作——AlphaGo下围棋无敌，但换个游戏就要重新训练。而ChatGPT展示了一种前所未有的通用性：你可以向它提问任何问题，它基本上都能给出合理的回答。

“这是一个从0到1的时刻，”Misha说，“历史学家们回头看，就会看到那是一个断层。”

Reflection AI的另一位创始人Ioannis Antonoglou的来头更大。他是DeepMind的创始工程师，AlphaGo的核心开发者之一。2016年那场震惊世界的围棋“人机大战”，李世石输掉的四局棋，背后就有他的手笔。

Misha回忆AlphaGo那手被惊呼“非人类下法”的“第37步”棋时说：“那一步太壮观了……它展示了系统对游戏有深刻的理解，它有创造力，它能想到人类从未想到过的东西。”

在AlphaGo之后，Ioannis进一步推进了AlphaZero——完全通过自我对弈学习、无需人类指导就能掌握游戏的AI；还有MuZero——连游戏规则都不需要被告知，就能征服围棋、国际象棋、将棋、Atari游戏的更高级突破。

Misha与Ioannis是在DeepMind相识的，一个专注强化学习，一个深耕大语言模型。2024年3月，他们离开Google，创立了Reflection AI。

这个团队的其他成员同样星光熠熠：Deep Q Networks、PaLM、Character AI、ChatGPT、Gemini……这些AI史上最重要的突破，都有Reflection团队成员的参与。用红杉资本合伙人Stephanie Zhan的话说：“这不是一群想做AI的人，这是一群已经做过AI领域最酷的事的人。”

他们的融资历程堪称火箭速度：

2025年3月，彭博社曝出Reflection AI共完成了1.3亿美元融资，当时估值5.8亿美元，其中包含红杉资本和CRV领投的2500万美元天使轮，以及光速创投（Lightspeed Venture Partners）和CRV领投的1.05亿美元A轮融资；

2025年10月，B轮融资20亿美元，估值80亿美元，Reflection AI正式成为了独角兽；本轮融资英伟达领投8亿美元，DST、1789 Capital（Donald Trump Jr.，特朗普的小儿子为合伙人的机构）、谷歌前CEO Eric Schmidt、Zoom创始人Eric Yuan都进行了投资，光速创投和红杉资本继续加码。

2026年3月，Reflection AI正在新一轮融资洽谈中，投前估值达到了250亿美元，JPMorgan Chase和Disruptive等机构计划参与本轮融资。

从5.8亿到80亿再到250亿，估值涨幅超过40倍，Reflection AI只用了两年的时间。

图源：Reflection AI官网

开源还是闭源？AI世界的“路线之争”

Reflection AI选择了一条与OpenAI、Anthropic截然不同的路——开源。

什么是开源？简单说，就是把AI模型的权重和架构公开，任何人都可以下载、使用、修改、再分发。与之相对的闭源，就是把模型当成“黑盒”，用户只能通过API调用，看不到内部结构，更无法修改。

目前大模型主要分为开源与闭源两大阵营，开源阵营包括Meta的Llama系列、以及中国的DeepSeek、阿里的千问系列等；闭源阵营有OpenAI的GPT系列、Anthropic的Claude、Google的Gemini，还有字节跳动的豆包等。行业中也存在部分介于开源与闭源之间的混合开放形态模型。

为什么Reflection AI要开源？Misha Laskin在英伟达官宣它得开源联盟Nemotron Coalition时给出了答案：“技术进步是由开放和协作的价值观驱动的。Reflection正在确保智能基础保持开放——不被少数人控制——并在全球范围内可及。”

这背后的真实原因还有一个：在开源AI领域，美国正在输给中国。

根据Hugging Face的数据，2024年中国开源模型的下载份额达到17%，超过了美国模型的15.8%。DeepSeek凭借免费、高性能、可定制的策略，在全球南部市场快速扩张。而在LMArena的AI模型排行榜上，截至2025年8月，前30名开源模型中无一款来自美国公司。

Misha Laskin在《纽约时报》的专访中直言：“美国在开源领域，正存在一个DeepSeek式的空白。”他认为，如果西方世界没有自己的开源前沿模型，其他国家最终会选择中国技术。

开源模型的优势在于：成本更低、可定制性更强、数据安全可控。企业可以针对自己的业务场景进行微调，而不必把敏感数据发给第三方API。对于政府和大型企业来说，“主权AI”的概念越来越重要——他们希望AI基础设施掌握在自己手里，而不是依赖某个美国或中国公司的闭源系统。

Reflection AI的核心技术叫Reflection-Tuning，它让模型能够检测和纠正自己的推理错误。这种技术的本质是让AI具备“自我反思”能力——当模型发现自己犯了错误时，能够主动修正并从中学习。这与传统的监督学习不同，后者只是让模型模仿人类标注的数据，而Reflection-Tuning让模型在交互中持续改进。

他们开发的自主编程Agent叫Asimov，能够直接接入企业的代码库，自动完成重构、测试、部署等工程任务。与GitHub Copilot等代码助手不同，Asimov的目标不是辅助程序员写代码，而是完全自主地完成工程任务。它可以理解整个代码库的架构，自动发现bug、优化性能、生成测试用例，甚至部署到生产环境。

2025年10月，Asimov开始为Reflection AI产生收入；到2025年底，它的年收入达到了2000万美元。对于一个当时成立不到两年的公司来说，这个商业化速度相当惊人。

2026年3月16日，英伟达官宣Nemotron Coalition，Reflection AI与Black Forest Labs、Cursor、LangChain、Mistral AI、Perplexity、Sarvam、Thinking Machines Lab成为了创始成员。这个联盟的目标是共同开发开源前沿模型，第一款模型将由Mistral AI和英伟达联合开发，联盟成员贡献数据、评估和领域专业知识。

Reflection AI在这个联盟中的角色是：贡献构建可靠开放系统的专业知识。换句话说，它要帮英伟达打造一个“可信的开源生态”。英伟达在这个联盟中扮演的角色不言自明：提供算力基础设施。联盟开发的第一款模型将在NVIDIA DGX Cloud上训练，并作为NVIDIA Nemotron 4系列模型的基础开源发布。

黄仁勋在官宣声明中说：“开放模型是创新的生命线，是全球参与AI革命的引擎——对学生、科学家、初创公司和整个行业都是如此。”

“美版DeepSeek”背后，中美AI正在互相“偷师”

Reflection AI被称为“美国版DeepSeek”，这个标签既是一种赞誉，也是一种焦虑。

赞誉在于，它代表了西方开源阵营；焦虑在于，这个标签本身就说明DeepSeek已经定义了开源AI的标准。

DeepSeek做了什么？2024年底，这家中国公司发布了DeepSeek-V3和R1系列模型，性能接近OpenAI的GPT-4，但训练成本只有后者的十分之一，而且是完全开源的。它用工程创新打破了“堆算力”的“迷信”，证明了中国公司在前沿AI领域的竞争力。

但中国AI大模型的崛起，也引发了西方业界的警惕与焦虑。2026年2月23日，Anthropic在官方博客发布声明，指控DeepSeek、月之暗面（Moonshot AI）和MiniMax对其Claude模型发起了“工业级蒸馏攻击”——简单说，就是涉嫌用Anthropic的模型输出来训练自己的模型。而这类蒸馏行为在AI领域本就十分普遍，马斯克甚至还公然嘲讽了Anthropic的这一表态。

讽刺的是，仅仅一个月后，剧情反转。2026年3月20日，硅谷编程工具巨头Cursor发布了一款“自研突破”产品，却被扒出核心模型来自中国AI公司月之暗面的Kimi K2.5。Cursor的宣传文案里，只字未提Kimi的名字。

这是当下中美AI竞争的真实写照：互相借鉴、互相警惕、互相超越。

Reflection AI的应对策略是“主权AI”。2026年初，它与韩国新世界集团（Shinsegae Group）达成协议，投入数十亿美元开发韩语定制模型，数千块英伟达芯片将支撑这个项目的数据中心。Reflection的计划是：与全球美国盟友合作，成为各国“主权云”的默认开源选择。

这种模式的优势在于他们的双赢：各国获得了AI主权，Reflection获得市场和收入，英伟达卖出更多芯片。正如Misha Laskin所言：“开放模型是其配套基础设施的特洛伊木马。”

Reflection AI与英伟达的关系远比普通投资关系更紧密。据《华尔街日报》报道，英伟达不仅给它投了8亿美元，还派出多名工程师与Reflection AI合作，帮助优化其最新一代AI芯片的性能。这种“投资+技术赋能”的模式，让Reflection AI在算力竞争中占据了独特优势。

但挑战同样巨大。Reflection AI能否真正成为“西方的DeepSeek”，还要看它接下来的模型表现和商业化进展。

更重要的是，Reflection AI需要证明开源模式能够支撑起一个可持续的商业模式。目前它的收入主要来自企业客户订阅，但2000万美元的年收入相对于250亿美元的估值来说仍然微不足道。投资者押注的是未来——当AI Agent成为企业标配时，Reflection AI能否占据一席之地？

更宏观地看，中美AI竞争正在进入一个新阶段。第一阶段是比谁参数多、算力强；第二阶段是比谁成本低、效率高；现在进入了第三阶段——比谁生态开放、谁盟友多。开源vs闭源、主权AI vs全球云、中国模式vs美国模式……这些路线之争将定义未来十年的AI格局。

从全球视角来看，AI竞争已经不仅仅是技术层面的较量，更是地缘政治博弈的延伸。美国政府正在积极扶持本土开源AI企业，以应对中国大模型的崛起。白宫科技政策办公室主任Michael Kratsios在2026年2月表示：“政府的目标是创造一个让开源模型能够蓬勃发展的生态系统。”据《金融时报》报道，美国政府甚至考虑与Reflection AI签订合约，将其作为OpenAI和Anthropic闭源模型的替代方案。

这种战略考量背后，是美国对于AI主权的深层焦虑。闭源模型虽然性能强大，但企业或政府无法完全控制自己的数据；而开源模型允许本地部署、自主定制，对于重视数据安全的主权国家来说更具吸引力。Reflection AI正是看准了这一趋势，将自己定位为“西方开源阵营的领导者”。

Misha Laskin在接受《纽约时报》采访时放话：“我预计我们有望成长为比当下超大规模云服务商更具规模的公司。”两位见证过AlphaGo击败李世石的AI先行者，正以Reflection AI为支点，对开源AI的未来发起新的下注。

结语

Reflection AI，是一个关于“信念”的故事。

Misha Laskin在博士毕业时放弃了自己深耕近十年的理论物理，因为“很难想象要等几十年才能知道自己做的东西是否有成果”。

直觉式的判断，最终让他和Ioannis Antonoglou一起，在2024年3月创立了Reflection AI。他们的信念很简单：强化学习+大语言模型=超级智能Agent，而开源是让这项技术惠及世界的最佳方式。

两年过去，这支79人的团队从0做到250亿美元估值，从默默无闻到成为英伟达战略版图的核心一环。他们的投资者名单里，既有硅谷最激进的风险资本，也有传统金融巨头，甚至还有特朗普家族的身影。

它代表着开源AI阵营的崛起，代表着美国对中国AI的焦虑，也代表着AI行业未来或将从“闭源垄断”走向“开放生态”。

正如Misha Laskin所说：“AlphaGo从未停止进化。若投入十倍、甚至百倍的资源，就能得到一个智能水平更高的超级AlphaGo。本质上，这类系统的学习潜力没有上限，完全取决于你愿意投入多少资源。”

Reflection AI的旅程，才刚刚开始。

第一时间获取股权投资行业新鲜资讯和深度商业分析，请在微信中搜索“融中财经”公众号，或者用手机扫描左侧二维码，即可获得融中财经每日精华内容推送。

声明：
1 融中财经原创文章未经授权严禁转载。
2 本站转载的内容，均已获授权，其版权归原作者所有。
3 网站所刊登内容出于传递信息之目的，并不意味赞同其观点、立场或证实其内容真实性。
4 涉企问题举报入口见网页底部或邮件至thecapital@thecapital.com.cn。
5 内容合作、转载、勘误或其他任何问题，请微信联系irongzhong。

您可能也喜欢的文章