成立两年的小公司,被黄仁勋炒到1728亿

2026-03-28
来源:元素elements
这支团队,做过AI史上最酷的事

“你不能指望仅仅通过prompt设计,就让一个Agent变得稳定、可靠。你需要的是能够‘犯错-纠正-在交互中持续改进’的模型,并在这个过程中发展出真正的推理能力。”

这句话出自Striker Venture Partners的合伙人Brian Zhan。2025年初,当AI市场都在聚焦Transformer的Scaling Law、热议参数与算力时,他领投了一家当时估值还不到6亿美元的小公司——Reflection AI。

在接受Z Potentials采访时,他表示他的判断依据很简单:这支团队把世界上最优秀的一批强化学习研究者聚到了一起,而强化学习(RL)才是让Agent基础模型真正“好用、可靠”的关键突破口。

十个月后,Reflection AI成为了2025年最耀眼的AI独角兽之一。再过去五个月,它的估值又翻了整整三倍。

2026年3月26日,《华尔街日报》爆料:Reflection AI正在进行新一轮融资,投前估值250亿美元,预计融资25亿美元。JPMorgan Chase计划通过其新成立的Security and Resiliency Initiative参与本轮投资,其早期投资者Disruptive也计划继续跟投。

而就在十天前,这家公司也刚刚成为英伟达Nemotron Coalition的创始成员——这是一个由英伟达牵头、旨在推动开源前沿模型发展的全球AI联盟。

从2024年3月成立至今,Reflection AI用了两年时间走完了从0到250亿美元(约1728亿元人民币)的估值跃迁。2024年它的收入还是0,2025年收入已经有2000万美元,而它的团队只有79个人。

同时,它也被誉为“美国版DeepSeek”,肩负着西方开源AI阵营对抗中国模型的“战略使命”。黄仁勋不仅为它投了8亿美元,还派出了工程师帮它优化芯片性能。前Google CEO Eric Schmidt、Zoom创始人Eric Yuan、光速创投、红杉资本……一众硅谷顶级资本也悉数入场给它投了钱。

Reflection AI,到底是一家怎样的公司?

从AlphaGo到Gemini:这支团队做过AI史上“最酷的事”

Reflection AI的故事要从两个人说起。

Misha Laskin,Reflection AI的创始人兼CEO,俄罗斯裔以色列人,耶鲁本科学的物理,同时也是芝加哥大学的理论物理博士。2017年,他入选福布斯30 under 30,那时候他刚结束第一段创业——一家做零售库存预测的Y Combinator公司,Claire。在与Manifold的采访中,他回忆那段创业经历时坦言:“我学到了很多,但主要是明白了自己不想要什么。”他发现自己对零售行业并没有“深层的共情”,而他职业生涯真正的转折点是在2016年——当他看到了AlphaGo。

“那改变了我的人生轨迹,”Misha说,“我当时就觉得,这是我这个时代最重要的科学。”他放下一切,自学编程,去UC Berkeley做博士后研究深度学习和强化学习。后来加入了Google DeepMind,领导Gemini项目的奖励模型开发。

在Manifold采访中,他回忆起ChatGPT发布的那天,他正在新奥尔良的一个会议上做演讲,“我突然有一种抽离感——我为什么要说这些话?”

那一刻他意识到,语言模型已经解决了AI的“泛化问题”。在此之前,强化学习算法虽然强大,但只能在非常狭窄的领域工作——AlphaGo下围棋无敌,但换个游戏就要重新训练。而ChatGPT展示了一种前所未有的通用性:你可以向它提问任何问题,它基本上都能给出合理的回答。

“这是一个从0到1的时刻,”Misha说,“历史学家们回头看,就会看到那是一个断层。”

Reflection AI的另一位创始人Ioannis Antonoglou的来头更大。他是DeepMind的创始工程师,AlphaGo的核心开发者之一。2016年那场震惊世界的围棋“人机大战”,李世石输掉的四局棋,背后就有他的手笔。

Misha回忆AlphaGo那手被惊呼“非人类下法”的“第37步”棋时说:“那一步太壮观了……它展示了系统对游戏有深刻的理解,它有创造力,它能想到人类从未想到过的东西。”

在AlphaGo之后,Ioannis进一步推进了AlphaZero——完全通过自我对弈学习、无需人类指导就能掌握游戏的AI;还有MuZero——连游戏规则都不需要被告知,就能征服围棋、国际象棋、将棋、Atari游戏的更高级突破。

Misha与Ioannis是在DeepMind相识的,一个专注强化学习,一个深耕大语言模型。2024年3月,他们离开Google,创立了Reflection AI。

这个团队的其他成员同样星光熠熠:Deep Q Networks、PaLM、Character AI、ChatGPT、Gemini……这些AI史上最重要的突破,都有Reflection团队成员的参与。用红杉资本合伙人Stephanie Zhan的话说:“这不是一群想做AI的人,这是一群已经做过AI领域最酷的事的人。”

他们的融资历程堪称火箭速度:

2025年3月,彭博社曝出Reflection AI共完成了1.3亿美元融资,当时估值5.8亿美元,其中包含红杉资本和CRV领投的2500万美元天使轮,以及光速创投(Lightspeed Venture Partners)和CRV领投的1.05亿美元A轮融资;

2025年10月,B轮融资20亿美元,估值80亿美元,Reflection AI正式成为了独角兽;本轮融资英伟达领投8亿美元,DST、1789 Capital(Donald Trump Jr.,特朗普的小儿子为合伙人的机构)、谷歌前CEO Eric Schmidt、Zoom创始人Eric Yuan都进行了投资,光速创投和红杉资本继续加码。

2026年3月,Reflection AI正在新一轮融资洽谈中,投前估值达到了250亿美元,JPMorgan Chase和Disruptive等机构计划参与本轮融资。

从5.8亿到80亿再到250亿,估值涨幅超过40倍,Reflection AI只用了两年的时间。

图源:Reflection AI官网

开源还是闭源?AI世界的“路线之争”

Reflection AI选择了一条与OpenAI、Anthropic截然不同的路——开源。

什么是开源?简单说,就是把AI模型的权重和架构公开,任何人都可以下载、使用、修改、再分发。与之相对的闭源,就是把模型当成“黑盒”,用户只能通过API调用,看不到内部结构,更无法修改。

目前大模型主要分为开源与闭源两大阵营,开源阵营包括Meta的Llama系列、以及中国的DeepSeek、阿里的千问系列等;闭源阵营有OpenAI的GPT系列、Anthropic的Claude、Google的Gemini,还有字节跳动的豆包等。行业中也存在部分介于开源与闭源之间的混合开放形态模型。

为什么Reflection AI要开源?Misha Laskin在英伟达官宣它得开源联盟Nemotron Coalition时给出了答案:“技术进步是由开放和协作的价值观驱动的。Reflection正在确保智能基础保持开放——不被少数人控制——并在全球范围内可及。”

这背后的真实原因还有一个:在开源AI领域,美国正在输给中国。

根据Hugging Face的数据,2024年中国开源模型的下载份额达到17%,超过了美国模型的15.8%。DeepSeek凭借免费、高性能、可定制的策略,在全球南部市场快速扩张。而在LMArena的AI模型排行榜上,截至2025年8月,前30名开源模型中无一款来自美国公司。

Misha Laskin在《纽约时报》的专访中直言:“美国在开源领域,正存在一个DeepSeek式的空白。”他认为,如果西方世界没有自己的开源前沿模型,其他国家最终会选择中国技术。

开源模型的优势在于:成本更低、可定制性更强、数据安全可控。企业可以针对自己的业务场景进行微调,而不必把敏感数据发给第三方API。对于政府和大型企业来说,“主权AI”的概念越来越重要——他们希望AI基础设施掌握在自己手里,而不是依赖某个美国或中国公司的闭源系统。

Reflection AI的核心技术叫Reflection-Tuning,它让模型能够检测和纠正自己的推理错误。这种技术的本质是让AI具备“自我反思”能力——当模型发现自己犯了错误时,能够主动修正并从中学习。这与传统的监督学习不同,后者只是让模型模仿人类标注的数据,而Reflection-Tuning让模型在交互中持续改进。

他们开发的自主编程Agent叫Asimov,能够直接接入企业的代码库,自动完成重构、测试、部署等工程任务。与GitHub Copilot等代码助手不同,Asimov的目标不是辅助程序员写代码,而是完全自主地完成工程任务。它可以理解整个代码库的架构,自动发现bug、优化性能、生成测试用例,甚至部署到生产环境。

2025年10月,Asimov开始为Reflection AI产生收入;到2025年底,它的年收入达到了2000万美元。对于一个当时成立不到两年的公司来说,这个商业化速度相当惊人。

2026年3月16日,英伟达官宣Nemotron Coalition,Reflection AI与Black Forest Labs、Cursor、LangChain、Mistral AI、Perplexity、Sarvam、Thinking Machines Lab成为了创始成员。这个联盟的目标是共同开发开源前沿模型,第一款模型将由Mistral AI和英伟达联合开发,联盟成员贡献数据、评估和领域专业知识。

Reflection AI在这个联盟中的角色是:贡献构建可靠开放系统的专业知识。换句话说,它要帮英伟达打造一个“可信的开源生态”。英伟达在这个联盟中扮演的角色不言自明:提供算力基础设施。联盟开发的第一款模型将在NVIDIA DGX Cloud上训练,并作为NVIDIA Nemotron 4系列模型的基础开源发布。

黄仁勋在官宣声明中说:“开放模型是创新的生命线,是全球参与AI革命的引擎——对学生、科学家、初创公司和整个行业都是如此。”

“美版DeepSeek”背后,中美AI正在互相“偷师”

Reflection AI被称为“美国版DeepSeek”,这个标签既是一种赞誉,也是一种焦虑。

赞誉在于,它代表了西方开源阵营;焦虑在于,这个标签本身就说明DeepSeek已经定义了开源AI的标准。

DeepSeek做了什么?2024年底,这家中国公司发布了DeepSeek-V3和R1系列模型,性能接近OpenAI的GPT-4,但训练成本只有后者的十分之一,而且是完全开源的。它用工程创新打破了“堆算力”的“迷信”,证明了中国公司在前沿AI领域的竞争力。

但中国AI大模型的崛起,也引发了西方业界的警惕与焦虑。2026年2月23日,Anthropic在官方博客发布声明,指控DeepSeek、月之暗面(Moonshot AI)和MiniMax对其Claude模型发起了“工业级蒸馏攻击”——简单说,就是涉嫌用Anthropic的模型输出来训练自己的模型。而这类蒸馏行为在AI领域本就十分普遍,马斯克甚至还公然嘲讽了Anthropic的这一表态。

讽刺的是,仅仅一个月后,剧情反转。2026年3月20日,硅谷编程工具巨头Cursor发布了一款“自研突破”产品,却被扒出核心模型来自中国AI公司月之暗面的Kimi K2.5。Cursor的宣传文案里,只字未提Kimi的名字。

这是当下中美AI竞争的真实写照:互相借鉴、互相警惕、互相超越。

Reflection AI的应对策略是“主权AI”。2026年初,它与韩国新世界集团(Shinsegae Group)达成协议,投入数十亿美元开发韩语定制模型,数千块英伟达芯片将支撑这个项目的数据中心。Reflection的计划是:与全球美国盟友合作,成为各国“主权云”的默认开源选择。

这种模式的优势在于他们的双赢:各国获得了AI主权,Reflection获得市场和收入,英伟达卖出更多芯片。正如Misha Laskin所言:“开放模型是其配套基础设施的特洛伊木马。”

Reflection AI与英伟达的关系远比普通投资关系更紧密。据《华尔街日报》报道,英伟达不仅给它投了8亿美元,还派出多名工程师与Reflection AI合作,帮助优化其最新一代AI芯片的性能。这种“投资+技术赋能”的模式,让Reflection AI在算力竞争中占据了独特优势。

但挑战同样巨大。Reflection AI能否真正成为“西方的DeepSeek”,还要看它接下来的模型表现和商业化进展。

更重要的是,Reflection AI需要证明开源模式能够支撑起一个可持续的商业模式。目前它的收入主要来自企业客户订阅,但2000万美元的年收入相对于250亿美元的估值来说仍然微不足道。投资者押注的是未来——当AI Agent成为企业标配时,Reflection AI能否占据一席之地?

更宏观地看,中美AI竞争正在进入一个新阶段。第一阶段是比谁参数多、算力强;第二阶段是比谁成本低、效率高;现在进入了第三阶段——比谁生态开放、谁盟友多。开源vs闭源、主权AI vs全球云、中国模式vs美国模式……这些路线之争将定义未来十年的AI格局。

从全球视角来看,AI竞争已经不仅仅是技术层面的较量,更是地缘政治博弈的延伸。美国政府正在积极扶持本土开源AI企业,以应对中国大模型的崛起。白宫科技政策办公室主任Michael Kratsios在2026年2月表示:“政府的目标是创造一个让开源模型能够蓬勃发展的生态系统。”据《金融时报》报道,美国政府甚至考虑与Reflection AI签订合约,将其作为OpenAI和Anthropic闭源模型的替代方案。

这种战略考量背后,是美国对于AI主权的深层焦虑。闭源模型虽然性能强大,但企业或政府无法完全控制自己的数据;而开源模型允许本地部署、自主定制,对于重视数据安全的主权国家来说更具吸引力。Reflection AI正是看准了这一趋势,将自己定位为“西方开源阵营的领导者”。

Misha Laskin在接受《纽约时报》采访时放话:“我预计我们有望成长为比当下超大规模云服务商更具规模的公司。”两位见证过AlphaGo击败李世石的AI先行者,正以Reflection AI为支点,对开源AI的未来发起新的下注。

结语

Reflection AI,是一个关于“信念”的故事。

Misha Laskin在博士毕业时放弃了自己深耕近十年的理论物理,因为“很难想象要等几十年才能知道自己做的东西是否有成果”。

直觉式的判断,最终让他和Ioannis Antonoglou一起,在2024年3月创立了Reflection AI。他们的信念很简单:强化学习+大语言模型=超级智能Agent,而开源是让这项技术惠及世界的最佳方式。

两年过去,这支79人的团队从0做到250亿美元估值,从默默无闻到成为英伟达战略版图的核心一环。他们的投资者名单里,既有硅谷最激进的风险资本,也有传统金融巨头,甚至还有特朗普家族的身影。

它代表着开源AI阵营的崛起,代表着美国对中国AI的焦虑,也代表着AI行业未来或将从“闭源垄断”走向“开放生态”。

正如Misha Laskin所说:“AlphaGo从未停止进化。若投入十倍、甚至百倍的资源,就能得到一个智能水平更高的超级AlphaGo。本质上,这类系统的学习潜力没有上限,完全取决于你愿意投入多少资源。”

Reflection AI的旅程,才刚刚开始。

第一时间获取股权投资行业新鲜资讯和深度商业分析,请在微信中搜索“融中财经”公众号,或者用手机扫描左侧二维码,即可获得融中财经每日精华内容推送。

您可能也喜欢的文章