Modal C轮融资:以46.5亿美元估值募资3.55亿美元
Modal's Series C: Raising $355M at a $4.65B valuation
Modal 宣布完成 3.55 亿美元 C 轮融资,由 General Catalyst 和 Redpoint 领投,Menlo 与 Accel 新加入,投后估值 46.5 亿美元。公司年化收入已突破 3 亿美元,营收自去年 9 月以来增长五倍。Modal 为 AI 工作负载构建云平台,支持低延迟推理、agent 运行时、强化学习及大规模批处理。平台已启动超 10 亿个沙箱,沙箱贡献超三分之一收入。客户包括 DoorDash、Cognition、Decagon、Physical Intelligence、Chai Discovery 和 Suno。
新闻
2026年5月21日·3分钟阅读
自去年9月以来,我们的营收增长了五倍,年化收入已突破3亿美元,因此我们完成了3.55亿美元的融资。本轮融资由General Catalyst和Redpoint领投,Menlo和Accel作为新投资者加入,投后估值为46.5亿美元。我们所有现有主要投资者也参与了本轮融资,进一步加大了对Modal的投入。
面向AI时代的新型基础设施层
我们创立Modal,是因为为传统Web应用构建的云服务永远无法适配AI工作负载。在GenAI革命之前,这一点对我们来说就很明确,而随着模型和技术的进步,这一点变得更加确定。
Modal是为AI构建的云平台。它并非单一用途的GPU云,而是一个为开发者提供正确原语(primitives),以便构建极其广泛应用的平台。如今,这体现在低延迟弹性推理、动态agent运行时、强化学习、大规模批处理作业以及更多方面。
从前沿API到模型自主掌控
从DoorDash这样的数字原生企业到Reducto这样的AI原生公司,领先的团队正在掌控自己的模型。他们用自己的数据进行微调,运行强化学习(RL),并根据自身的延迟、吞吐量和成本需求调整推理。来自DeepSeek、Qwen等的开源权重模型已达到生产质量,而vLLM和SGLang等推理引擎也随之成熟。这是第一次,拥有并服务自己模型的完整技术栈已经就绪,且无需牺牲能力。
“Modal为我们的强化学习基础设施和生产推理提供动力。一端是数百万个沙箱,另一端是实时服务。全部运行在同一个平台上。”
— Scott Wu,Cognition CEO
“Decagon实现了342毫秒的p90延迟,远低于自然客户对话所需的亚秒级范围——提供了速度、效率和企业级可靠性。”
— Decagon 研究团队
Agent需要更好的执行环境
2023年,我们开始看到用户在Modal上运行AI生成的代码。很明显,这将成为一个普遍需求,因此我们构建了Sandboxes(沙箱),即用于不可信代码的隔离环境,并将其作为一等原语。两年后,爆发式增长发生了。
在过去六个月里,情况变得明朗:agent将无处不在,而当它们拥有一个可操作的运行时环境时,会强大得多。DoorDash正在为商家构建AI agent,像Ramp的Inspect这样的编码agent贡献了70%的合并PR,RL工作负载并行运行数千个环境,自动研究agent大规模运行自己的训练实验。Modal上已启动了超过10亿个沙箱。
“沙箱是强化学习最重要的构建块之一。在所有平台中,Modal显然非常灵活,其结构方式使我们能够构建复杂的环境,并且非常注重性能和可靠性。”
— Yash Patil,Applied Compute CEO
“随着我们为本地企业扩展agent驱动的商务,我们需要一条高效的生产路径,具备完全的控制、规模和可靠性。我们很高兴能评估Claude Managed Agents作为下一步,基于我们在Modal上的AI基础设施进行构建。”
— Andy Fang,DoorDash CTO
AI的形态不断扩展

Modal是一个为AI工作负载底层需求构建的通用计算平台:弹性计算、安全隔离和程序化控制。开发者将它们组合成截然不同的应用。Physical Intelligence为实时机器人运行实时推理。Chai Discovery将药物发现流程从蛋白质嵌入扩展到抗体设计。Suno每天生成数百万首歌曲,规模可扩展到数千个GPU,然后回缩到接近零。相同的原语,完全不同的形态。
“我们使用Modal运行开销小于10毫秒的边缘推理和大规模批处理作业。我们的团队喜欢这个平台,因为它提供了强大的能力和灵活性。”
— Brian Ichter,Physical Intelligence 联合创始人
“这不仅仅是节省时间,更是心智负担的消失。使用Modal,我们只需在需要扩展的函数上添加几个装饰器,然后就可以忘记它们,它们就能正常工作。”
— Kevin Wu,Chai Discovery ML研究员
我们接下来要构建什么
视频7 过去五年,我们在技术上投入极深,包括从零开始构建我们自己的存储和计算层。这使我们能够实现看似不可能的结果,例如:通过GPU快照将冷启动速度提升100倍,实现全球范围内的弹性低延迟推理,以及通过汇集全球数百个数据中心的容量,无需预留即可在几分钟(甚至几秒)内从0扩展到1,000个GPU。
因为我们拥有完整的技术栈,我们可以不断叠加这些优势,为开发者提供越来越好的体验。
正是这个基础使得下一阶段成为可能。以下是我们的发展方向:
大规模低延迟推理。
生产推理的门槛不断提高,我们正加倍投入,让团队能够快速迭代:更好的服务原语、更清晰的观测性,以及对开放推理栈的持续投资。我们已经组建了一支推理工程师团队,为Flash Attention、vLLM、SGLang等项目做出贡献,因为性能提升应该回馈给使用相同引擎构建的社区。
融合训练与推理循环。
强化学习是一个严峻的基础设施问题。多节点训练、弹性推理和沙箱在Modal上已获得一等支持,这使得完整的RL循环成为自然之选。我们的用户已经在质量、成本、延迟和吞吐量方面看到了帕累托最优的结果。我们希望让完整的模型训练生命周期——从首次微调到生产服务——对更多团队触手可及。
面向Agent的计算层。
沙箱已经贡献了我们超过三分之一的收入,客户不断要求更多。我们正在扩展沙箱的功能,并提升其规模以支持数百万个沙箱并行运行。同时,我们认识到agent开发时代已经到来。Modal本身就是代码,这使其已经成为agent工作的绝佳场所。我们将持续改进,首先从推出细粒度的RBAC(基于角色的访问控制)开始,以便客户能够安全地赋予agent能力。
AI基础设施层才刚刚开始。我们也一样。
如果您想加入我们在纽约、旧金山和斯德哥尔摩的120多人团队,请查看我们的开放职位。
5kjuh6q1_21423b76.webp)