Modal C轮融资：以46.5亿美元估值募资3.55亿美元

Modal's Series C: Raising $355M at a $4.65B valuation

二〇二六年五月二十一日 · 英文原文

摘要

Modal 宣布完成 3.55 亿美元 C 轮融资，由 General Catalyst 和 Redpoint 领投，Menlo 与 Accel 新加入，投后估值 46.5 亿美元。公司年化收入已突破 3 亿美元，营收自去年 9 月以来增长五倍。Modal 为 AI 工作负载构建云平台，支持低延迟推理、agent 运行时、强化学习及大规模批处理。平台已启动超 10 亿个沙箱，沙箱贡献超三分之一收入。客户包括 DoorDash、Cognition、Decagon、Physical Intelligence、Chai Discovery 和 Suno。

新闻

2026年5月21日·3分钟阅读

自去年9月以来，我们的营收增长了五倍，年化收入已突破3亿美元，因此我们完成了3.55亿美元的融资。本轮融资由General Catalyst和Redpoint领投，Menlo和Accel作为新投资者加入，投后估值为46.5亿美元。我们所有现有主要投资者也参与了本轮融资，进一步加大了对Modal的投入。

视频6

面向AI时代的新型基础设施层

我们创立Modal，是因为为传统Web应用构建的云服务永远无法适配AI工作负载。在GenAI革命之前，这一点对我们来说就很明确，而随着模型和技术的进步，这一点变得更加确定。

Modal是为AI构建的云平台。它并非单一用途的GPU云，而是一个为开发者提供正确原语（primitives），以便构建极其广泛应用的平台。如今，这体现在低延迟弹性推理、动态agent运行时、强化学习、大规模批处理作业以及更多方面。

从前沿API到模型自主掌控

从DoorDash这样的数字原生企业到Reducto这样的AI原生公司，领先的团队正在掌控自己的模型。他们用自己的数据进行微调，运行强化学习（RL），并根据自身的延迟、吞吐量和成本需求调整推理。来自DeepSeek、Qwen等的开源权重模型已达到生产质量，而vLLM和SGLang等推理引擎也随之成熟。这是第一次，拥有并服务自己模型的完整技术栈已经就绪，且无需牺牲能力。

“Modal为我们的强化学习基础设施和生产推理提供动力。一端是数百万个沙箱，另一端是实时服务。全部运行在同一个平台上。”

— Scott Wu，Cognition CEO

“Decagon实现了342毫秒的p90延迟，远低于自然客户对话所需的亚秒级范围——提供了速度、效率和企业级可靠性。”

— Decagon 研究团队

Agent需要更好的执行环境

2023年，我们开始看到用户在Modal上运行AI生成的代码。很明显，这将成为一个普遍需求，因此我们构建了Sandboxes（沙箱），即用于不可信代码的隔离环境，并将其作为一等原语。两年后，爆发式增长发生了。

在过去六个月里，情况变得明朗：agent将无处不在，而当它们拥有一个可操作的运行时环境时，会强大得多。DoorDash正在为商家构建AI agent，像Ramp的Inspect这样的编码agent贡献了70%的合并PR，RL工作负载并行运行数千个环境，自动研究agent大规模运行自己的训练实验。Modal上已启动了超过10亿个沙箱。

“沙箱是强化学习最重要的构建块之一。在所有平台中，Modal显然非常灵活，其结构方式使我们能够构建复杂的环境，并且非常注重性能和可靠性。”

— Yash Patil，Applied Compute CEO

“随着我们为本地企业扩展agent驱动的商务，我们需要一条高效的生产路径，具备完全的控制、规模和可靠性。我们很高兴能评估Claude Managed Agents作为下一步，基于我们在Modal上的AI基础设施进行构建。”

— Andy Fang，DoorDash CTO

AI的形态不断扩展

Modal是一个为AI工作负载底层需求构建的通用计算平台：弹性计算、安全隔离和程序化控制。开发者将它们组合成截然不同的应用。Physical Intelligence为实时机器人运行实时推理。Chai Discovery将药物发现流程从蛋白质嵌入扩展到抗体设计。Suno每天生成数百万首歌曲，规模可扩展到数千个GPU，然后回缩到接近零。相同的原语，完全不同的形态。

“我们使用Modal运行开销小于10毫秒的边缘推理和大规模批处理作业。我们的团队喜欢这个平台，因为它提供了强大的能力和灵活性。”

— Brian Ichter，Physical Intelligence 联合创始人

“这不仅仅是节省时间，更是心智负担的消失。使用Modal，我们只需在需要扩展的函数上添加几个装饰器，然后就可以忘记它们，它们就能正常工作。”

— Kevin Wu，Chai Discovery ML研究员

我们接下来要构建什么

视频7 过去五年，我们在技术上投入极深，包括从零开始构建我们自己的存储和计算层。这使我们能够实现看似不可能的结果，例如：通过GPU快照将冷启动速度提升100倍，实现全球范围内的弹性低延迟推理，以及通过汇集全球数百个数据中心的容量，无需预留即可在几分钟（甚至几秒）内从0扩展到1,000个GPU。

因为我们拥有完整的技术栈，我们可以不断叠加这些优势，为开发者提供越来越好的体验。

正是这个基础使得下一阶段成为可能。以下是我们的发展方向：

大规模低延迟推理。

生产推理的门槛不断提高，我们正加倍投入，让团队能够快速迭代：更好的服务原语、更清晰的观测性，以及对开放推理栈的持续投资。我们已经组建了一支推理工程师团队，为Flash Attention、vLLM、SGLang等项目做出贡献，因为性能提升应该回馈给使用相同引擎构建的社区。

融合训练与推理循环。

强化学习是一个严峻的基础设施问题。多节点训练、弹性推理和沙箱在Modal上已获得一等支持，这使得完整的RL循环成为自然之选。我们的用户已经在质量、成本、延迟和吞吐量方面看到了帕累托最优的结果。我们希望让完整的模型训练生命周期——从首次微调到生产服务——对更多团队触手可及。

面向Agent的计算层。

沙箱已经贡献了我们超过三分之一的收入，客户不断要求更多。我们正在扩展沙箱的功能，并提升其规模以支持数百万个沙箱并行运行。同时，我们认识到agent开发时代已经到来。Modal本身就是代码，这使其已经成为agent工作的绝佳场所。我们将持续改进，首先从推出细粒度的RBAC（基于角色的访问控制）开始，以便客户能够安全地赋予agent能力。

AI基础设施层才刚刚开始。我们也一样。

如果您想加入我们在纽约、旧金山和斯德哥尔摩的120多人团队，请查看我们的开放职位。

译自 Modal · 官方 · 录于二〇二六年五月二十一日