Latent Space Podcast

给Agent配电脑 — Ivan Burazin, Daytona

Giving Agents Computers — Ivan Burazin, Daytona

二〇二六年五月二十二日 收听原版播客

DaytonaNet CEO Ivan Burazin 在访谈中介绍了公司从 Code Anywhere 转型为 AI agent 提供可组合计算沙箱的历程。Daytona 基于裸金属和自研调度器,沙箱启动时间 60 毫秒,可并发启动 50,000 个(约 75 秒),支持动态调整 CPU、RAM 和磁盘。公司月环比增长 74%,平均利用率 15%,最大客户每日运行约 850,000 个沙箱。工作负载分为后台 agent(跟随太阳模式)和 RL/评估(尖峰模式),后者占比将达 50%。Burazin 强调 agent 需要类似人类计算机的沙箱,并押注计算机使用(computer use)功能以解锁遗留应用市场。团队 25 人,其中 13 人共事超 7 年,通过 Slack 提供极速响应支持。

A

好,我们现在在录音室,请到的是 DaytonaNet 的 CEO Ivan Burazin。欢迎。

B

谢谢邀请。

A

Ivan,我们认识很久了。

B

很久了。

A

我都不知道你是怎么找到我的——是你主动联系 Shift 还是——

B

是我联系你的。原因是——我们当时在考虑——我是 Code Anywhere 的联合创始人,那是第一个基于浏览器的 IDE。所以我们一直觉得 localhost 应该消失。

A

没错。

B

你写了那篇文章《End of localhost》。我因为那篇文章联系了你。后来我们聊了,我当时在另一家公司,负责开发者体验相关的工作,而你在这方面很有经验。我联系了你和其他人,问我们该怎么做?关键点是什么?你很好心接了电话。我记得我还迟到了。

A

我不记得了。

B

我记得,因为当时我和我当时的——不确定是女朋友还是妻子——在一起,是同一个人,所以没问题。我们在意大利度假,我因为什么事迟到了。我觉得很抱歉,但你很宽容。

A

我宽容是因为我也经常让别人等。所以,谁没有过错呢?对不了解的人说一下,InfoBipShift 是你过去做的一个项目,那基本上是我创办 AI Engineer 的灵感来源之一。我得感谢你推了我一把,让我意识到可以办会议并卖票。

B

对,我记得你一开始想给我顾问股份。我当时太专注于手头的事,拒绝了,我本该接受的。抱歉,不过算了。

A

我们不是风投支持的。总之,我觉得你厉害的地方在于,Code Anywhere 是你一直想做的事,后来搁置了,又在 InfoBip 之后重新捡起来。讲讲故事吧,讲讲 Daytona 的起源。

B

好。很久以前,我和联合创始人就一直在一起。我说过很多次,我们就像结了婚又离婚又结婚。有人问我,我的联合创始人是不是我的伴侣?他们以为是字面意思,其实不是,但我们一起做了好几家公司。如你所说,我们经历了一次转变,从 Code Anywhere 到 Shift 会议,再回到 Daytona。我们最初在 2000 年代初开始搭服务器、做虚拟化、路由器,做这些底层的东西。那是一家服务公司,我们卖掉后专注于我联合创始人发明的东西——第一个基于浏览器的 IDE。我说第一个,因为在我们之前只有 Heroku 做过,但时间很短,后来他们转型成了 Heroku。除了他们,我们是唯一一家,它叫——

A

还有 Cloud9。

B

Cloud9 比我们稍晚一点。还有 Replit,是在我们停止之后才出现的。Replit 后来做得很成功,这很好。还有 Nitrous.io,当时有好几个,但都太早了。有趣的是,当时没有 VS Code,没有 Kubernetes,Docker 也刚开始,甚至可能还没公开。所以我们得自己搭建整个技术栈。这是我们在 Daytona 中一直使用的关键经验。所以非常早。大约有 300 万人用过 CodeAnywhere。它主要是天使投资而非风投。我们最终还清了所有投资,因为它没有达到那种规模。但三年前,我们用 Daytona 开始了类似的事情,不过不是现在的样子,而是为人类工程师自动化开发环境,基本上是 CodeAnywhere 的底层技术栈。然后去年一月我们做了大转型,转向沙盒。现在就是这样。

A

历史性的转型。而且,我独立投资了 CodeAnywhere,也投了 B2B,结果你们俩都转向了同一个方向。我当时想,靠。

B

你投了 Daytona。你是第一个。如果没有你的支票,我们不会做这件事。

A

不可能。

B

不,我们当时想,必须先让他上船。你是我们上路的助推器。

A

不,因为你把我放进了你的融资演示里。我当时想,这要是不投,简直像被道德绑架。

B

那是因为那是你的话。我们做了很多关于 localhost 终结的研究,看谁对这个感兴趣。

A

对。我写了那篇博客,然后这个领域的每家公司都联系了我,每个收到这些 pitch 的 VC 也打电话跟我聊。

B

终于实现了。终于实现了。

A

终于实现了。而且可能是由非人类用户来实现的。

B

对。

A

那现在的 Daytona 是什么?简单描述一下。我穿着这件 T 恤。

B

你穿着。对。

A

上面写着——我觉得你们的品牌做得很好,很一致。它写着 "Run AI Code"。不能再简单了。

B

没错。但我们可能得改,因为这只是我们做的一部分。我们很喜欢这个。Run AI Code 非常简单。人们有不同的理解。我们大概送出了 5000 到 6000 件 T 恤。人们很自豪地穿着,因为它不是在宣传我们。

A

在背面。

B

在背面,它是在宣传穿的人自己。所以我觉得我们做得很好。但这只是我们做的一部分,因为人们想到 Run AI Code,只会想到那些小的代码执行隔离环境,你发一段代码,得到输出。而现在的 Daytona 本质上是为 AI agent 提供的可组合计算机。

A

它是——

B

市场叫它沙盒。对,这可能会误导人。

A

所有这些——

B

对,因为它可能让人误解,人们通常认为沙盒是演示或测试环境,而不是生产级环境。但 Daytona 做的事,如果你想想你面前的笔记本电脑或那边的电脑,或者我妻子是建筑师,她有一台带 3D 显卡的 Windows 来做 3D 渲染,计算机就是不同的组合。我们坚信,现在的 agent 和未来的 agent 需要这些不同的计算机组合来完成不同类型的任务。所以我们通过 API 提供这些。

A

对,我想尽量把那些让人恍然大悟或惊叹的瞬间放在前面,这样大家能保持兴趣,点个赞、订阅一下。这个市场正在爆发,对吧?你们报告了74%的月环比增长,而且已经持续了一段时间。不只是你们,几乎每家计算提供商都是这样。我不知道你同不同意我用“计算提供商”这个词,但确实如此。这是有机的PLG驱动增长,同时企业业务也做得非常好。我想把时间倒回到去年一月,你们做转型的时候。显然你们很早就看到了这个市场,提前布局,现在成了市场领导者之一。但当时是什么洞察让你们决定转型的?

B

让我们做这个转型的洞察来自前一个季度。也就是2024年底,我们基本上做了一次演示,我记得我们之前也聊过。当时Devin还没公开,你实际上给了我Devin的访问权限。对,我用了。

A

你——我觉得我不该给的。

B

对,没错。

A

无所谓,我给了大概三个朋友权限。

B

对。或者是你打来电话,给我演示了?不重要。但当时OpenDevin已经可用,现在叫OpenHANs。我们就想,哦,这看起来是个趋势。这东西还没公开。我们就把面向人类的开发环境自动化方案,结合OpenDevin,作为SaaS推出来。我们这么做了。注册使用的人不多,但很多人找过来,他们正在构建agent,说:“嘿,我的agent需要一个计算沙箱运行时,随便你怎么叫。”我忘了当时叫什么了。然后我们就想,哦,太棒了,这是个新市场。这是我们的基础设施,这是我们的产品,上吧。但我们很快发现,人们并不喜欢我们做的东西。它不好用。我记得刚开始做的时候,跟人聊起我们为agent构建的沙箱,他们说:“这有什么不同?不就是一样的东西吗?我们有EC2、有VM、有所有这些。”但每个我们给过的人——大概二三十个——都说不行,这不是我们需要的。这东西会出问题。基本上,我和联合创始人对此了解不多——因为我们是搞基础设施的,不是搞AI的。所以我决定自己去把每个播客都看一遍,包括所有这些,还有那些,然后跟上最新动态,读所有博客,搞明白到底发生了什么。

A

要不要提一下哪些播客对你有用?万一别人也在找。

B

总的来说,我看了几个播客,不同领域、不同类型。有你们,No Priors,Bill Gurley的节目在的时候也很棒。还有几个,20VC从不同角度挺有意思的,还有一些别的动态——

A

但我们其实不是讲计算市场的。

B

它当时也准备好了。

A

抱歉,我猜你是在看agent基础设施市场。

B

我在看agent市场,整个AI市场,了解有哪些玩家、他们的认知和趋势。显然,这还得配合参加大会、活动、聚会、读白皮书,做所有了解情况必须做的事。所以当我们大致想清楚要构建什么时,就在除夕夜,真的是除夕夜,我半靠“vibe coding”搞出了第一个MCV——也就是今天Daytona的第一个最小可行产品。我大概凌晨三点才睡。我把小女儿和老婆哄睡,说了新年快乐,然后回去继续搞。我发给了联合创始人兼CTO,他早上看到后说:“这绝对是垃圾,千万别给任何人看。但想法不错。”于是他花了两周重做了一遍。

A

当时它长什么样?很粗糙吧。

B

不止,比那还糟。但就是一个非常简化的版本,展示了它应该是什么样子。能用,但不理想。所以他深入钻研——这是CTO的职责——然后带着新版本回来了。我们给所有三个月前说“这是垃圾”的人打了电话,安排了演示,给每个人都展示了。所有通话都超时了,每一个。原本15分钟的通话,都拖到了25、30分钟。每个人都说:“我们需要,我们要用。”当时没有登录,只有一个API key,因为这只是beta或alpha版。他们说:“哦,我们要用。”我们就说:“好,谢谢。”但第二天,如果我们没发过去,每个打过电话的人都回来问:“我的API key呢?”每个人都想要。我们想:“靠,就是它了。”我从未有过这种感觉。首先,理解你说的——大多数人以为agent和人类用的是同样的基础设施。我们三个月前就明白不是了,只是不知道正确的原语是什么。然后当我们搞清楚了——我们可以聊聊那是什么——并给这些人演示后,我从未经历过——我做过好几家公司——从未经历过人们会因为你没给权限而主动打电话催你。他们立刻就要。所以我们就想:“好吧,他们不想要这个。他们想要的东西似乎不存在,或者他们没找到,而且他们非常想要我们做的。”然后我们就知道找对方向了。再想想市场规模:人类工程师和企业市场已经很大了,比如GitLab之类的。但未来每一个可能存在的agent的市场呢?那有多大?我们想:“我们全力投入这个。”于是我们就在旧产品和新产品之间做了切割。

A

对,但当时它还不能组合。

B

基本上就是一个Linux盒子,你可以调整CPU数量、磁盘和内存。就这些。你不能有多个操作系统,不能实时调整大小,不能加GPU,不能做其他所有事。它只是第一个变体。

A

而且从一开始就是裸金属?

B

从一开始就是裸金属。有趣的是,我们立刻想到——

A

给大家讲讲背景。通常的路径是什么?

B

对。基本上,大多数提供商是在VM上运行这些。

A

对。

B

还有 Firecracker。对。嗯,他们在虚拟机上运行 Firecracker。我们也有 Firecracker。我们有多个隔离层,可以做到这一点。但常见的做法是,一方面,机器状态或硬盘本身并不属于沙箱的一部分。另一方面,它们并不打算永久运行。所以大多数都是可抢占的,也就是说,它们有一个存活的时间。因此,我们当时的想法是,智能体在某种意义上会像人类一样——你不想在完成工作前让笔记本电脑关机,你想合上盖子再打开,但状态保持不变。所以智能体也会想要这样,比如暂停后再回来。它们想要这两点,但智能体也非常非常看重速度,对吧?它们能获得速度吗?所以当我们思考这个问题时,就觉得我们需要某种极快的东西。如何让它快,如何让它长时间运行且有状态。这两点就像是把 Lambda 和 EC2 结合起来,对吧?两者合在一起。我们当时并不知道别人是怎么做的,因为我们不太了解这个领域已经有市场了。这更像是,好吧,这是我们需要的东西,也是它们需要的东西。我们看了 Kubernetes,它不够好。我们看了 Nomad,它也无法实现这一点。所以我们在 Code Anywhere 重写自己调度器的经验,基本上就是我的 CTO 想出来的。他说,哦,从那里学到的经验。他带了过来。有趣的是,我们的第三位联合创始人看到它时说,老兄,这是什么?这简直是 2008 年的东西。我们像是回到了过去,他说,没错。所以 Daytona 之所以超级快,你在基准测试中也能看到,是因为我们基本上运行在裸金属上,有自己的调度器,使用底层机器的磁盘、CPU 和内存,这意味着你的 IOPS 极快,因为没有网络延迟,比如 EBS 之类的东西。而且快照、时间点、模板也都预加载在裸金属机器上。所以当你从模板或快照启动一个沙箱时,你实际上会被引导到那台裸金属机器上,该快照就基于那个 NVMe 驱动器。然后它就直接启动那台机器,而且是本地的。没有网络延迟之类的东西。这就是我们从第一性原理出发,思考智能体的计算机应该是什么样子时,得出的具体方案,也是我们创造出来的东西。

A

嗯,我可能应该——我不知道你是否认同这一点,但有人在做 compute SDK。你们在那上面表现很好,比如 TTI 对吧?我想。这对你们来说是一个相关的基准测试吗?

B

我不知道。而且它每天都在变。所以今天是 Arc Hill。

A

我不知道 Arc Hill 是什么。从没听说过。

B

对。Arc。嗯。就是这样。

A

但你们至少处于下一梯队性能的三分之一位置。然后,还有很多其他更知名的名字启动非常慢。

B

对。我们长期以来一直是遥遥领先的第一名。但现在沙箱的定义也不同了,有不同的隔离模式和其他东西。所以 Arc Shield 基本上是在 S3 上运行数据。这非常不同,他们启动一个沙箱,再为它启动一个容器。所以这是不同类型的东西。

A

嗯。

B

所以沙箱的定义是我们都需要达成一致的。但没错,我们在启动和运行这些东西上非常快。你甚至可以看到那里是 0.10、0.11。所以差不多。对。

A

嗯。

B

对。

A

我是说,你还需要什么呢?对吧。

B

所以基准测试本身。嗯,在这个领域,我不认为基准测试等同于市场份额或收入之类的东西。我在多个基准测试中都看到过这种情况,不仅仅是沙箱领域,而是围绕基准测试的普遍现象。

A

这是入场门槛。就像,没错。

B

但你必须排在前列,必须参与竞争,这样人们才会知道,哦,这绝对是顶级之一,因为这只是客户看中的一个维度。还有其他东西,比如你能连续启动多少个?还有功能集、支持、以及人们关注的各种不同方面,但你肯定要在基准测试中有一席之地。

A

人们会连续启动多少个?

B

我们有——

A

并发,我想是并发,对吧?

B

所以我们关注三个指标。一个是启动一个的时间。我们启动一个的时间是 60 毫秒,包括网络延迟。所以请求、启动、回复,整个过程 60 毫秒。这是单个。但如果你想一次性启动 50,000 个。我们现在大约需要 75 秒。所以并发启动 50,000 个大约需要 75 秒。其他一些,有公开数据,比如需要 2,000 秒,也就是 30 分钟。有各种不同的情况。然后还有——所以是单个速度、多个速度,以及你能持续稳定运行多少个?我们目前基本上没有上限,因为我们拥有自己的裸金属。但我们最大的客户每天大约运行 850,000 个,接近每天一百万个。我们还有一个请求是 50 万个并发,也就是字面意义上的 50 万个 CPU 在某个地方运行。所以这很有趣——

A

他们按 vCPU 秒之类的付费。

B

对,对,对。

A

另一件事,我想是休眠和恢复,因为所有这些都涉及有状态的恢复。人们通过这个运行什么样的工作负载?对吧?我们是用内存的 GB、存储的 GB 来衡量吗?比如网络附加存储。我不知道,在这些功能中,哪些是最昂贵的?

B

最贵的是 CPU。第二或最便宜的是 RAM,然后是磁盘。我们实际上不收费——

A

快照,对吧?

B

不,快照是其中一部分,但基本上是你机器硬盘的大小。所以你是 10 GB?20 GB?50 GB?还是别的?然后还有数据传输。目前我们在 Boozon 完全不收网络费用。

A

哦,对,对,你得改改这个。

B

对,这在我们账单中占越来越大的一部分。所以我们正在处理这部分。显然,这是最便宜的。对。所以硬盘是最便宜的。所以基本上是 CPU、RAM,对我们来说是网络,因为我们不向客户收费。然后硬盘是启动的方式。但也有不同类型的工作负载。所以我们基本上在 Daytona 中把它分成两类。一类是我们所谓的后台智能体或长时间运行的智能体。另一类基本上是 RL 和评估,我把它们放在一起。它们的使用模式非常不同。如果你看后台的使用情况,我会提一些公司的名字,但不是特指。

A

比如 Open All Hands。

B

是的。所以像 background agent、Cognition、Lovable 这类产品,其实都是 Harvey 那种模式。这些都是长期运行的后台 agent。如果你看它们的使用模式,会发现跟人类很相似,就是跟着太阳走。基本上,使用高峰在中午,低谷在午夜。周末低,工作日高。

A

这个问题挺有意思。全球化程度如何?是不是主要集中在美国?

B

美国确实占很大一部分,但我们目前有亚洲、欧洲和美国三个区域,所以相当全球化。是的,相当全球化,覆盖很广。有意思的是,我跟你说过,我们用户数量最多的城市是新加坡。

A

哦,真的吗?

B

这挺有意思的,对吧?不是按收入算,而是按人头算。就是个挺有意思的现象——

A

新加坡在 AI 普及率上高得离谱,人口才七八百万,却老是出现在榜单上。

B

对,确实很有意思。我们当时也很惊讶,心想,哦,这挺有趣的。还有一个——

A

这就是为什么我要在新加坡办 AIU 大会。

B

没错。因为我就是从那里来的。我们也会去那里。另外有意思的是,日本也排在前列,或者说东京排在前列,这在以往的技术周期里是从未有过的。

A

是啊。

B

从来没有过。所以我觉得日本人就是特别喜欢 AI。

A

对。然后还有巴西。

B

是的。但巴西一直就在榜单上。即使我看 GitHub 的数据,或者我们以前做 Code Anywhere 的时候,通常都是美国、西欧,然后印度、巴西、中国这些地方。但新加坡以前不在,日本也从来没出现过。在这个领域里——嗯。

A

奇怪的区域分布。

B

对。所以它非常全球化。

A

实际上,这也有助于你分散全天的负载,对吧?

B

是的。有意思的是,我们有这类负载,但如果你看研究人员的负载,就完全不同了。比如你给他们 1 万、5 万或 10 万个 CPU 的并发,他们一启动任务,就是 100% 全速运行,一直跑,跑完就停。使用模式基本上就是方块形状,对吧?而且也不跟着太阳走,因为人们可能在半夜睡觉前启动任务,然后醒来再看结果。所以非常不可预测,你根本不知道它什么时候来。这种使用形态跟我们以前遇到的完全不同。另外有意思的是,对于跟着太阳走的模式,即使公司增长很快,你也能大致预测使用模式,并准备足够的容量,因为它的增长是可预测的。但当公司做评估和强化学习时,负载就非常尖峰。他们可能平时什么都不用,然后突然说,能给我 10 万个吗?用完又降下来,然后又来 10 万个,又降下来。所以非常非常不同,对吧?

A

所以你们想让他们承诺用量,对吧?是的,我们确实这么做。

B

我们必须让他们承诺某种用量,才能预留容量,因为我们基本上得为峰值做好准备。

A

对,对。

B

没错。所以现在 Daytona 的平均利用率是 15%,1.5。

A

天哪。

B

所以非常低,但因为负载非常尖峰,我们又能达到 90%。对,对。所以我们面临的情况是,作为一家公司,我们正在研究类似 Cloudflare 的做法,可以根据地理位置迁移负载,这对那些跟着太阳走的 background agent 很有效。但这不是一回事,形态完全不同。显然,随着规模扩大,这些问题会解决,但作为 agent 领域的计算提供商,这确实是一个有趣的新问题。

A

是啊。

B

最近我们开大会时,跟 Neon 的 Nikita 还有——

A

我应该提一下。

B

Parallel 的 Parag 他们聊过,大家都有同样的问题,就是负载超级尖峰。这是以前从未发生过的,这种类型的——以前振幅没这么高,对吧?所以这是个很有意思的用例和待解决的问题。

A

对。我不知道我们会不会再聊这个,但先说说大会吧。你在勇士队比赛现场请了大概一千多人?在——抱歉,是哪里?叫什么来着?

B

大通中心。

A

大通中心。

B

大通中心。

A

我去了。非常令人印象深刻。显然,你很会办大会。你学到了什么?你请来了这么多大咖。

B

对。

A

你想从中得到什么?

B

我办这场计算大会的初衷,是把为 AI agent 构建基础设施的人聚在一起。因为在我看来,我们正在构建的东西里,agent 是主要用户。agent 的人体工程学和使用模式是什么?所以我想探讨这个。我发现——这之前只是个理论,还没被证实——就是我们都有我刚才提到的那些问题。我在台上讲的时候,感觉大家都有同样的底层基础设施问题,就是这种尖峰、不可预测的工作负载,这在人类计算或人类基础设施里是从未有过的。而且,这跟我跟 Parag 聊,或者跟 Lynn、Nikita 聊时一样,尤其是 Lynn,我前几天还跟她聊过。这是个非常有趣的问题,因为我可以拿 Cloudflare 举例,最近有很多关于他们如何解决这个问题的讨论,就是他们有很多地理区域,用户在不同地方工作,根据你的层级,他们可以把你迁移到不同区域。这样他们就能提高利用率。但你可以大致预测这些,而且很少会出现 10 个数量级的尖峰。比如你的某个客户有个指数曲线,那是什么程度?我拿 Cloudflare 举例,可能是 10%、20% 之类的。我没有具体数据,只是猜测。肯定不是 10 倍,对吧?肯定不是那种程度。那你怎么去解决这个问题?我们都在用不同的方式解决。所以,是的。

A

所以她也有同样的问题。

B

对,我知道 Neon 也有这个问题。比如我们怎么解决这些尖峰负载之类的问题?因为我们聊过。所以对我来说,真正内化的一点是,是的,所有为 agent 优先构建的人都在经历这个,我们都在解决类似的问题。

A

让我深入一下。比如 Neon,我碰巧知道他们非常依赖 S3,对吧?他们完全押注在 S3 上,然后享受 S3 分布和基础设施的好处。所以我猜 Neon 可能不用太操心,而 Lynn 可能得多操心一点,因为她显然在做 GPU 推理。听众们,我们一年半前跟她做过一期节目,她确实需要操心。

B

对。

A

但,嗯。

B

所以 Parag 肯定也操心。

A

Parag 是 Parallel 的 CEO。

B

对。

A

前 Twitter CTO。

B

Twitter。

A

对,它们就是搜索引擎。

B

没错。

A

它们就是搜索。你我都知道。听众们不知道。

B

我们可以把它写在屏幕上。所以,因为我们当时——

A

我是说,我把它投到屏幕上了,这样大家如果需要可以自己查。

B

是的,但它们仍然需要 CPU 和 RAM 的分配,你必须准备好这些资源。所以基本上有两种做法。一种是过度预配,以应对突发流量;另一种是,我不知道这算不算一个术语,即时计算,也就是随着你的使用量增加,你可以向其他云服务商发起虚拟机或裸金属的请求,然后让它们启动运行。

A

所以这是指超过 100% 的情况,对吧?就像你的溢出。如果是溢出,比如溢出或类似情况,你可能会亏钱,但没关系,对吧?

B

嗯,可能亏,也可能不亏。这是一种更经济的方式,但速度更慢,因为你需要做的是排队请求,启动这些即时计算资源,准备好一切,配置好,然后把工作负载放上去。所以如果时间不是那么重要,那没问题,你可以这么做。但如果你的客户,尤其是对于强化学习训练任务来说,很多人来找我们是因为 GPU 比 CPU 贵,对吧?所以你希望 GPU 始终以 100% 的利用率运行。因此,当你在 CPU 上运行任务时,当 CPU 周期处于空闲并准备启动下一个任务时,你希望这个过程是瞬间完成的,这样你的 GPU 就不会闲置,对吧?是的。如果你还得去外面配置机器,那基本上就是在告诉 GPU 它必须等待,而这会带来成本。所以你需要解决这些问题。

A

对,我们来谈谈不同的工作负载吧。你说过,几个月前你的强化学习工作负载还是零,现在占到了 50%?

B

这个月就会到 50%。是的。

A

我们来聊聊这有多不同吧。比如,我想象中,动态代码生成(比如生成任意代码)会少很多。这里可能都是相同的代码,你只是在做并行运行之类的。

B

我不确定。是的,所以每次运行你都会有一个快照。大多数情况下,他们实际上会使用我们的声明式镜像构建器,比如,agent 需要这些依赖、这些 nbar。

A

对,Clarivision 构建器,这很像 Modal 的东西。

B

是的。所以我们实时构建它,然后传播那个快照,接着你可以针对那个快照启动任意数量的沙箱。如果需要做更改,模型可以自动完成,或者可以自动化。比如,下次运行我们需要安装这些东西,或者移除这些东西,来完成一个任务。然后它就去运行了。所以,是的,这似乎是他们偏好的方式。我发现的首要原因是,或者说,让我们退一步看。在那个环境中,我们主要竞争的是托管 Kubernetes。是的,EKS、GKS 之类的,绝大多数人都在用这些。任何尝试过 Daytona 对比 GKS、EKS 的人都会说,我再也不想回去了。这有几个原因。一个是易用性。如果你用 Kubernetes 来启动这些,你需要管理与之交互的接口。Daytona 虽然是一个计算提供商,但从使用角度来看,它更像 Twilio 和 Stripe,而不是 AWS。你有一个 API、一个 SDK,启动和运行这些东西非常轻松无缝。这是其一。另一个是我们启动的速度,我们之前提到过,要快得多,还有我们能够达到的规模。我们还没讲到功能,但有一个有趣的功能是,我们的沙箱很难出现 OOM(内存溢出),因为我们可以动态地实时调整大小,这在其他几乎所有平台上都是不可能的。有一些技术可以实现这一点,但非常困难。我们实际上是在 Terminal Revenge 团队把我们引入这个领域时看到的。所以,谢谢 Alex 和团队把我们带进这个领域。

A

嗯,一个框架直接说“大家就用 Daytona 吧”,这种情况非常非常罕见。

B

是的,我想它某处确实这么写了。

A

对。我当时就想,这是什么?

B

那里有很多,但他们也提到了其他几个地方。是的。所以具体到 Daytona,我们只是在顺着话题聊。我不知道它具体在哪里提到了 Daytona。

A

抱歉。

B

我不知道。

A

有一个非常非常强烈的推荐,这很不寻常,就是——我们没有为此付钱给他们。就说没有。是的。他们就是喜欢你。

B

是的,他们喜欢我们。嗯,对。还有一件事,DAZN 底层有多个隔离集。客户不需要知道它们是什么,但基本上我们有 Docker,这是一个容器,通过 Sysbox 加固。所以它的隔离性在安全上等同于虚拟机,但它仍然是一个容器。这是默认设置。尤其是在这些训练工作负载中,他们非常喜欢这种接口,能够使用基本的 Docker 容器。我们还支持 Docker 内嵌 Docker。对于这些强化学习运行,如果你需要做 Docker Compose 或 Kubernetes,你可以在这些容器内部启动一个 K3s,这解锁了大量在其他提供商那里无法完成的工作负载。所以仅就这一点来说,就更有趣了。我们经历了这个过程,向他们展示了我们可以做到,他们非常喜欢。他们指的是——那些人,是的。

A

那些人。你知道他们现在成立公司了吗?

B

据我所知,还不知道。

A

好吧。是的,很明显,这些事情带来了很多兴奋和成功。再多告诉我们一些吧?这是一个爆发式增长的工作负载。Harbor 采用了你们,这有助于加快进度。但随着这种新工作负载上线,你们学到了什么?

B

当然。我们学到了几件事,我们在开头聊过,这成了我们的故事主线。正如我们提到的,我们一路上和很多客户交流,随着交流的深入,我们增加了更多功能和工具集。我认为,这个生态系统非常小,或者模型变得更聪明了,以至于当我们看到一个用户带着请求来的时候,如果那一周有 3 到 5 个客户提出同样的请求,我们就知道它要上路线图了。这非常奇怪,这种情况发生了很多次,就像——

A

因为他们都是朋友。他们都是朋友。他们在同一个群聊里。

B

对,很可能。因为,他们就会说,哦,你能做这个吗?我就想,好吧,这挺有意思的,我们把它加到功能请求里。然后下一个又说,哦,你能做那个吗?行吧。其实都一样,对吧?永远都是那几样。所以我们尝试做的,也是我个人尝试做的,就是尽可能多地参加所谓的销售电话。我待在每一个 Slack 频道里。我们大概有 1000 个 Slack Connect 频道,差不多这个数。这挺有意思的——当你拥有所有 Slack 频道时,你会发现很多有趣的事情。你还能看到人们在不同公司之间跳槽。你会看到有人离开一个 Slack 频道,又加入另一个。这很有意思。另外,我顺便说一句,我觉得 Slack Connect 简直就是 LinkedIn 该有的样子。没错。你有一个列表。

A

LinkedIn 要你付费才能使用自己的关系网,但 Slack 不用,对吧?Slack 是免费的。它只是粘性更强。这很棒。

B

对,太棒了。

A

你会一辈子用 Slack 付费。

B

没错。你就在那儿待一辈子了。所以这很有意思。我们之前聊到的一个新动向是,我们在计算机使用(computer use)上下了大赌注,投入了很多资源。这个功能还没有公开亮相。我们还没有正式发布,但我们——

A

有我能调出来的东西吗?

B

那里有计算机使用功能。就在上面一点。

A

哦,好的。

B

好。不错。我们讨论过、也在公开场合看到的是,现在有一个主题叫“人类模拟器”(human emulator)。

A

在哪里——

B

xAI 的 Elon 也公开谈过这个。如果你想想现在的模型,它们其实相当复杂,能做很多工作,但它们仍然无法访问所有工具。我坚信,Agent 最有效的工作方式本质上是无头的(headless),或者通过终端之类的。但如果我们看看知识工作(knowledge work)的整体情况,美国大约有 1 亿知识工作者,全球大约有 10 亿,而他们的薪资总额在美国合计约 10 万亿美元,全球约 50 万亿美元,差不多这样。如果我们看其中最重要的 5 个行业,比如医疗、政府、金融服务等,这大约占 56%。所以大概是一半左右。那么在美国,大约是 25 万亿美元,而其中大部分工作实际上仍然被锁定在 Windows 上的遗留应用里,这些应用在很长一段时间内都不会消失。人们就是不会去投资改造它们。有多少呢?我们的假设是这样的。在 RPA 市场(一个类似但不完全相同的市场)中,大约 25% 的白领工作被自动化了。如果一个 Agent 更复杂,能处理更多轮次,自己搞明白事情,假设是 40% 吧。那么如果你取这 40% 的 1%,你就能得到大约每年 10 万亿美元。

A

这就是你的 TAM(总可寻址市场)。

B

这就是 TAM。这是模型层面的 TAM,对吧?不完全是我们的,但规模能达到那个量级。而要做到这一点,你基本上必须给 Agent 提供带有遗留应用的计算机。所以是计算机使用,无论是 Mac、Windows 还是 Linux。Linux 我们当然也有,其他人也有,但 Windows 是特别新的东西。目前唯一的选项是 EC2 上的 Windows 或者 Azure 上的 Windows,两者都需要 3 到 5 分钟才能启动。我们创建了一个真正的沙盒(sandbox),所以是秒级而不是毫秒级。但你有时间点快照(point-in-time snapshots)、分叉(forking)等沙盒应有的一切功能,这基本上能让你有望解锁所有这些价值。所以这就是我们大力推动和押注的方向。我们一直在密切关注市场,接下来会是什么?

A

对,知识工作、构建,以及某种意义上的 RPA,RPA 的下一波浪潮。我在疫情期间对 RPA 非常兴奋。当时 UiPath 正在 IPO,那是一个非常艰难——它是不是东欧的公司?

B

是罗马尼亚的。

A

罗马尼亚。对,它可能是罗马尼亚唯一的独角兽大公司。好吧。我不知道。我觉得 RPA 复兴的舞台已经搭好了,因为大家都明白这一点。没错,没人想处理这些烂应用,也没人会重写它们。你只能对它们进行远程操作和程序化操作。

B

但如果你想解锁它,我自己的设置大概是这样的。我上个月在做一份董事会演示文稿。我就想,好吧,咱们就自动化吧。我们所有的数据都在 ClickHouse、PostHog 和 QuickBooks 里,和其他人一样。我基本上把这些都连到了我的云代码上,比如用 Go 写云代码,然后说,这里有集成,去做吧。它拉出了第一份报告,效果很好。它连上了 Brex 和所有这些服务,拉出了数据,很棒。然后我说,好吧,现在拉出这个、这个、这个、这个。我不断得到那种麦肯锡风格的设计报告,但数据是部分数据、全部数据缺失、部分数据,它无法访问所有东西。我特别沮丧。所以我就拿我的 Mac mini 虚拟沙盒,配上 OpenClaw。我在公司里给了它一个自己的账户。然后我去所有这些服务创建了一个只读账户。就像你公司里的一个实习生。然后我会说,现在去做这份报告,它会得到同样的——或者说,我无法通过 MCB 或 API 之类的东西获取所有信息。我就说,去登录。对。然后它会登录网站,进去,导出数据,端到端地完成整个操作。所以即使对于今天有 API 的东西,也不是所有功能都暴露出来了。而为了获得价值——我现在确实获得了巨大价值——但不幸的是,它必须是一个计算机使用 Agent。所以我花了很多 token 在这上面,但任务完成了。所以,如果连我们这样的初创公司,用着所有最热门的工具,仍然需要一个计算机 Agent,那高盛这样的公司还有什么希望去做无头化呢?

A

对。

B

对。

A

为什么微软不做这个?

B

嗯,我相当确定,Satya 昨天发了一篇帖子。

A

哦,好吧。

B

大意是每个 Agent 都需要一台计算机。

A

我明白了。

B

我明白了。所以他们推出了一些东西。

A

对。他们有 Microsoft Power Automate。我肯定,他们会有自己的版本。

B

那个的版本。

A

对。而你会尝试做你自己的。我一直知道 Mac 总有需求,但我知道托管 macOS 沙盒很棘手。

B

我们很快就会有 macOS 沙盒。macOS 沙盒的问题在于——我深入研究过这个。我不知道这有多有趣。macOS 有这个毛病。

A

是许可问题。

B

许可问题。

A

对。

B

所以第一,每台机器只允许运行 2 个并行虚拟机。这是第一点。第二,每 24 小时只能授权给不同的用户。也就是说,如果用户进来,理论上我想按秒收费,只收 1 秒的钱,那这台机器当天剩余时间就得闲置。我不能让其他人再用它。所以定价会不同,我们得按 24 小时收费。这还不是最麻烦的。更麻烦的是,从安全角度出发,他们允许你做内存快照、暂停、恢复,但只能在同一个物理硬盘、同一台物理机器上。而在 Windows 或 Linux 世界里,你可以在后台把快照从一台机器迁移到另一台,然后管理负载。如果你想这么做,基本上就得把你的——对。

A

快照。

B

你的物理机器。

A

你不能拆分它。

B

你不能随意移动这些东西。所有这些,从安全角度来看,我理解安全方面的考虑,但它让你无法运行那些 agentic(代理式)的、真正可扩展的 agent 工作负载。

A

你需要做一个 vibe-coded(氛围编码)的 macOS 洁净室实现,然后就可以——就像 CleanOS 之类的。我也不确定。

B

我想也是。

A

你知道,Linux 最初就是 Unix 的洁净室重写,对吧?macOS 也一样。总得有人来做这件事。

B

会有人做的。我们会运行一些持续几天的长期 agent 来搞清楚这些。但确实,我们离提供这样的服务很近了,因为人们确实想要,但定价会不同,功能集也会比较严格。

A

是啊,没人会用这个。我是说,实验室会用,因为他们想自动化。他们有一个 URL。

B

又得做 RL(强化学习)了。但关键是,如果你在 macOS 上做 RL,那么模型的下一轮迭代就能更好地使用这些工具。然后你实际上需要在某个地方运行这些工具。所以之后你不得不拥有这个能力。如果有苹果的人在听,我强烈觉得他们在自断财路,如果他们能启用类似于 Windows 和 Linux 上的并发模型,他们本可以获得的计算或授权收入规模会大得多。

A

是啊,我肯定他们以前就听过这个。他们只是不在乎。也许新 CEO 会改变主意。

B

嗯,走着瞧吧。期望很高。期望很高。

A

好吧。但我的意思是,很明显 Windows 的市场机会巨大,你可以靠 Windows 撑很久,但你的客户会两者都想要。对我来说有趣的是,这就像是 agent 的终极应用,对吧?我不——OpenClaw 对你们来说有多大?有没有一个显著的提升?

B

对我们来说没有。我们的定位不太一样,虽然完全是 PLG(产品驱动增长),也有个人开发者在使用,但 Daytona 的大多数用户更像是 B2B2C。要么是 B2B,要么是 B2B2C。比如在研究领域是 B2B,你卖给实验室和新实验室之类的。但在长期 agent 方面,从规模化收入的角度看,主要是 B2B2C,也就是有一个应用层的 agent 大规模地使用你。

A

比如 Manus。

B

对,像 Manus 或 Lovable 那种。

A

对对对。B2B2C 基本上就是我所说的 agent 实验室,有点像你不是在模型实验室,而是在做一个非常好的封装平台,其他人可以注册,这样他们就不用自己写代码了。听起来比直接的 OpenClaw 市场好得多。

B

我做过很多不同的事。Code Anywhere 在我们职业生涯和日历上,是一个非常面向终端开发者的产品。那很棒,你能获得很多开发者的喜爱,我觉得我们公司也确实有不少开发者喜爱,但那是另一种类型——人们是在构建这些东西,更像 Twilio,因为你不会去运行 Twilio。我不知道有多少人还记得那个“Ask a Developer”广告牌之类的。人们真的很喜欢 Twilio,但他们只在“我在为某件事构建这个应用或服务”时才用它。所以我们很大程度上是朝那个方向走的。而且你也知道,我以前在 Twilio 的竞争对手工作过,所以这大概已经刻在我的 DNA 里了。

A

人们不知道 Infobip 有那么大。

B

是啊,就像——

A

因为他们都是美国人,觉得欧洲的东西跟我没关系。但它是同样规模还是更大?

B

更大?不,大概是一半大小。

A

一半大小?

B

对,所以还是很大。每年几十亿美元。

A

是啊,太疯狂了。

B

没错。这些都是非常有趣、收入可观、粘性很强的业务。而当你面向终端开发者时,销售非常困难,因为他们对价格非常敏感,非常在意成本。而且很难规模化,因为愿意启动——首先,他们得愿意启动一个,然后启动多个。而在企业端,我们都知道大家都在谈论花了多少 token,我现在花得——很多公司今天的状态是“这是我们公司,能花多少就花多少”。基本上这就是我们的方向。所以如果你想想这个范式:你卖给那些说“能花多少就花多少来创造生产力”的公司,对比“我是一个个人,我有这么多预算,我做这件事是因为好玩或者对我有帮助”,这是完全不同的市场策略。

A

是啊,有很多讨论。我脑子里过了一遍对你有利的因素,比如 MCP 对比 CLI。显然你想要 CLI。这对你来说一直很好。我觉得这可能只是冰山一角,也可能很大。我只是在确认这些是不是大趋势。

B

这些东西确实对我们有利,就像你说的,但它们其实只是杯水车薪,对吧?我觉得所有因素都得综合起来看。影响它的东西太多了。就像你说的,Open Claw 对我们来说不算什么大事,但 Anthropic 的 agent SDK,或者说 Claude Code,就很有意思。它有意思的地方在于,很多所谓的应用层 agent 公司——我也不太确定该怎么称呼它们——基本上就是觉得,“哦,我可以创建这个新应用,我有这个新 agent,我只需要用 Claude Code,把它扔进一个沙箱,然后就有了面向用户的界面。”这样一来,更多公司就能真正提供这类服务,然后它们就会去调用沙箱。所以这挺有意思的。还有你提到的 MCP 和 CLI 的对比,MCP 是对 API 的接口,而 CLI 则是让你能真正去做事情,就是这样。区别在于集成和实际运行脚本、数据或分析之间的不同。所以,如果能很好地使用 CLI,agent 就能做更多事情。正因为如此,人们会调用沙箱,在 CLI 里运行,然后对数据进行分析,最终给出实际结果,而不仅仅是像从 API 拉取数据那样。

A

对,这就是一个间接层。没错。就像 Agentic Search 和 RAG 的区别一样——

B

没错,没错。是的。

A

只要人们把更多 agent 放进工作流里,你就赢了。没错。所以具体是什么其实不重要,我只是想梳理一下,大家还听说过哪些类似“哦,这又是一个沙箱用例”的东西。“哦,那又是一个。”我有没有漏掉什么重要的?

B

还有一个就是计算机使用(computer use)相关的东西,我觉得这可能是最有趣的。就像你说的,过去一年我们和很多人聊过,他们总问:“哦,你为什么需要沙箱?为什么需要这个?为什么需要那个?”然后就像你说的,变成“哦,我需要沙箱做这个,我需要沙箱做那个,我需要沙箱。”最后发现,每件事都需要它。所以基本上,这听起来像老生常谈,但你每天都会用笔记本电脑,对吧?你只是一个人。但现在想象一下,顺便说一句,笔记本电脑、计算机、PC 市场,PC 市场规模大概和云市场差不多。每年大约 1500 到 1800 亿美元,差不多是三大云巨头的规模。和苹果、惠普、联想这些公司差不多,可能略小一点,但大致相当。现在想象一下,这个可寻址市场有多大?世界上有多少人?最新数据是多少?

A

就算 80 亿吧。

B

80 亿。对。假设每人有两台电脑,比如一台个人用、一台工作用,那就翻倍了,也就是 160 亿,对吧?那么两年后、十年后、一百年后,会有多少 agent 在运行?每个任务都需要一个这样的东西。所以这个市场有多大?基本上可以说是“无限”。你会遇到资源瓶颈。Dylan Patel 在会上提到过,他是 Semi Analysis 的,通常讲 GPU,但这次他也说 CPU 现在会成为瓶颈,因为它是约束条件。你无法增长,或者说我们无法生产足够多的 CPU 来满足需求。

A

对,我其实和 Doug O'Loughlin 录了一期很好的播客,他是 Semi Analysis 的总裁。他们基本上认为,先是 GPU 短缺,然后蔓延到内存,现在轮到 CPU 了。接下来是什么?抱歉,网络。对,网络其实已经短缺一段时间了,如果你只看 GPU 网络的话。但说真的,现在计算机使用的量实在太疯狂了。对,不错。我想其他问题中,一个很大的部分就是开源这件事,你本来可以不这么做,你的竞争对手也不这么做。我想很多人担心保持项目开源,因为竞争对手可以直接 fork。不知道你对作为一家开源公司有什么反思。

B

对,有很多。我们最初的产品是开源的。这样做对我们确实很有好处。有句话怎么说来着?那些做得好的公司,会用自由现金流来衡量自己;一般的公司看 EBITDA;再往下,就看 GitHub 星星数。GitHub 星星数,GitHub 星星数。

A

对。

B

所以一路往下,就是 GitHub 星星数。我们最初的产品就是靠 GitHub 星星数。我们当时聊的就是这个。现在我们到了谈收入的阶段,所以我们在那个层级上已经往上走了。我们开始——

A

不,不,是利润,利润。

B

对,我们还没到,但会到的。不过基本上,那时候我们确实看星星数和 GitHub 这些东西,也挺有用的。我们最初做的那个版本,把核心代码拆分到自己的仓库里,用的是 Apache 2.0 许可证,非常宽松。然后我们在企业端,会把核心和一个专有仓库打包在一起。这算是开放核心模式,但仓库本身很干净。当我们转型时,没时间重新思考这个问题,而且我们有一个开源社区,不继续做下去感觉挺可惜的。但我们还是想加一些限制。所以在新的沙箱产品里,我们用了 AGPL-3 许可证,这是一种捷径,它算是开源,从某种意义上说,企业如果想用也可以,但你不能在不开源自己代码的情况下做出一个竞争对手。

A

这大概是三种做法之一。还有 BSL 和其他一些类似 Elastic License 的。

B

对,还有其他一些。纯粹的开源信仰者认为这不算是完全的开源,我完全尊重这一点。这确实没错。但我们保留了这一点,Daytona 本质上,除了功能标志下的内容(比如 Windows 相关、GPU 相关等),其他所有东西都在开源里。所以一切都在那里,包括我们自己的调度器等等。所以我们是——有些竞争对手说,“你们其实是真正的开源,开源。”就像,“你们真的是,你能看到代码。”人们确实喜欢这一点,它也有点帮助,但更多是帮助我们云产品的消费,而不是直接转化用户。原因是,你在集成 Datomic 时,可以把仓库发给你的 agent,让它有更多上下文。它就会明白,“哦,原来是这样,所以才会发生这个。哦,所以那个不是这样。”

A

你也可以只写文档,然后——

B

对,我同意。但公平地说,这其实对今天的增长帮助不大。我们和投资者以及其他人都聊过这个话题,比如“你怎么把开源用户转化过来?”

A

开源商业的讨论真是五花八门,对吧?好吧,我就简单说说。很多听众可能没仔细想过,不少人会说,哦,这不就是免费层嘛。比如,你自己跑起来没问题,但一旦认真用,就得联系我们,对吧?就我个人而言,因为我在 Temporal 的经历,这其实是一种进入大公司的方式——那些公司可能因为我们的企业太年轻,或者技术栈某些部分不匹配,而无法通过他们的审核流程。但因为它是开源的,他们先采用了,然后我们再慢慢解决。这涵盖了低端和高端市场。我不知道这是不是——

B

不,不,完全同意。在 AI 转型过程中,我们历史上也发现过类似情况。我们还没聊过这个,Daytona 的客户从单个开发者、YC 初创公司,到所谓的财富 500 强,我甚至想说财富 5 强,也就是全球最大的那些公司。

A

还有你提过的那个大型 Neo Labs。

B

对,对。

A

我们会替他们保密。

B

巨型公司,对吧?因为市场拉力太强了,我们能够绕过这些流程。我不是说我们通过了安全审计之类的所有环节,但就像你提到的,Temporal 早期和 Daytona 旧版本时,我们往往要花几个月,最后他们还会因为“你们公司太小了,我们不够信任”而流失。而现在,这些大公司会推动我们,比如在采购流程中,通常成为大公司的供应商要花两三个月,我们现在五天就能搞定。这倒不是说我们有多厉害,更多是反映了当前市场的状况。所以从这个角度看,开源从市场推广角度来说,我们考虑得并不多,因为我们现在的一切都是通过云产品的 PLG(产品驱动增长)模式,用户注册后就把我们拉进去。

A

我有个个人兴趣问题,不知道你有没有答案——你们和 GitHub 有过问题吗?

B

有一点。

A

有一点。嗯,跟我说说,因为我在想,要取代 GitHub 需要什么条件?

B

关于这个,我想了很多,也在推特上发过,还亲自投资过一些项目。

A

是 Entire 吗?

B

不,不是。

A

好吧。

B

对。我见过 Thomas,或者说是线上见过,我们聊过。我真心觉得,这也是我关注的原因,因为我们有一堆后台长期运行的 agent,其中大部分是 coding agent。大家都在打造 Lovable 或 Devin 的竞品。我们从客户那里看到,他们都在想办法做版本控制,而且方式五花八门,有些方法非常奇怪。原因在于 GitHub 本身是个瓶颈,它不够快,解决不了他们需要的问题。公平地说,GitHub 是为发布后的内循环设计的,对吧?它是针对你笔记本之外的部分。

A

对,GitHub 是外循环的起点。

B

没错。人们开始把它用于沙盒环境,这属于内循环,通常是在笔记本上运行的,对吧?所以它并不适合这个用途。然后我们遇到各种情况,最有趣的是,有个客户会把整个代码库放进沙盒,然后每隔一段时间——我忘了具体时间间隔——就把所有内容转储成一个 JSON 文件,再推送到 S3。

A

嗯。

B

就这样。

A

你自己造了个 git。

B

甚至没有差异比较,每次都是整个文件。因为这样超级快。然后他们回去搜索,找到文件当时的状态等等,因为文本文件、JSON 都很小,网络成本很低,他们不在乎,就这么做了。我当时想,如果人们都这么干,那就说明这个问题需要新的解决方案。对吧?所以对我来说,观察谁在构建这些以 agent 为先的新东西很有意思。我觉得 git 本身在未来仍然存在,甚至 GitHub 也可能存在,但会有一个全新的服务出现。

A

对,没错。Git 就像是启动 CI/CD 的部署产物。

B

对。

A

但在那之前,还有一个 agent 协作层。

B

所以我觉得这方面有值得探讨的地方。但另一方面,还有个有趣的问题是 CI。现在 PR 的数量简直疯狂,对吧?

A

总的来说,即使对你们来说也是这样,对吧?

B

每个人都在创建大量 PR。然后所有这些都要经过 CI,这就成了瓶颈。所有人都在瓶颈上,不只是 Actions,你去任何 CI 提供商那里,如果 PR 吞吐量高,你都会遇到问题。我们聊过一家公司,他们每天有 1000 个 PR,这意味着他们只能排队等着。

A

他们用什么?Buildkite 还是——

B

我不知道,可能是 Circle。

A

你知道,从技术上讲,你的技术可以用在 CI 上。

B

我们聊过这个。

A

哦,好吧。你们聊过这个。这是个认真的话题吗?

B

我们看看进展如何。我们围绕这个聊了不少。我们绝对不是 CI 提供商,对吧?

A

但缺少什么呢?

B

本质上,你可以用 Daytona 沙盒来代替你用的 GitHub runner。对。

A

我唯一想说的是,也许 CI 机器应该非常便宜,而且可能属于低端需求,因为它应该是非阻塞的,像后台任务一样。CI 的紧迫性没那么重要。

B

但性能很重要。

A

对。

B

性能很重要。对。

A

嗯,有意思。在我们离开 Daytona 这个话题,进入更广泛的创始人观点之类的内容之前,当初创公司评估你们时,你们有这么多名字,还有更多不能提的。他们看到你们墙上全是竞争对手。

B

对。

A

而且你们和其中很多都有差异化,但真正打动他们的是什么?

B

我们发现最能打动人的,可能更多是第二天的事,而不是第一天的事。

A

当然。

B

我们反复看到这一点。我们有一堆案例研究,还有更多正在发布。这些都是第三方做的,我们不参与。看这些案例很有意思,因为是第三方,人们更开放,会告诉你,哦,我们用这个竞品,或者我们更喜欢那个竞品之类的。而人们回头找我们的首要原因是,我们的响应速度非常快。

A

那你的团队呢?

B

说的是团队。对。

A

好的。

B

极致的响应速度是目前为止——我们现在可以聊功能、产品广度、并发、CPU这些,但我觉得那可能……如果其他条件都差不多,这确实是我发现的一个差异化因素。而且我并没有——

A

这完全是通过 Slack,还是 Slack 加邮件?

B

邮件也有。还有电话,但绝大多数是现场沟通。所以主要是 Slack。比如我们有客户说,嘿,我们有个问题,能上 huddle 吗?我们真的会在 5 分钟内就上线。我做过很多次了。所以是的。

A

等等,好的。那你们团队有多大?

B

目前 25 人。

A

你们是怎么做到这种支持水平的?这——

B

我们很疯狂。不睡觉。007。你听过这个新说法吗?007。

A

我见过你的团队。他们非常出色,非常投入。但你怎么让整个团队都做到这一点?你知道,这——

B

所以——

A

我自己都有 Slack 疲劳了,你知道吗?

B

是的,我们都有 Slack 疲劳。我们非常非常累。我们独特的地方——我不知道是不是独特——但我觉得任何成功的连续创业者独特的地方在于,你能把以前共事过的人拉进来。作为首次创业者你做不到。我以前也做不到。但在 Daytona 的 25 个人里,大概有 13 个,我们共事了 7 年以上。

A

嗯。

B

所以这是高信任、高产出、高——我们都知道自己要做什么。尤其是这些人,在我们创业初期、真正拼命的时候——就是那种为吃饭而奔波的程度——就和我们一起工作。现在新加入的人,几乎都是隔了一层关系。就是有人认识的人。所以他们进入这个组织,我们也遇到过不适合的人。就是那种文化,对在线状态和回复有很高的期望。我自己先做到。你去问任何一个工程师,他们都会说,你从来不睡觉。我这么做不是刻意做榜样,我就是这种性格。我妻子不太欣赏这一点,我得告诉你。我跟她提过 996,她说,我倒希望。

A

就像说中国人都在偷懒。对。

B

所以这就是现实。我觉得每家公司都有自己的文化,而且非常根深蒂固。我们的文化就是这样,每天都会被提醒。我当初并没有刻意想这样建设团队,只是我做事的方式就是这样。

A

嗯,我想稍微转到创始人这边。我总体上对你很佩服,你那种平衡感。你有一个年轻的家庭。

B

两个孩子。

A

对,现在有两个孩子了。

B

是的,现在两个。

A

我遇到很多人,他们会说,我要组建家庭了,所以不能当创始人等等。你对这些人有什么建议?

B

每一天都是这样。我的家人现在在这里,但通常——我在克罗地亚和这里之间飞来飞去。我们很多团队在克罗地亚,一部分团队现在在旧金山这边成长。所以我花很多时间远离家人。这很难。这是一种你必须做出的牺牲。但一开始,人们会说,你临终时会错过一些东西。这可能是真的——但我在开始做这件事时就已经知道,这会很痛苦,而一切都要有痛苦。顺便说一句,我非常相信一切都要有痛苦。去健身房很痛苦。减肥很痛苦。一切都要有痛苦,对吧?确实如此。

A

就像没有痛苦就没有收获。

B

确实如此,但你实际上得享受这种痛苦。如果你不享受痛苦,那就不适合你。所以你会习惯那种痛苦。我爱我的孩子,尤其是我有一个女儿和一个儿子。女儿是老大,我很爱她,她不在的时候确实会想念。但这就是我选择的路。我有一个计划和目标,我正在努力实现。现在希望和我妻子——她支持我——我们能更好地协调,让情况不那么糟。但她承担了很大一部分。所以如果你有一个能接受这一点的伴侣,那你就能做到。但即使他们接受,你也得接受自己不在场的事实,对吧?

A

嗯。这是我对你的想象。这个 meme。

B

嗯。

A

那就是你未来的孩子。

B

我觉得是。我们得教他们,他们并不富有。

A

因为爸爸建了计算沙盒。

B

爸爸建了沙盒。爸爸建了沙盒。

A

并且建了 serverless、Kubernetes 和 agent 的精神继承者。还有其他热门话题、趋势吗?你有很多犀利的观点。实际上,你最有名的是,你当时处于那种 hustle 文化模式,对吧?有人引用你的话说,我都没听说过你,兄弟,下线去过圣诞节吧。然后你的回应是?

B

哦,我的回应是,这就是我做不到的原因。

A

嗯。所以我觉得这非常典型。我这里没有,没法调出来。但我觉得这很能代表那种文化。不过,我觉得你还有很多有趣的观点。对创业生态还有什么看法?

B

哦,创业生态。最近的一个观点是,我觉得——而且这是普遍性的商业问题——我觉得在 Twitter 上表达得不太好。有些人总是误解,那就是市场正在给那些转售 token 的 SaaS 供应商加溢价。

A

是的。

B

我认为这是不对的。

A

为什么?

B

为什么我认为不对,是因为你看,首先,你的定价取决于价格,无论是公开市场还是私有市场。读到这句话的人会说,收入的重新加速等于过去的收入,但事实并非如此,甚至差得很远。因为第一,在 SaaS 上,你有典型的 SaaS 利润率,不管是多少,对吧?粘性等等。现在你做的事情是,你说,这是我的 agent,我有多少利润率。实际上要差得多,对吧?

A

嗯。

B

现在你通过我这个 SaaS 模式使用 Anthropic 或 OpenAI 之类的。然后我们作为社区说,这是重新加速。所以第一,我认为这是错的,因为首先,构成不一样。另一个问题是,回到我之前提到的,比如 KUA 和我怎么建立 OpenClaw 之类的。我不想要你的 agent。Agent 本质上——因为现在有一个问题,历史上一直存在,数据被隔离在 ClickHouse、QuickBooks 里,都是孤岛。现在你给我一个 agent,它会给我数据,但它仍然是孤岛,对吧?所以我现在得拿那些数据,再找另一个 agent。

A

只要把数据暴露给我的 agent 就行。只要暴露数据。

B

是的,直接暴露出来就行。我想说的是,把所有东西都暴露出来,然后按使用量收费。所以按 API 消耗来收费。这样你仍然保留原来按席位计费的模式给人类用户用。按这个来收费。Agent 的数量会暴增,如果你的产品有价值,使用量会更大,收费也会更多。所以有些论点是有道理的,有些产品确实有价值。它是个数据库,又不完全是数据库。我们可以深入讨论,但有些确实有价值。而且我其实很惊讶,第一个这么做的人是 Benioff。

A

Salesforce。Salesforce。

B

大概三天前有条推文说,Salesforce 的每个产品都通过 API 暴露出来了。

A

哇。

B

所有东西。我当时就想,现在我明白这个人为什么这么做了。这太疯狂了。给他点赞。太棒了。就像,谢谢你。我不知道你是不是听了我的建议还是别人的,但总之,谢谢有人这么做。这是世界的发展方向。所以如果你能在这方面真正加速,推动 API 消耗,那就是实实在在的收入,是真正的增长。价值就来源于此。而且我觉得,当人们意识到没人真的会用和付费给这些 agent 和 token 时,会迎来一盆冷水。那其实不是真正的增长,它会回落。

A

是啊,我是说,显然,我觉得大体上是对的,我同意。但我觉得,人们还是会试图成为一家 AI 公司。

B

不,不,完全同意。这没什么不对。而且我要说清楚,这不是在贬低任何做这件事的人。每个人都得去获取收入、拿到倍数、获得估值,做该做的事来进入下一阶段。完全同意。但我们作为社区,现在好像在说,哦,这是神奇的出路。其实不是这样。这不是正在发生的事,对吧?

A

不,我觉得最近有个厨房电器公司搞了些 AI 的噱头,还有那个运动鞋品牌,叫 Allbirds。Allbirds。对,Allbirds 在转向 GPU。这没问题。就像,你知道,我还有点钱,就买几张彩票。你会去提供 GPU 吗?

B

哦,会的,但不是用于推理。我们想的是 GPU 沙箱。如果你电脑里有 GPU,那就是沙箱里的 GPU。有些工作负载确实需要 GPU。再说一次,我总拿 3D 渲染举例,因为它最容易理解。但如果你想在 CAD 或类似东西上做任何类型的强化学习,你就需要沙箱里的 GPU。所以这个也快来了。是的。

A

那自己的数据中心呢?

B

自己的数据中心。我们运行在托管服务商、裸机服务器、数据中心上。从技术上讲,我们可以跑在这些上面,或者自己的数据中心。我们就是这么架构的。目前从毛利率角度看,我们进入这个领域不划算。你得筹集大量资金,承担大量风险,只为了个位数的百分点。所以现在这不合理,但我们的架构从根本上支持我们如果想做就能做。是的。

A

你现在是这些公司的大客户了。你看到什么机会了吗?

B

走着瞧吧。是的,走着瞧。

A

是啊,我看到很多人想搞裸机方案。我们前几天和 Railway 聊过,他们也在做非常类似的策略。

B

他们觉得——我觉得他们在建什么东西,或者现在有自己的数据中心了。

A

对,他们大部分是自己的数据中心。但我确实觉得,他们还在用 Equinix 这些东西。所以我觉得有趣的是,这个模式基本没变。它基本上是个房地产模式。他们管理设施,然后你做其他所有事。我好奇未来怎么改变,因为 AI 浪潮是重塑一切的机会。对,还有别的吗?好。我觉得就这些了。我没有其他话题了。我觉得这已经是最全面、最好的了。如果你对计算市场、沙箱和 Daytona 有任何问题,这是最好的起点。这能走到哪去,老兄?现在是四月,月增长 75%。到年底我们会变成什么样?

B

这是个疯狂的数字。我有点不敢说出口。所以,它非常大。嗯,光是沙箱市场,而且我们——我们之前聊过,整个基础设施市场月增长 40% 左右。每个人都在月增长 40%。这也是个热点观点:如果你没增长 40% 左右,那就不算——这只是市场本身。你基本上不用来上班也能增长那么多。我半开玩笑,但你知道,趋势就是这样。那终点在哪?我们等着看。至少从 CPU 的角度,GPU 更疯狂。从 CPU 的角度看,很可能提前拥有 CPU 本身会成为一种市场策略。而且很可能,因为你大概和很多 GPU 供应商聊过,他们的增长受限于你拥有的 GPU 数量,对吧?

A

对。

B

对吧。

A

这就像,全看 NVIDIA 那天愿意赏你多少。

B

对,那就是他们能增长多少,对吧?所以我们 CPU 市场整体上,比如像 Railway、Vercel 之类的,或者部署,或者沙箱。还是 CPU。所以每个都在以市场速度增长,加上或减去市场波动,但不受那个限制。所以我的想法是,对我们这个市场里的所有人——数据库也属于这个范畴,因为数据库也跑在 CPU 上——我们都得尽可能快地增长,这样才能从 Intel 或 NVIDIA(它们现在也有 CPU 了)那里拿到足够的 CPU,以后还有其他人。所以当那一步到来时,会很有趣。

A

也许换个说法,你是潜在的新 Heroku、新 AWS 还是新 Stripe?哪个类比最合适?

B

有意思,有些类比,比如新 Cloudflare,但新 Cloudflare 就是新 Cloudflare。他们在这方面做得确实不错——

A

而且 Cloudflare 掌控着网络。没人能对抗。是啊,别想了。

B

他们做得很好。不,我想说的是,他们整个 agent 产品组合其实非常好。我得说,我个人觉得有些技术限制,比如所有东西都受限于 Workers,Workers 是他们的核心。但从市场策略的愿景来看,我觉得他们真的非常棒。我认为他们比其他一些公司更懂这个。至于你的问题,会有什么——会有个对等的东西。每个人都说会有个面向 AI agent 的 AWS,但你的答案,它可能更像 Stripe 而不是 AWS。所以会有一个专门为 agent 构建的云。那个云会有沙箱、网络搜索、数据库(比如 SQLite 或 Neon 或其他专门为 agent 设计的东西),还有其他东西。我们还没到终点。为 agent 构建的新基础设施原语还没结束。还会有更多。

B

所以人们会觉得,哦,没别的了。但其实还有更多。我们对下一步有一些想法,只是没时间去做,但确实有更多面向智能体的原语正在构建中。而且我认为,未来会有一个云平台来运行这一切。

A

是的。OpenAI 提过 AI 云,Vercel 也提过 AI 云,你很可能也是未来 AI 云中的一员。我觉得这是一个非常值得争取的大奖。好了,感谢你来做客。

B

谢谢你的邀请。这次交流非常棒。

译自 Latent Space Podcast · 录于 二〇二六年五月二十二日