给Agent配电脑 — Ivan Burazin, Daytona
Giving Agents Computers — Ivan Burazin, Daytona
DaytonaNet CEO Ivan Burazin 在访谈中介绍了公司从 Code Anywhere 转型为 AI agent 提供可组合计算沙箱的历程。Daytona 基于裸金属和自研调度器,沙箱启动时间 60 毫秒,可并发启动 50,000 个(约 75 秒),支持动态调整 CPU、RAM 和磁盘。公司月环比增长 74%,平均利用率 15%,最大客户每日运行约 850,000 个沙箱。工作负载分为后台 agent(跟随太阳模式)和 RL/评估(尖峰模式),后者占比将达 50%。Burazin 强调 agent 需要类似人类计算机的沙箱,并押注计算机使用(computer use)功能以解锁遗留应用市场。团队 25 人,其中 13 人共事超 7 年,通过 Slack 提供极速响应支持。
好,我们现在在录音室,请到的是 DaytonaNet 的 CEO Ivan Burazin。欢迎。
谢谢邀请。
Ivan,我们认识很久了。
很久了。
我都不知道你是怎么找到我的——是你主动联系 Shift 还是——
是我联系你的。原因是——我们当时在考虑——我是 Code Anywhere 的联合创始人,那是第一个基于浏览器的 IDE。所以我们一直觉得 localhost 应该消失。
没错。
你写了那篇文章《End of localhost》。我因为那篇文章联系了你。后来我们聊了,我当时在另一家公司,负责开发者体验相关的工作,而你在这方面很有经验。我联系了你和其他人,问我们该怎么做?关键点是什么?你很好心接了电话。我记得我还迟到了。
我不记得了。
我记得,因为当时我和我当时的——不确定是女朋友还是妻子——在一起,是同一个人,所以没问题。我们在意大利度假,我因为什么事迟到了。我觉得很抱歉,但你很宽容。
我宽容是因为我也经常让别人等。所以,谁没有过错呢?对不了解的人说一下,InfoBipShift 是你过去做的一个项目,那基本上是我创办 AI Engineer 的灵感来源之一。我得感谢你推了我一把,让我意识到可以办会议并卖票。
对,我记得你一开始想给我顾问股份。我当时太专注于手头的事,拒绝了,我本该接受的。抱歉,不过算了。
我们不是风投支持的。总之,我觉得你厉害的地方在于,Code Anywhere 是你一直想做的事,后来搁置了,又在 InfoBip 之后重新捡起来。讲讲故事吧,讲讲 Daytona 的起源。
好。很久以前,我和联合创始人就一直在一起。我说过很多次,我们就像结了婚又离婚又结婚。有人问我,我的联合创始人是不是我的伴侣?他们以为是字面意思,其实不是,但我们一起做了好几家公司。如你所说,我们经历了一次转变,从 Code Anywhere 到 Shift 会议,再回到 Daytona。我们最初在 2000 年代初开始搭服务器、做虚拟化、路由器,做这些底层的东西。那是一家服务公司,我们卖掉后专注于我联合创始人发明的东西——第一个基于浏览器的 IDE。我说第一个,因为在我们之前只有 Heroku 做过,但时间很短,后来他们转型成了 Heroku。除了他们,我们是唯一一家,它叫——
还有 Cloud9。
Cloud9 比我们稍晚一点。还有 Replit,是在我们停止之后才出现的。Replit 后来做得很成功,这很好。还有 Nitrous.io,当时有好几个,但都太早了。有趣的是,当时没有 VS Code,没有 Kubernetes,Docker 也刚开始,甚至可能还没公开。所以我们得自己搭建整个技术栈。这是我们在 Daytona 中一直使用的关键经验。所以非常早。大约有 300 万人用过 CodeAnywhere。它主要是天使投资而非风投。我们最终还清了所有投资,因为它没有达到那种规模。但三年前,我们用 Daytona 开始了类似的事情,不过不是现在的样子,而是为人类工程师自动化开发环境,基本上是 CodeAnywhere 的底层技术栈。然后去年一月我们做了大转型,转向沙盒。现在就是这样。
历史性的转型。而且,我独立投资了 CodeAnywhere,也投了 B2B,结果你们俩都转向了同一个方向。我当时想,靠。
你投了 Daytona。你是第一个。如果没有你的支票,我们不会做这件事。
不可能。
不,我们当时想,必须先让他上船。你是我们上路的助推器。
不,因为你把我放进了你的融资演示里。我当时想,这要是不投,简直像被道德绑架。
那是因为那是你的话。我们做了很多关于 localhost 终结的研究,看谁对这个感兴趣。
对。我写了那篇博客,然后这个领域的每家公司都联系了我,每个收到这些 pitch 的 VC 也打电话跟我聊。
终于实现了。终于实现了。
终于实现了。而且可能是由非人类用户来实现的。
对。
那现在的 Daytona 是什么?简单描述一下。我穿着这件 T 恤。
你穿着。对。
上面写着——我觉得你们的品牌做得很好,很一致。它写着 "Run AI Code"。不能再简单了。
没错。但我们可能得改,因为这只是我们做的一部分。我们很喜欢这个。Run AI Code 非常简单。人们有不同的理解。我们大概送出了 5000 到 6000 件 T 恤。人们很自豪地穿着,因为它不是在宣传我们。
在背面。
在背面,它是在宣传穿的人自己。所以我觉得我们做得很好。但这只是我们做的一部分,因为人们想到 Run AI Code,只会想到那些小的代码执行隔离环境,你发一段代码,得到输出。而现在的 Daytona 本质上是为 AI agent 提供的可组合计算机。
它是——
市场叫它沙盒。对,这可能会误导人。
所有这些——
对,因为它可能让人误解,人们通常认为沙盒是演示或测试环境,而不是生产级环境。但 Daytona 做的事,如果你想想你面前的笔记本电脑或那边的电脑,或者我妻子是建筑师,她有一台带 3D 显卡的 Windows 来做 3D 渲染,计算机就是不同的组合。我们坚信,现在的 agent 和未来的 agent 需要这些不同的计算机组合来完成不同类型的任务。所以我们通过 API 提供这些。
对,我想尽量把那些让人恍然大悟或惊叹的瞬间放在前面,这样大家能保持兴趣,点个赞、订阅一下。这个市场正在爆发,对吧?你们报告了74%的月环比增长,而且已经持续了一段时间。不只是你们,几乎每家计算提供商都是这样。我不知道你同不同意我用“计算提供商”这个词,但确实如此。这是有机的PLG驱动增长,同时企业业务也做得非常好。我想把时间倒回到去年一月,你们做转型的时候。显然你们很早就看到了这个市场,提前布局,现在成了市场领导者之一。但当时是什么洞察让你们决定转型的?
让我们做这个转型的洞察来自前一个季度。也就是2024年底,我们基本上做了一次演示,我记得我们之前也聊过。当时Devin还没公开,你实际上给了我Devin的访问权限。对,我用了。
你——我觉得我不该给的。
对,没错。
无所谓,我给了大概三个朋友权限。
对。或者是你打来电话,给我演示了?不重要。但当时OpenDevin已经可用,现在叫OpenHANs。我们就想,哦,这看起来是个趋势。这东西还没公开。我们就把面向人类的开发环境自动化方案,结合OpenDevin,作为SaaS推出来。我们这么做了。注册使用的人不多,但很多人找过来,他们正在构建agent,说:“嘿,我的agent需要一个计算沙箱运行时,随便你怎么叫。”我忘了当时叫什么了。然后我们就想,哦,太棒了,这是个新市场。这是我们的基础设施,这是我们的产品,上吧。但我们很快发现,人们并不喜欢我们做的东西。它不好用。我记得刚开始做的时候,跟人聊起我们为agent构建的沙箱,他们说:“这有什么不同?不就是一样的东西吗?我们有EC2、有VM、有所有这些。”但每个我们给过的人——大概二三十个——都说不行,这不是我们需要的。这东西会出问题。基本上,我和联合创始人对此了解不多——因为我们是搞基础设施的,不是搞AI的。所以我决定自己去把每个播客都看一遍,包括所有这些,还有那些,然后跟上最新动态,读所有博客,搞明白到底发生了什么。
要不要提一下哪些播客对你有用?万一别人也在找。
总的来说,我看了几个播客,不同领域、不同类型。有你们,No Priors,Bill Gurley的节目在的时候也很棒。还有几个,20VC从不同角度挺有意思的,还有一些别的动态——
但我们其实不是讲计算市场的。
它当时也准备好了。
抱歉,我猜你是在看agent基础设施市场。
我在看agent市场,整个AI市场,了解有哪些玩家、他们的认知和趋势。显然,这还得配合参加大会、活动、聚会、读白皮书,做所有了解情况必须做的事。所以当我们大致想清楚要构建什么时,就在除夕夜,真的是除夕夜,我半靠“vibe coding”搞出了第一个MCV——也就是今天Daytona的第一个最小可行产品。我大概凌晨三点才睡。我把小女儿和老婆哄睡,说了新年快乐,然后回去继续搞。我发给了联合创始人兼CTO,他早上看到后说:“这绝对是垃圾,千万别给任何人看。但想法不错。”于是他花了两周重做了一遍。
当时它长什么样?很粗糙吧。
不止,比那还糟。但就是一个非常简化的版本,展示了它应该是什么样子。能用,但不理想。所以他深入钻研——这是CTO的职责——然后带着新版本回来了。我们给所有三个月前说“这是垃圾”的人打了电话,安排了演示,给每个人都展示了。所有通话都超时了,每一个。原本15分钟的通话,都拖到了25、30分钟。每个人都说:“我们需要,我们要用。”当时没有登录,只有一个API key,因为这只是beta或alpha版。他们说:“哦,我们要用。”我们就说:“好,谢谢。”但第二天,如果我们没发过去,每个打过电话的人都回来问:“我的API key呢?”每个人都想要。我们想:“靠,就是它了。”我从未有过这种感觉。首先,理解你说的——大多数人以为agent和人类用的是同样的基础设施。我们三个月前就明白不是了,只是不知道正确的原语是什么。然后当我们搞清楚了——我们可以聊聊那是什么——并给这些人演示后,我从未经历过——我做过好几家公司——从未经历过人们会因为你没给权限而主动打电话催你。他们立刻就要。所以我们就想:“好吧,他们不想要这个。他们想要的东西似乎不存在,或者他们没找到,而且他们非常想要我们做的。”然后我们就知道找对方向了。再想想市场规模:人类工程师和企业市场已经很大了,比如GitLab之类的。但未来每一个可能存在的agent的市场呢?那有多大?我们想:“我们全力投入这个。”于是我们就在旧产品和新产品之间做了切割。
对,但当时它还不能组合。
基本上就是一个Linux盒子,你可以调整CPU数量、磁盘和内存。就这些。你不能有多个操作系统,不能实时调整大小,不能加GPU,不能做其他所有事。它只是第一个变体。
而且从一开始就是裸金属?
从一开始就是裸金属。有趣的是,我们立刻想到——
给大家讲讲背景。通常的路径是什么?
对。基本上,大多数提供商是在VM上运行这些。
对。
还有 Firecracker。对。嗯,他们在虚拟机上运行 Firecracker。我们也有 Firecracker。我们有多个隔离层,可以做到这一点。但常见的做法是,一方面,机器状态或硬盘本身并不属于沙箱的一部分。另一方面,它们并不打算永久运行。所以大多数都是可抢占的,也就是说,它们有一个存活的时间。因此,我们当时的想法是,智能体在某种意义上会像人类一样——你不想在完成工作前让笔记本电脑关机,你想合上盖子再打开,但状态保持不变。所以智能体也会想要这样,比如暂停后再回来。它们想要这两点,但智能体也非常非常看重速度,对吧?它们能获得速度吗?所以当我们思考这个问题时,就觉得我们需要某种极快的东西。如何让它快,如何让它长时间运行且有状态。这两点就像是把 Lambda 和 EC2 结合起来,对吧?两者合在一起。我们当时并不知道别人是怎么做的,因为我们不太了解这个领域已经有市场了。这更像是,好吧,这是我们需要的东西,也是它们需要的东西。我们看了 Kubernetes,它不够好。我们看了 Nomad,它也无法实现这一点。所以我们在 Code Anywhere 重写自己调度器的经验,基本上就是我的 CTO 想出来的。他说,哦,从那里学到的经验。他带了过来。有趣的是,我们的第三位联合创始人看到它时说,老兄,这是什么?这简直是 2008 年的东西。我们像是回到了过去,他说,没错。所以 Daytona 之所以超级快,你在基准测试中也能看到,是因为我们基本上运行在裸金属上,有自己的调度器,使用底层机器的磁盘、CPU 和内存,这意味着你的 IOPS 极快,因为没有网络延迟,比如 EBS 之类的东西。而且快照、时间点、模板也都预加载在裸金属机器上。所以当你从模板或快照启动一个沙箱时,你实际上会被引导到那台裸金属机器上,该快照就基于那个 NVMe 驱动器。然后它就直接启动那台机器,而且是本地的。没有网络延迟之类的东西。这就是我们从第一性原理出发,思考智能体的计算机应该是什么样子时,得出的具体方案,也是我们创造出来的东西。
嗯,我可能应该——我不知道你是否认同这一点,但有人在做 compute SDK。你们在那上面表现很好,比如 TTI 对吧?我想。这对你们来说是一个相关的基准测试吗?
我不知道。而且它每天都在变。所以今天是 Arc Hill。
我不知道 Arc Hill 是什么。从没听说过。
对。Arc。嗯。就是这样。
但你们至少处于下一梯队性能的三分之一位置。然后,还有很多其他更知名的名字启动非常慢。
对。我们长期以来一直是遥遥领先的第一名。但现在沙箱的定义也不同了,有不同的隔离模式和其他东西。所以 Arc Shield 基本上是在 S3 上运行数据。这非常不同,他们启动一个沙箱,再为它启动一个容器。所以这是不同类型的东西。
嗯。
所以沙箱的定义是我们都需要达成一致的。但没错,我们在启动和运行这些东西上非常快。你甚至可以看到那里是 0.10、0.11。所以差不多。对。
嗯。
对。
我是说,你还需要什么呢?对吧。
所以基准测试本身。嗯,在这个领域,我不认为基准测试等同于市场份额或收入之类的东西。我在多个基准测试中都看到过这种情况,不仅仅是沙箱领域,而是围绕基准测试的普遍现象。
这是入场门槛。就像,没错。
但你必须排在前列,必须参与竞争,这样人们才会知道,哦,这绝对是顶级之一,因为这只是客户看中的一个维度。还有其他东西,比如你能连续启动多少个?还有功能集、支持、以及人们关注的各种不同方面,但你肯定要在基准测试中有一席之地。
人们会连续启动多少个?
我们有——
并发,我想是并发,对吧?
所以我们关注三个指标。一个是启动一个的时间。我们启动一个的时间是 60 毫秒,包括网络延迟。所以请求、启动、回复,整个过程 60 毫秒。这是单个。但如果你想一次性启动 50,000 个。我们现在大约需要 75 秒。所以并发启动 50,000 个大约需要 75 秒。其他一些,有公开数据,比如需要 2,000 秒,也就是 30 分钟。有各种不同的情况。然后还有——所以是单个速度、多个速度,以及你能持续稳定运行多少个?我们目前基本上没有上限,因为我们拥有自己的裸金属。但我们最大的客户每天大约运行 850,000 个,接近每天一百万个。我们还有一个请求是 50 万个并发,也就是字面意义上的 50 万个 CPU 在某个地方运行。所以这很有趣——
他们按 vCPU 秒之类的付费。
对,对,对。
另一件事,我想是休眠和恢复,因为所有这些都涉及有状态的恢复。人们通过这个运行什么样的工作负载?对吧?我们是用内存的 GB、存储的 GB 来衡量吗?比如网络附加存储。我不知道,在这些功能中,哪些是最昂贵的?
最贵的是 CPU。第二或最便宜的是 RAM,然后是磁盘。我们实际上不收费——
快照,对吧?
不,快照是其中一部分,但基本上是你机器硬盘的大小。所以你是 10 GB?20 GB?50 GB?还是别的?然后还有数据传输。目前我们在 Boozon 完全不收网络费用。
哦,对,对,你得改改这个。
对,这在我们账单中占越来越大的一部分。所以我们正在处理这部分。显然,这是最便宜的。对。所以硬盘是最便宜的。所以基本上是 CPU、RAM,对我们来说是网络,因为我们不向客户收费。然后硬盘是启动的方式。但也有不同类型的工作负载。所以我们基本上在 Daytona 中把它分成两类。一类是我们所谓的后台智能体或长时间运行的智能体。另一类基本上是 RL 和评估,我把它们放在一起。它们的使用模式非常不同。如果你看后台的使用情况,我会提一些公司的名字,但不是特指。
比如 Open All Hands。
是的。所以像 background agent、Cognition、Lovable 这类产品,其实都是 Harvey 那种模式。这些都是长期运行的后台 agent。如果你看它们的使用模式,会发现跟人类很相似,就是跟着太阳走。基本上,使用高峰在中午,低谷在午夜。周末低,工作日高。
这个问题挺有意思。全球化程度如何?是不是主要集中在美国?
美国确实占很大一部分,但我们目前有亚洲、欧洲和美国三个区域,所以相当全球化。是的,相当全球化,覆盖很广。有意思的是,我跟你说过,我们用户数量最多的城市是新加坡。
哦,真的吗?
这挺有意思的,对吧?不是按收入算,而是按人头算。就是个挺有意思的现象——
新加坡在 AI 普及率上高得离谱,人口才七八百万,却老是出现在榜单上。
对,确实很有意思。我们当时也很惊讶,心想,哦,这挺有趣的。还有一个——
这就是为什么我要在新加坡办 AIU 大会。
没错。因为我就是从那里来的。我们也会去那里。另外有意思的是,日本也排在前列,或者说东京排在前列,这在以往的技术周期里是从未有过的。
是啊。
从来没有过。所以我觉得日本人就是特别喜欢 AI。
对。然后还有巴西。
是的。但巴西一直就在榜单上。即使我看 GitHub 的数据,或者我们以前做 Code Anywhere 的时候,通常都是美国、西欧,然后印度、巴西、中国这些地方。但新加坡以前不在,日本也从来没出现过。在这个领域里——嗯。
奇怪的区域分布。
对。所以它非常全球化。
实际上,这也有助于你分散全天的负载,对吧?
是的。有意思的是,我们有这类负载,但如果你看研究人员的负载,就完全不同了。比如你给他们 1 万、5 万或 10 万个 CPU 的并发,他们一启动任务,就是 100% 全速运行,一直跑,跑完就停。使用模式基本上就是方块形状,对吧?而且也不跟着太阳走,因为人们可能在半夜睡觉前启动任务,然后醒来再看结果。所以非常不可预测,你根本不知道它什么时候来。这种使用形态跟我们以前遇到的完全不同。另外有意思的是,对于跟着太阳走的模式,即使公司增长很快,你也能大致预测使用模式,并准备足够的容量,因为它的增长是可预测的。但当公司做评估和强化学习时,负载就非常尖峰。他们可能平时什么都不用,然后突然说,能给我 10 万个吗?用完又降下来,然后又来 10 万个,又降下来。所以非常非常不同,对吧?
所以你们想让他们承诺用量,对吧?是的,我们确实这么做。
我们必须让他们承诺某种用量,才能预留容量,因为我们基本上得为峰值做好准备。
对,对。
没错。所以现在 Daytona 的平均利用率是 15%,1.5。
天哪。
所以非常低,但因为负载非常尖峰,我们又能达到 90%。对,对。所以我们面临的情况是,作为一家公司,我们正在研究类似 Cloudflare 的做法,可以根据地理位置迁移负载,这对那些跟着太阳走的 background agent 很有效。但这不是一回事,形态完全不同。显然,随着规模扩大,这些问题会解决,但作为 agent 领域的计算提供商,这确实是一个有趣的新问题。
是啊。
最近我们开大会时,跟 Neon 的 Nikita 还有——
我应该提一下。
Parallel 的 Parag 他们聊过,大家都有同样的问题,就是负载超级尖峰。这是以前从未发生过的,这种类型的——以前振幅没这么高,对吧?所以这是个很有意思的用例和待解决的问题。
对。我不知道我们会不会再聊这个,但先说说大会吧。你在勇士队比赛现场请了大概一千多人?在——抱歉,是哪里?叫什么来着?
大通中心。
大通中心。
大通中心。
我去了。非常令人印象深刻。显然,你很会办大会。你学到了什么?你请来了这么多大咖。
对。
你想从中得到什么?
我办这场计算大会的初衷,是把为 AI agent 构建基础设施的人聚在一起。因为在我看来,我们正在构建的东西里,agent 是主要用户。agent 的人体工程学和使用模式是什么?所以我想探讨这个。我发现——这之前只是个理论,还没被证实——就是我们都有我刚才提到的那些问题。我在台上讲的时候,感觉大家都有同样的底层基础设施问题,就是这种尖峰、不可预测的工作负载,这在人类计算或人类基础设施里是从未有过的。而且,这跟我跟 Parag 聊,或者跟 Lynn、Nikita 聊时一样,尤其是 Lynn,我前几天还跟她聊过。这是个非常有趣的问题,因为我可以拿 Cloudflare 举例,最近有很多关于他们如何解决这个问题的讨论,就是他们有很多地理区域,用户在不同地方工作,根据你的层级,他们可以把你迁移到不同区域。这样他们就能提高利用率。但你可以大致预测这些,而且很少会出现 10 个数量级的尖峰。比如你的某个客户有个指数曲线,那是什么程度?我拿 Cloudflare 举例,可能是 10%、20% 之类的。我没有具体数据,只是猜测。肯定不是 10 倍,对吧?肯定不是那种程度。那你怎么去解决这个问题?我们都在用不同的方式解决。所以,是的。
所以她也有同样的问题。
对,我知道 Neon 也有这个问题。比如我们怎么解决这些尖峰负载之类的问题?因为我们聊过。所以对我来说,真正内化的一点是,是的,所有为 agent 优先构建的人都在经历这个,我们都在解决类似的问题。
让我深入一下。比如 Neon,我碰巧知道他们非常依赖 S3,对吧?他们完全押注在 S3 上,然后享受 S3 分布和基础设施的好处。所以我猜 Neon 可能不用太操心,而 Lynn 可能得多操心一点,因为她显然在做 GPU 推理。听众们,我们一年半前跟她做过一期节目,她确实需要操心。
对。
但,嗯。
所以 Parag 肯定也操心。
Parag 是 Parallel 的 CEO。
对。
前 Twitter CTO。
Twitter。
对,它们就是搜索引擎。
没错。
它们就是搜索。你我都知道。听众们不知道。
我们可以把它写在屏幕上。所以,因为我们当时——
我是说,我把它投到屏幕上了,这样大家如果需要可以自己查。
是的,但它们仍然需要 CPU 和 RAM 的分配,你必须准备好这些资源。所以基本上有两种做法。一种是过度预配,以应对突发流量;另一种是,我不知道这算不算一个术语,即时计算,也就是随着你的使用量增加,你可以向其他云服务商发起虚拟机或裸金属的请求,然后让它们启动运行。
所以这是指超过 100% 的情况,对吧?就像你的溢出。如果是溢出,比如溢出或类似情况,你可能会亏钱,但没关系,对吧?
嗯,可能亏,也可能不亏。这是一种更经济的方式,但速度更慢,因为你需要做的是排队请求,启动这些即时计算资源,准备好一切,配置好,然后把工作负载放上去。所以如果时间不是那么重要,那没问题,你可以这么做。但如果你的客户,尤其是对于强化学习训练任务来说,很多人来找我们是因为 GPU 比 CPU 贵,对吧?所以你希望 GPU 始终以 100% 的利用率运行。因此,当你在 CPU 上运行任务时,当 CPU 周期处于空闲并准备启动下一个任务时,你希望这个过程是瞬间完成的,这样你的 GPU 就不会闲置,对吧?是的。如果你还得去外面配置机器,那基本上就是在告诉 GPU 它必须等待,而这会带来成本。所以你需要解决这些问题。
对,我们来谈谈不同的工作负载吧。你说过,几个月前你的强化学习工作负载还是零,现在占到了 50%?
这个月就会到 50%。是的。
我们来聊聊这有多不同吧。比如,我想象中,动态代码生成(比如生成任意代码)会少很多。这里可能都是相同的代码,你只是在做并行运行之类的。
我不确定。是的,所以每次运行你都会有一个快照。大多数情况下,他们实际上会使用我们的声明式镜像构建器,比如,agent 需要这些依赖、这些 nbar。
对,Clarivision 构建器,这很像 Modal 的东西。
是的。所以我们实时构建它,然后传播那个快照,接着你可以针对那个快照启动任意数量的沙箱。如果需要做更改,模型可以自动完成,或者可以自动化。比如,下次运行我们需要安装这些东西,或者移除这些东西,来完成一个任务。然后它就去运行了。所以,是的,这似乎是他们偏好的方式。我发现的首要原因是,或者说,让我们退一步看。在那个环境中,我们主要竞争的是托管 Kubernetes。是的,EKS、GKS 之类的,绝大多数人都在用这些。任何尝试过 Daytona 对比 GKS、EKS 的人都会说,我再也不想回去了。这有几个原因。一个是易用性。如果你用 Kubernetes 来启动这些,你需要管理与之交互的接口。Daytona 虽然是一个计算提供商,但从使用角度来看,它更像 Twilio 和 Stripe,而不是 AWS。你有一个 API、一个 SDK,启动和运行这些东西非常轻松无缝。这是其一。另一个是我们启动的速度,我们之前提到过,要快得多,还有我们能够达到的规模。我们还没讲到功能,但有一个有趣的功能是,我们的沙箱很难出现 OOM(内存溢出),因为我们可以动态地实时调整大小,这在其他几乎所有平台上都是不可能的。有一些技术可以实现这一点,但非常困难。我们实际上是在 Terminal Revenge 团队把我们引入这个领域时看到的。所以,谢谢 Alex 和团队把我们带进这个领域。
嗯,一个框架直接说“大家就用 Daytona 吧”,这种情况非常非常罕见。
是的,我想它某处确实这么写了。
对。我当时就想,这是什么?
那里有很多,但他们也提到了其他几个地方。是的。所以具体到 Daytona,我们只是在顺着话题聊。我不知道它具体在哪里提到了 Daytona。
抱歉。
我不知道。
有一个非常非常强烈的推荐,这很不寻常,就是——我们没有为此付钱给他们。就说没有。是的。他们就是喜欢你。
是的,他们喜欢我们。嗯,对。还有一件事,DAZN 底层有多个隔离集。客户不需要知道它们是什么,但基本上我们有 Docker,这是一个容器,通过 Sysbox 加固。所以它的隔离性在安全上等同于虚拟机,但它仍然是一个容器。这是默认设置。尤其是在这些训练工作负载中,他们非常喜欢这种接口,能够使用基本的 Docker 容器。我们还支持 Docker 内嵌 Docker。对于这些强化学习运行,如果你需要做 Docker Compose 或 Kubernetes,你可以在这些容器内部启动一个 K3s,这解锁了大量在其他提供商那里无法完成的工作负载。所以仅就这一点来说,就更有趣了。我们经历了这个过程,向他们展示了我们可以做到,他们非常喜欢。他们指的是——那些人,是的。
那些人。你知道他们现在成立公司了吗?
据我所知,还不知道。
好吧。是的,很明显,这些事情带来了很多兴奋和成功。再多告诉我们一些吧?这是一个爆发式增长的工作负载。Harbor 采用了你们,这有助于加快进度。但随着这种新工作负载上线,你们学到了什么?
当然。我们学到了几件事,我们在开头聊过,这成了我们的故事主线。正如我们提到的,我们一路上和很多客户交流,随着交流的深入,我们增加了更多功能和工具集。我认为,这个生态系统非常小,或者模型变得更聪明了,以至于当我们看到一个用户带着请求来的时候,如果那一周有 3 到 5 个客户提出同样的请求,我们就知道它要上路线图了。这非常奇怪,这种情况发生了很多次,就像——
因为他们都是朋友。他们都是朋友。他们在同一个群聊里。
对,很可能。因为,他们就会说,哦,你能做这个吗?我就想,好吧,这挺有意思的,我们把它加到功能请求里。然后下一个又说,哦,你能做那个吗?行吧。其实都一样,对吧?永远都是那几样。所以我们尝试做的,也是我个人尝试做的,就是尽可能多地参加所谓的销售电话。我待在每一个 Slack 频道里。我们大概有 1000 个 Slack Connect 频道,差不多这个数。这挺有意思的——当你拥有所有 Slack 频道时,你会发现很多有趣的事情。你还能看到人们在不同公司之间跳槽。你会看到有人离开一个 Slack 频道,又加入另一个。这很有意思。另外,我顺便说一句,我觉得 Slack Connect 简直就是 LinkedIn 该有的样子。没错。你有一个列表。
LinkedIn 要你付费才能使用自己的关系网,但 Slack 不用,对吧?Slack 是免费的。它只是粘性更强。这很棒。
对,太棒了。
你会一辈子用 Slack 付费。
没错。你就在那儿待一辈子了。所以这很有意思。我们之前聊到的一个新动向是,我们在计算机使用(computer use)上下了大赌注,投入了很多资源。这个功能还没有公开亮相。我们还没有正式发布,但我们——
有我能调出来的东西吗?
那里有计算机使用功能。就在上面一点。
哦,好的。
好。不错。我们讨论过、也在公开场合看到的是,现在有一个主题叫“人类模拟器”(human emulator)。
在哪里——
xAI 的 Elon 也公开谈过这个。如果你想想现在的模型,它们其实相当复杂,能做很多工作,但它们仍然无法访问所有工具。我坚信,Agent 最有效的工作方式本质上是无头的(headless),或者通过终端之类的。但如果我们看看知识工作(knowledge work)的整体情况,美国大约有 1 亿知识工作者,全球大约有 10 亿,而他们的薪资总额在美国合计约 10 万亿美元,全球约 50 万亿美元,差不多这样。如果我们看其中最重要的 5 个行业,比如医疗、政府、金融服务等,这大约占 56%。所以大概是一半左右。那么在美国,大约是 25 万亿美元,而其中大部分工作实际上仍然被锁定在 Windows 上的遗留应用里,这些应用在很长一段时间内都不会消失。人们就是不会去投资改造它们。有多少呢?我们的假设是这样的。在 RPA 市场(一个类似但不完全相同的市场)中,大约 25% 的白领工作被自动化了。如果一个 Agent 更复杂,能处理更多轮次,自己搞明白事情,假设是 40% 吧。那么如果你取这 40% 的 1%,你就能得到大约每年 10 万亿美元。
这就是你的 TAM(总可寻址市场)。
这就是 TAM。这是模型层面的 TAM,对吧?不完全是我们的,但规模能达到那个量级。而要做到这一点,你基本上必须给 Agent 提供带有遗留应用的计算机。所以是计算机使用,无论是 Mac、Windows 还是 Linux。Linux 我们当然也有,其他人也有,但 Windows 是特别新的东西。目前唯一的选项是 EC2 上的 Windows 或者 Azure 上的 Windows,两者都需要 3 到 5 分钟才能启动。我们创建了一个真正的沙盒(sandbox),所以是秒级而不是毫秒级。但你有时间点快照(point-in-time snapshots)、分叉(forking)等沙盒应有的一切功能,这基本上能让你有望解锁所有这些价值。所以这就是我们大力推动和押注的方向。我们一直在密切关注市场,接下来会是什么?
对,知识工作、构建,以及某种意义上的 RPA,RPA 的下一波浪潮。我在疫情期间对 RPA 非常兴奋。当时 UiPath 正在 IPO,那是一个非常艰难——它是不是东欧的公司?
是罗马尼亚的。
罗马尼亚。对,它可能是罗马尼亚唯一的独角兽大公司。好吧。我不知道。我觉得 RPA 复兴的舞台已经搭好了,因为大家都明白这一点。没错,没人想处理这些烂应用,也没人会重写它们。你只能对它们进行远程操作和程序化操作。
但如果你想解锁它,我自己的设置大概是这样的。我上个月在做一份董事会演示文稿。我就想,好吧,咱们就自动化吧。我们所有的数据都在 ClickHouse、PostHog 和 QuickBooks 里,和其他人一样。我基本上把这些都连到了我的云代码上,比如用 Go 写云代码,然后说,这里有集成,去做吧。它拉出了第一份报告,效果很好。它连上了 Brex 和所有这些服务,拉出了数据,很棒。然后我说,好吧,现在拉出这个、这个、这个、这个。我不断得到那种麦肯锡风格的设计报告,但数据是部分数据、全部数据缺失、部分数据,它无法访问所有东西。我特别沮丧。所以我就拿我的 Mac mini 虚拟沙盒,配上 OpenClaw。我在公司里给了它一个自己的账户。然后我去所有这些服务创建了一个只读账户。就像你公司里的一个实习生。然后我会说,现在去做这份报告,它会得到同样的——或者说,我无法通过 MCB 或 API 之类的东西获取所有信息。我就说,去登录。对。然后它会登录网站,进去,导出数据,端到端地完成整个操作。所以即使对于今天有 API 的东西,也不是所有功能都暴露出来了。而为了获得价值——我现在确实获得了巨大价值——但不幸的是,它必须是一个计算机使用 Agent。所以我花了很多 token 在这上面,但任务完成了。所以,如果连我们这样的初创公司,用着所有最热门的工具,仍然需要一个计算机 Agent,那高盛这样的公司还有什么希望去做无头化呢?
对。
对。
为什么微软不做这个?
嗯,我相当确定,Satya 昨天发了一篇帖子。
哦,好吧。
大意是每个 Agent 都需要一台计算机。
我明白了。
我明白了。所以他们推出了一些东西。
对。他们有 Microsoft Power Automate。我肯定,他们会有自己的版本。
那个的版本。
对。而你会尝试做你自己的。我一直知道 Mac 总有需求,但我知道托管 macOS 沙盒很棘手。
我们很快就会有 macOS 沙盒。macOS 沙盒的问题在于——我深入研究过这个。我不知道这有多有趣。macOS 有这个毛病。
是许可问题。
许可问题。
对。
所以第一,每台机器只允许运行 2 个并行虚拟机。这是第一点。第二,每 24 小时只能授权给不同的用户。也就是说,如果用户进来,理论上我想按秒收费,只收 1 秒的钱,那这台机器当天剩余时间就得闲置。我不能让其他人再用它。所以定价会不同,我们得按 24 小时收费。这还不是最麻烦的。更麻烦的是,从安全角度出发,他们允许你做内存快照、暂停、恢复,但只能在同一个物理硬盘、同一台物理机器上。而在 Windows 或 Linux 世界里,你可以在后台把快照从一台机器迁移到另一台,然后管理负载。如果你想这么做,基本上就得把你的——对。
快照。
你的物理机器。
你不能拆分它。
你不能随意移动这些东西。所有这些,从安全角度来看,我理解安全方面的考虑,但它让你无法运行那些 agentic(代理式)的、真正可扩展的 agent 工作负载。
你需要做一个 vibe-coded(氛围编码)的 macOS 洁净室实现,然后就可以——就像 CleanOS 之类的。我也不确定。
我想也是。
你知道,Linux 最初就是 Unix 的洁净室重写,对吧?macOS 也一样。总得有人来做这件事。
会有人做的。我们会运行一些持续几天的长期 agent 来搞清楚这些。但确实,我们离提供这样的服务很近了,因为人们确实想要,但定价会不同,功能集也会比较严格。
是啊,没人会用这个。我是说,实验室会用,因为他们想自动化。他们有一个 URL。
又得做 RL(强化学习)了。但关键是,如果你在 macOS 上做 RL,那么模型的下一轮迭代就能更好地使用这些工具。然后你实际上需要在某个地方运行这些工具。所以之后你不得不拥有这个能力。如果有苹果的人在听,我强烈觉得他们在自断财路,如果他们能启用类似于 Windows 和 Linux 上的并发模型,他们本可以获得的计算或授权收入规模会大得多。
是啊,我肯定他们以前就听过这个。他们只是不在乎。也许新 CEO 会改变主意。
嗯,走着瞧吧。期望很高。期望很高。
好吧。但我的意思是,很明显 Windows 的市场机会巨大,你可以靠 Windows 撑很久,但你的客户会两者都想要。对我来说有趣的是,这就像是 agent 的终极应用,对吧?我不——OpenClaw 对你们来说有多大?有没有一个显著的提升?
对我们来说没有。我们的定位不太一样,虽然完全是 PLG(产品驱动增长),也有个人开发者在使用,但 Daytona 的大多数用户更像是 B2B2C。要么是 B2B,要么是 B2B2C。比如在研究领域是 B2B,你卖给实验室和新实验室之类的。但在长期 agent 方面,从规模化收入的角度看,主要是 B2B2C,也就是有一个应用层的 agent 大规模地使用你。
比如 Manus。
对,像 Manus 或 Lovable 那种。
对对对。B2B2C 基本上就是我所说的 agent 实验室,有点像你不是在模型实验室,而是在做一个非常好的封装平台,其他人可以注册,这样他们就不用自己写代码了。听起来比直接的 OpenClaw 市场好得多。
我做过很多不同的事。Code Anywhere 在我们职业生涯和日历上,是一个非常面向终端开发者的产品。那很棒,你能获得很多开发者的喜爱,我觉得我们公司也确实有不少开发者喜爱,但那是另一种类型——人们是在构建这些东西,更像 Twilio,因为你不会去运行 Twilio。我不知道有多少人还记得那个“Ask a Developer”广告牌之类的。人们真的很喜欢 Twilio,但他们只在“我在为某件事构建这个应用或服务”时才用它。所以我们很大程度上是朝那个方向走的。而且你也知道,我以前在 Twilio 的竞争对手工作过,所以这大概已经刻在我的 DNA 里了。
人们不知道 Infobip 有那么大。
是啊,就像——
因为他们都是美国人,觉得欧洲的东西跟我没关系。但它是同样规模还是更大?
更大?不,大概是一半大小。
一半大小?
对,所以还是很大。每年几十亿美元。
是啊,太疯狂了。
没错。这些都是非常有趣、收入可观、粘性很强的业务。而当你面向终端开发者时,销售非常困难,因为他们对价格非常敏感,非常在意成本。而且很难规模化,因为愿意启动——首先,他们得愿意启动一个,然后启动多个。而在企业端,我们都知道大家都在谈论花了多少 token,我现在花得——很多公司今天的状态是“这是我们公司,能花多少就花多少”。基本上这就是我们的方向。所以如果你想想这个范式:你卖给那些说“能花多少就花多少来创造生产力”的公司,对比“我是一个个人,我有这么多预算,我做这件事是因为好玩或者对我有帮助”,这是完全不同的市场策略。
是啊,有很多讨论。我脑子里过了一遍对你有利的因素,比如 MCP 对比 CLI。显然你想要 CLI。这对你来说一直很好。我觉得这可能只是冰山一角,也可能很大。我只是在确认这些是不是大趋势。
这些东西确实对我们有利,就像你说的,但它们其实只是杯水车薪,对吧?我觉得所有因素都得综合起来看。影响它的东西太多了。就像你说的,Open Claw 对我们来说不算什么大事,但 Anthropic 的 agent SDK,或者说 Claude Code,就很有意思。它有意思的地方在于,很多所谓的应用层 agent 公司——我也不太确定该怎么称呼它们——基本上就是觉得,“哦,我可以创建这个新应用,我有这个新 agent,我只需要用 Claude Code,把它扔进一个沙箱,然后就有了面向用户的界面。”这样一来,更多公司就能真正提供这类服务,然后它们就会去调用沙箱。所以这挺有意思的。还有你提到的 MCP 和 CLI 的对比,MCP 是对 API 的接口,而 CLI 则是让你能真正去做事情,就是这样。区别在于集成和实际运行脚本、数据或分析之间的不同。所以,如果能很好地使用 CLI,agent 就能做更多事情。正因为如此,人们会调用沙箱,在 CLI 里运行,然后对数据进行分析,最终给出实际结果,而不仅仅是像从 API 拉取数据那样。
对,这就是一个间接层。没错。就像 Agentic Search 和 RAG 的区别一样——
没错,没错。是的。
只要人们把更多 agent 放进工作流里,你就赢了。没错。所以具体是什么其实不重要,我只是想梳理一下,大家还听说过哪些类似“哦,这又是一个沙箱用例”的东西。“哦,那又是一个。”我有没有漏掉什么重要的?
还有一个就是计算机使用(computer use)相关的东西,我觉得这可能是最有趣的。就像你说的,过去一年我们和很多人聊过,他们总问:“哦,你为什么需要沙箱?为什么需要这个?为什么需要那个?”然后就像你说的,变成“哦,我需要沙箱做这个,我需要沙箱做那个,我需要沙箱。”最后发现,每件事都需要它。所以基本上,这听起来像老生常谈,但你每天都会用笔记本电脑,对吧?你只是一个人。但现在想象一下,顺便说一句,笔记本电脑、计算机、PC 市场,PC 市场规模大概和云市场差不多。每年大约 1500 到 1800 亿美元,差不多是三大云巨头的规模。和苹果、惠普、联想这些公司差不多,可能略小一点,但大致相当。现在想象一下,这个可寻址市场有多大?世界上有多少人?最新数据是多少?
就算 80 亿吧。
80 亿。对。假设每人有两台电脑,比如一台个人用、一台工作用,那就翻倍了,也就是 160 亿,对吧?那么两年后、十年后、一百年后,会有多少 agent 在运行?每个任务都需要一个这样的东西。所以这个市场有多大?基本上可以说是“无限”。你会遇到资源瓶颈。Dylan Patel 在会上提到过,他是 Semi Analysis 的,通常讲 GPU,但这次他也说 CPU 现在会成为瓶颈,因为它是约束条件。你无法增长,或者说我们无法生产足够多的 CPU 来满足需求。
对,我其实和 Doug O'Loughlin 录了一期很好的播客,他是 Semi Analysis 的总裁。他们基本上认为,先是 GPU 短缺,然后蔓延到内存,现在轮到 CPU 了。接下来是什么?抱歉,网络。对,网络其实已经短缺一段时间了,如果你只看 GPU 网络的话。但说真的,现在计算机使用的量实在太疯狂了。对,不错。我想其他问题中,一个很大的部分就是开源这件事,你本来可以不这么做,你的竞争对手也不这么做。我想很多人担心保持项目开源,因为竞争对手可以直接 fork。不知道你对作为一家开源公司有什么反思。
对,有很多。我们最初的产品是开源的。这样做对我们确实很有好处。有句话怎么说来着?那些做得好的公司,会用自由现金流来衡量自己;一般的公司看 EBITDA;再往下,就看 GitHub 星星数。GitHub 星星数,GitHub 星星数。
对。
所以一路往下,就是 GitHub 星星数。我们最初的产品就是靠 GitHub 星星数。我们当时聊的就是这个。现在我们到了谈收入的阶段,所以我们在那个层级上已经往上走了。我们开始——
不,不,是利润,利润。
对,我们还没到,但会到的。不过基本上,那时候我们确实看星星数和 GitHub 这些东西,也挺有用的。我们最初做的那个版本,把核心代码拆分到自己的仓库里,用的是 Apache 2.0 许可证,非常宽松。然后我们在企业端,会把核心和一个专有仓库打包在一起。这算是开放核心模式,但仓库本身很干净。当我们转型时,没时间重新思考这个问题,而且我们有一个开源社区,不继续做下去感觉挺可惜的。但我们还是想加一些限制。所以在新的沙箱产品里,我们用了 AGPL-3 许可证,这是一种捷径,它算是开源,从某种意义上说,企业如果想用也可以,但你不能在不开源自己代码的情况下做出一个竞争对手。
这大概是三种做法之一。还有 BSL 和其他一些类似 Elastic License 的。
对,还有其他一些。纯粹的开源信仰者认为这不算是完全的开源,我完全尊重这一点。这确实没错。但我们保留了这一点,Daytona 本质上,除了功能标志下的内容(比如 Windows 相关、GPU 相关等),其他所有东西都在开源里。所以一切都在那里,包括我们自己的调度器等等。所以我们是——有些竞争对手说,“你们其实是真正的开源,开源。”就像,“你们真的是,你能看到代码。”人们确实喜欢这一点,它也有点帮助,但更多是帮助我们云产品的消费,而不是直接转化用户。原因是,你在集成 Datomic 时,可以把仓库发给你的 agent,让它有更多上下文。它就会明白,“哦,原来是这样,所以才会发生这个。哦,所以那个不是这样。”
你也可以只写文档,然后——
对,我同意。但公平地说,这其实对今天的增长帮助不大。我们和投资者以及其他人都聊过这个话题,比如“你怎么把开源用户转化过来?”
开源商业的讨论真是五花八门,对吧?好吧,我就简单说说。很多听众可能没仔细想过,不少人会说,哦,这不就是免费层嘛。比如,你自己跑起来没问题,但一旦认真用,就得联系我们,对吧?就我个人而言,因为我在 Temporal 的经历,这其实是一种进入大公司的方式——那些公司可能因为我们的企业太年轻,或者技术栈某些部分不匹配,而无法通过他们的审核流程。但因为它是开源的,他们先采用了,然后我们再慢慢解决。这涵盖了低端和高端市场。我不知道这是不是——
不,不,完全同意。在 AI 转型过程中,我们历史上也发现过类似情况。我们还没聊过这个,Daytona 的客户从单个开发者、YC 初创公司,到所谓的财富 500 强,我甚至想说财富 5 强,也就是全球最大的那些公司。
还有你提过的那个大型 Neo Labs。
对,对。
我们会替他们保密。
巨型公司,对吧?因为市场拉力太强了,我们能够绕过这些流程。我不是说我们通过了安全审计之类的所有环节,但就像你提到的,Temporal 早期和 Daytona 旧版本时,我们往往要花几个月,最后他们还会因为“你们公司太小了,我们不够信任”而流失。而现在,这些大公司会推动我们,比如在采购流程中,通常成为大公司的供应商要花两三个月,我们现在五天就能搞定。这倒不是说我们有多厉害,更多是反映了当前市场的状况。所以从这个角度看,开源从市场推广角度来说,我们考虑得并不多,因为我们现在的一切都是通过云产品的 PLG(产品驱动增长)模式,用户注册后就把我们拉进去。
我有个个人兴趣问题,不知道你有没有答案——你们和 GitHub 有过问题吗?
有一点。
有一点。嗯,跟我说说,因为我在想,要取代 GitHub 需要什么条件?
关于这个,我想了很多,也在推特上发过,还亲自投资过一些项目。
是 Entire 吗?
不,不是。
好吧。
对。我见过 Thomas,或者说是线上见过,我们聊过。我真心觉得,这也是我关注的原因,因为我们有一堆后台长期运行的 agent,其中大部分是 coding agent。大家都在打造 Lovable 或 Devin 的竞品。我们从客户那里看到,他们都在想办法做版本控制,而且方式五花八门,有些方法非常奇怪。原因在于 GitHub 本身是个瓶颈,它不够快,解决不了他们需要的问题。公平地说,GitHub 是为发布后的内循环设计的,对吧?它是针对你笔记本之外的部分。
对,GitHub 是外循环的起点。
没错。人们开始把它用于沙盒环境,这属于内循环,通常是在笔记本上运行的,对吧?所以它并不适合这个用途。然后我们遇到各种情况,最有趣的是,有个客户会把整个代码库放进沙盒,然后每隔一段时间——我忘了具体时间间隔——就把所有内容转储成一个 JSON 文件,再推送到 S3。
嗯。
就这样。
你自己造了个 git。
甚至没有差异比较,每次都是整个文件。因为这样超级快。然后他们回去搜索,找到文件当时的状态等等,因为文本文件、JSON 都很小,网络成本很低,他们不在乎,就这么做了。我当时想,如果人们都这么干,那就说明这个问题需要新的解决方案。对吧?所以对我来说,观察谁在构建这些以 agent 为先的新东西很有意思。我觉得 git 本身在未来仍然存在,甚至 GitHub 也可能存在,但会有一个全新的服务出现。
对,没错。Git 就像是启动 CI/CD 的部署产物。
对。
但在那之前,还有一个 agent 协作层。
所以我觉得这方面有值得探讨的地方。但另一方面,还有个有趣的问题是 CI。现在 PR 的数量简直疯狂,对吧?
总的来说,即使对你们来说也是这样,对吧?
每个人都在创建大量 PR。然后所有这些都要经过 CI,这就成了瓶颈。所有人都在瓶颈上,不只是 Actions,你去任何 CI 提供商那里,如果 PR 吞吐量高,你都会遇到问题。我们聊过一家公司,他们每天有 1000 个 PR,这意味着他们只能排队等着。
他们用什么?Buildkite 还是——
我不知道,可能是 Circle。
你知道,从技术上讲,你的技术可以用在 CI 上。
我们聊过这个。
哦,好吧。你们聊过这个。这是个认真的话题吗?
我们看看进展如何。我们围绕这个聊了不少。我们绝对不是 CI 提供商,对吧?
但缺少什么呢?
本质上,你可以用 Daytona 沙盒来代替你用的 GitHub runner。对。
我唯一想说的是,也许 CI 机器应该非常便宜,而且可能属于低端需求,因为它应该是非阻塞的,像后台任务一样。CI 的紧迫性没那么重要。
但性能很重要。
对。
性能很重要。对。
嗯,有意思。在我们离开 Daytona 这个话题,进入更广泛的创始人观点之类的内容之前,当初创公司评估你们时,你们有这么多名字,还有更多不能提的。他们看到你们墙上全是竞争对手。
对。
而且你们和其中很多都有差异化,但真正打动他们的是什么?
我们发现最能打动人的,可能更多是第二天的事,而不是第一天的事。
当然。
我们反复看到这一点。我们有一堆案例研究,还有更多正在发布。这些都是第三方做的,我们不参与。看这些案例很有意思,因为是第三方,人们更开放,会告诉你,哦,我们用这个竞品,或者我们更喜欢那个竞品之类的。而人们回头找我们的首要原因是,我们的响应速度非常快。
那你的团队呢?
说的是团队。对。
好的。
极致的响应速度是目前为止——我们现在可以聊功能、产品广度、并发、CPU这些,但我觉得那可能……如果其他条件都差不多,这确实是我发现的一个差异化因素。而且我并没有——
这完全是通过 Slack,还是 Slack 加邮件?
邮件也有。还有电话,但绝大多数是现场沟通。所以主要是 Slack。比如我们有客户说,嘿,我们有个问题,能上 huddle 吗?我们真的会在 5 分钟内就上线。我做过很多次了。所以是的。
等等,好的。那你们团队有多大?
目前 25 人。
你们是怎么做到这种支持水平的?这——
我们很疯狂。不睡觉。007。你听过这个新说法吗?007。
我见过你的团队。他们非常出色,非常投入。但你怎么让整个团队都做到这一点?你知道,这——
所以——
我自己都有 Slack 疲劳了,你知道吗?
是的,我们都有 Slack 疲劳。我们非常非常累。我们独特的地方——我不知道是不是独特——但我觉得任何成功的连续创业者独特的地方在于,你能把以前共事过的人拉进来。作为首次创业者你做不到。我以前也做不到。但在 Daytona 的 25 个人里,大概有 13 个,我们共事了 7 年以上。
嗯。
所以这是高信任、高产出、高——我们都知道自己要做什么。尤其是这些人,在我们创业初期、真正拼命的时候——就是那种为吃饭而奔波的程度——就和我们一起工作。现在新加入的人,几乎都是隔了一层关系。就是有人认识的人。所以他们进入这个组织,我们也遇到过不适合的人。就是那种文化,对在线状态和回复有很高的期望。我自己先做到。你去问任何一个工程师,他们都会说,你从来不睡觉。我这么做不是刻意做榜样,我就是这种性格。我妻子不太欣赏这一点,我得告诉你。我跟她提过 996,她说,我倒希望。
就像说中国人都在偷懒。对。
所以这就是现实。我觉得每家公司都有自己的文化,而且非常根深蒂固。我们的文化就是这样,每天都会被提醒。我当初并没有刻意想这样建设团队,只是我做事的方式就是这样。
嗯,我想稍微转到创始人这边。我总体上对你很佩服,你那种平衡感。你有一个年轻的家庭。
两个孩子。
对,现在有两个孩子了。
是的,现在两个。
我遇到很多人,他们会说,我要组建家庭了,所以不能当创始人等等。你对这些人有什么建议?
每一天都是这样。我的家人现在在这里,但通常——我在克罗地亚和这里之间飞来飞去。我们很多团队在克罗地亚,一部分团队现在在旧金山这边成长。所以我花很多时间远离家人。这很难。这是一种你必须做出的牺牲。但一开始,人们会说,你临终时会错过一些东西。这可能是真的——但我在开始做这件事时就已经知道,这会很痛苦,而一切都要有痛苦。顺便说一句,我非常相信一切都要有痛苦。去健身房很痛苦。减肥很痛苦。一切都要有痛苦,对吧?确实如此。
就像没有痛苦就没有收获。
确实如此,但你实际上得享受这种痛苦。如果你不享受痛苦,那就不适合你。所以你会习惯那种痛苦。我爱我的孩子,尤其是我有一个女儿和一个儿子。女儿是老大,我很爱她,她不在的时候确实会想念。但这就是我选择的路。我有一个计划和目标,我正在努力实现。现在希望和我妻子——她支持我——我们能更好地协调,让情况不那么糟。但她承担了很大一部分。所以如果你有一个能接受这一点的伴侣,那你就能做到。但即使他们接受,你也得接受自己不在场的事实,对吧?
嗯。这是我对你的想象。这个 meme。
嗯。
那就是你未来的孩子。
我觉得是。我们得教他们,他们并不富有。
因为爸爸建了计算沙盒。
爸爸建了沙盒。爸爸建了沙盒。
并且建了 serverless、Kubernetes 和 agent 的精神继承者。还有其他热门话题、趋势吗?你有很多犀利的观点。实际上,你最有名的是,你当时处于那种 hustle 文化模式,对吧?有人引用你的话说,我都没听说过你,兄弟,下线去过圣诞节吧。然后你的回应是?
哦,我的回应是,这就是我做不到的原因。
嗯。所以我觉得这非常典型。我这里没有,没法调出来。但我觉得这很能代表那种文化。不过,我觉得你还有很多有趣的观点。对创业生态还有什么看法?
哦,创业生态。最近的一个观点是,我觉得——而且这是普遍性的商业问题——我觉得在 Twitter 上表达得不太好。有些人总是误解,那就是市场正在给那些转售 token 的 SaaS 供应商加溢价。
是的。
我认为这是不对的。
为什么?
为什么我认为不对,是因为你看,首先,你的定价取决于价格,无论是公开市场还是私有市场。读到这句话的人会说,收入的重新加速等于过去的收入,但事实并非如此,甚至差得很远。因为第一,在 SaaS 上,你有典型的 SaaS 利润率,不管是多少,对吧?粘性等等。现在你做的事情是,你说,这是我的 agent,我有多少利润率。实际上要差得多,对吧?
嗯。
现在你通过我这个 SaaS 模式使用 Anthropic 或 OpenAI 之类的。然后我们作为社区说,这是重新加速。所以第一,我认为这是错的,因为首先,构成不一样。另一个问题是,回到我之前提到的,比如 KUA 和我怎么建立 OpenClaw 之类的。我不想要你的 agent。Agent 本质上——因为现在有一个问题,历史上一直存在,数据被隔离在 ClickHouse、QuickBooks 里,都是孤岛。现在你给我一个 agent,它会给我数据,但它仍然是孤岛,对吧?所以我现在得拿那些数据,再找另一个 agent。
只要把数据暴露给我的 agent 就行。只要暴露数据。
是的,直接暴露出来就行。我想说的是,把所有东西都暴露出来,然后按使用量收费。所以按 API 消耗来收费。这样你仍然保留原来按席位计费的模式给人类用户用。按这个来收费。Agent 的数量会暴增,如果你的产品有价值,使用量会更大,收费也会更多。所以有些论点是有道理的,有些产品确实有价值。它是个数据库,又不完全是数据库。我们可以深入讨论,但有些确实有价值。而且我其实很惊讶,第一个这么做的人是 Benioff。
Salesforce。Salesforce。
大概三天前有条推文说,Salesforce 的每个产品都通过 API 暴露出来了。
哇。
所有东西。我当时就想,现在我明白这个人为什么这么做了。这太疯狂了。给他点赞。太棒了。就像,谢谢你。我不知道你是不是听了我的建议还是别人的,但总之,谢谢有人这么做。这是世界的发展方向。所以如果你能在这方面真正加速,推动 API 消耗,那就是实实在在的收入,是真正的增长。价值就来源于此。而且我觉得,当人们意识到没人真的会用和付费给这些 agent 和 token 时,会迎来一盆冷水。那其实不是真正的增长,它会回落。
是啊,我是说,显然,我觉得大体上是对的,我同意。但我觉得,人们还是会试图成为一家 AI 公司。
不,不,完全同意。这没什么不对。而且我要说清楚,这不是在贬低任何做这件事的人。每个人都得去获取收入、拿到倍数、获得估值,做该做的事来进入下一阶段。完全同意。但我们作为社区,现在好像在说,哦,这是神奇的出路。其实不是这样。这不是正在发生的事,对吧?
不,我觉得最近有个厨房电器公司搞了些 AI 的噱头,还有那个运动鞋品牌,叫 Allbirds。Allbirds。对,Allbirds 在转向 GPU。这没问题。就像,你知道,我还有点钱,就买几张彩票。你会去提供 GPU 吗?
哦,会的,但不是用于推理。我们想的是 GPU 沙箱。如果你电脑里有 GPU,那就是沙箱里的 GPU。有些工作负载确实需要 GPU。再说一次,我总拿 3D 渲染举例,因为它最容易理解。但如果你想在 CAD 或类似东西上做任何类型的强化学习,你就需要沙箱里的 GPU。所以这个也快来了。是的。
那自己的数据中心呢?
自己的数据中心。我们运行在托管服务商、裸机服务器、数据中心上。从技术上讲,我们可以跑在这些上面,或者自己的数据中心。我们就是这么架构的。目前从毛利率角度看,我们进入这个领域不划算。你得筹集大量资金,承担大量风险,只为了个位数的百分点。所以现在这不合理,但我们的架构从根本上支持我们如果想做就能做。是的。
你现在是这些公司的大客户了。你看到什么机会了吗?
走着瞧吧。是的,走着瞧。
是啊,我看到很多人想搞裸机方案。我们前几天和 Railway 聊过,他们也在做非常类似的策略。
他们觉得——我觉得他们在建什么东西,或者现在有自己的数据中心了。
对,他们大部分是自己的数据中心。但我确实觉得,他们还在用 Equinix 这些东西。所以我觉得有趣的是,这个模式基本没变。它基本上是个房地产模式。他们管理设施,然后你做其他所有事。我好奇未来怎么改变,因为 AI 浪潮是重塑一切的机会。对,还有别的吗?好。我觉得就这些了。我没有其他话题了。我觉得这已经是最全面、最好的了。如果你对计算市场、沙箱和 Daytona 有任何问题,这是最好的起点。这能走到哪去,老兄?现在是四月,月增长 75%。到年底我们会变成什么样?
这是个疯狂的数字。我有点不敢说出口。所以,它非常大。嗯,光是沙箱市场,而且我们——我们之前聊过,整个基础设施市场月增长 40% 左右。每个人都在月增长 40%。这也是个热点观点:如果你没增长 40% 左右,那就不算——这只是市场本身。你基本上不用来上班也能增长那么多。我半开玩笑,但你知道,趋势就是这样。那终点在哪?我们等着看。至少从 CPU 的角度,GPU 更疯狂。从 CPU 的角度看,很可能提前拥有 CPU 本身会成为一种市场策略。而且很可能,因为你大概和很多 GPU 供应商聊过,他们的增长受限于你拥有的 GPU 数量,对吧?
对。
对吧。
这就像,全看 NVIDIA 那天愿意赏你多少。
对,那就是他们能增长多少,对吧?所以我们 CPU 市场整体上,比如像 Railway、Vercel 之类的,或者部署,或者沙箱。还是 CPU。所以每个都在以市场速度增长,加上或减去市场波动,但不受那个限制。所以我的想法是,对我们这个市场里的所有人——数据库也属于这个范畴,因为数据库也跑在 CPU 上——我们都得尽可能快地增长,这样才能从 Intel 或 NVIDIA(它们现在也有 CPU 了)那里拿到足够的 CPU,以后还有其他人。所以当那一步到来时,会很有趣。
也许换个说法,你是潜在的新 Heroku、新 AWS 还是新 Stripe?哪个类比最合适?
有意思,有些类比,比如新 Cloudflare,但新 Cloudflare 就是新 Cloudflare。他们在这方面做得确实不错——
而且 Cloudflare 掌控着网络。没人能对抗。是啊,别想了。
他们做得很好。不,我想说的是,他们整个 agent 产品组合其实非常好。我得说,我个人觉得有些技术限制,比如所有东西都受限于 Workers,Workers 是他们的核心。但从市场策略的愿景来看,我觉得他们真的非常棒。我认为他们比其他一些公司更懂这个。至于你的问题,会有什么——会有个对等的东西。每个人都说会有个面向 AI agent 的 AWS,但你的答案,它可能更像 Stripe 而不是 AWS。所以会有一个专门为 agent 构建的云。那个云会有沙箱、网络搜索、数据库(比如 SQLite 或 Neon 或其他专门为 agent 设计的东西),还有其他东西。我们还没到终点。为 agent 构建的新基础设施原语还没结束。还会有更多。
所以人们会觉得,哦,没别的了。但其实还有更多。我们对下一步有一些想法,只是没时间去做,但确实有更多面向智能体的原语正在构建中。而且我认为,未来会有一个云平台来运行这一切。
是的。OpenAI 提过 AI 云,Vercel 也提过 AI 云,你很可能也是未来 AI 云中的一员。我觉得这是一个非常值得争取的大奖。好了,感谢你来做客。
谢谢你的邀请。这次交流非常棒。