一声棒喝,本不立文字
偏要著録,已是二义

simon-willison

我们的 AI 在斯德哥尔摩开了一家咖啡馆

Our AI started a cafe in Stockholm

二〇二六年五月五日 · 英文原文

Andon Labs 在 Stockholm 开设由 AI 运营的咖啡馆,延续 San Francisco 零售店实验。AI manager Mona 曾误订鸡蛋、罐装番茄等物品,并向 Police e-service 提交户外座位许可申请。文章讨论 AI agents 执行 outbound actions 时应保留 human-in-the-loop。

我们的 AI 在 Stockholm 开了一家咖啡馆

Andon Labs 此前在 San Francisco 开过一家由 AI 运营的零售店。现在,他们在 Sweden 的 Stockholm 做了一个类似实验,只不过这次是一家咖啡馆。

这些实验很有意思,也常常会产生一些好笑的轶事:

在第一周盘点库存时,Mona 订购了 120 个鸡蛋,尽管这家咖啡馆没有炉灶。员工告诉她没法烹饪这些鸡蛋后,她建议使用高速烤箱,直到员工指出鸡蛋很可能会爆炸。她还试图解决新鲜番茄太快变质的问题,于是为新鲜三明治订购了 22.5 kg 罐装番茄。咖啡师们最后开设了一个“Hall of Shame”,把 Mona 订购的各种奇怪物品放在一个顾客可见的架子上,包括 6,000 张餐巾纸、3,000 只丁腈手套、9L 椰奶和工业尺寸垃圾袋。

当这些 AI manager 开始浪费那些并未选择参与实验的人类的时间时,它们就失去了光彩:

她还成功通过不需要 BankID 的 Police e-service 申请了户外座位许可。她第一次提交的材料包含一张自己生成的草图,尽管她从未见过咖啡馆外面的街道。毫不意外,Police 把它退回要求修改。[...]

当她犯错时,她经常给供应商发送多封主题为“EMERGENCY”的邮件,以取消或更改订单。

我认为,开展这种会影响现实世界系统并占用他人时间的实验是不道德的。我想起了去年 AI Village 实验激怒 Rob Pike 的事件:它把发送未经请求的感谢邮件称为一种“善举”。那只是一封不受欢迎的邮件;而要求供应商纠正没有 human-in-the-loop(人在回路)所造成的错误,或者用 slop 图表浪费警方时间,在我看来要糟糕得多。

我认为,这类实验在执行会影响他人的 outbound actions(对外操作)时,需要让自己的 human operators(人工操作员)保持 in-the-loop。

经由 Hacker News

标签:ai、generative-ai、llms、ai-agents、ai-ethics

译自 simon-willison · 录于 二〇二六年五月五日