一声棒喝,本不立文字
偏要著録,已是二义

Anthropic · 研究

81,000 人告诉我们的 AI 经济学

What 81,000 people told us about the economics of AI

二〇二六年五月八日 · 英文原文

Anthropic 调查 80,508 名 Claude 用户,并用 Claude-powered classifiers 推断职业、职业阶段和情绪。结果显示,observed exposure 每增 10 个百分点,感知工作威胁增 1.3 个百分点;生产力均分 5.1,早期职业者更担忧替代。

为了让公众了解我们在 AI 领域观察到的经济变化,我们的 Economic Index 分享了 Claude 被要求完成哪些工作,以及在哪些职业中 Claude 承担了最大比例的任务。不过迄今为止,我们还缺少关于这些使用模式如何对应到人们对 AI 的想法和印象的信息。

我们最近对 81,000 名 Claude 用户进行的调查研究,提供了一种方式,将人们的经济担忧与我们在 Claude 流量中量化到的内容联系起来。

这项调查询问了人们对 AI 进展的愿景和担忧。人们分享的许多想法都涉及经济议题。我们了解到,许多人担心工作岗位被替代——尽管他们也觉得自己在工作中更高效、更有能力。在一些情况下,AI 让他们能够创业,或让他们有时间做更重要的事情;在另一些情况下,AI 让人感到受限,或像是由雇主强加给他们的工具。

调查结果提供了初步证据,表明观察到的 exposure(我们衡量 AI 替代风险的指标)与围绕 AI 的经济担忧相关。处于高 exposure 职业的人——按我们观察到 Claude 正在执行的任务来定义——对经济替代更紧张。这与人们总体上意识到 AI 的扩散及其潜在影响相一致。我们在下文进一步展开这些发现。

“嗯,就像现在任何从事白领工作的人一样,我 100% 担心,基本上 24/7 都在担心自己最终会因为 A.I. 而失业。”——软件工程师。1

在我们的调查中,五分之一的受访者表达了对经济替代的担忧。有些人从抽象层面担心这一点:一位软件开发者警告说,“AI 以当前状态被用来取代初级岗位的可能性”。另一些人则对自己的工作或工作中的某些部分正在被自动化取代表示遗憾。一位市场研究员说:“就提升我的能力而言,这一点毫无疑问。[但]未来 AI 可能会取代我的工作。”在一些岗位上,人们觉得 AI 让他们的工作变得更难。一位软件开发者观察到,“当 AI 出现后,项目经理开始分配越来越难的 ticket 和 bug 让我们解决。”

在本报告中,我们使用 Claude-powered classifiers 从人们的回答中推断其属性和情绪。例如,许多参与者会顺带提到自己的工作领域,或提供关于工作生活的有信息量的细节,这使我们能够推断他们的职业。同样,我们通过 prompt Claude 识别并解释受访者直接表示自己岗位面临 AI-driven displacement 风险的引用,来量化对失业的担忧。我们在 Appendix 中给出了示例 prompt。

受访者感知到的 AI 威胁与我们自己的 observed exposure 指标相关,该指标反映 Claude 被用于某一职业任务的比例。当某位受访者对应的 observed exposure 指标更高时,该受访者对 AI 的担忧也更强。例如,小学教师对自己被替代的担忧低于软件工程师,这与 Claude 使用偏向 coding 任务这一事实一致。

我们在下面的 Figure 1 中展示了这一点。y 轴是某一职业中表示 AI 已经在取代其岗位或很可能很快取代其岗位的受访者比例。x 轴是 observed exposure。图中显示,平均来看,处于 exposure 更高职业的人更倾向于表达对其工作被自动化取代的担忧。exposure 每增加 10 个百分点,感知到的工作威胁就增加 1.3 个百分点。处于 exposure 前 25% 的人提到这种担忧的频率,是后 25% 人群的三倍。

另一个重要的劳动者特征是职业阶段。在此前的研究中,我们报告过一些初步迹象,显示美国应届毕业生和早期职业阶段劳动者的招聘有所放缓。对于本次调查中约一半的受访者,我们能够从其回答中推断职业阶段。2 我们发现,早期职业阶段受访者表达对工作替代担忧的可能性,远高于资深劳动者。

我们使用 Claude 评估调查回答,将人们自述的 AI 带来的生产力提升程度按 1–7 分量表评分,其中 1 表示“生产力下降”,2 表示“没有变化”,之后每一级表示更大的提升。得分为 7 的回答包括这样的陈述:“我 [做] 的这个网站过去需要几个月,现在 4-5 天就完成了”;Claude 给类似“原本可能需要四小时的事,用一半时间就完成了”的表述打 5 分,给类似“就我个人而言,我让 AI 帮我修复了一个网站上的代码。但要经过多轮才得到我想要的结果”的表述打 2 分。3

总体而言,人们平均报告了有意义的生产力提升。生产力评分的均值为 5.1,对应“生产力显著提高”。当然,我们的受访者是活跃的 Claude 用户,并且愿意参与调查。这可能使他们比普通用户更可能报告生产力收益。约 3% 的人报告了负面或中性的影响,42% 的人没有就生产力给出明确说明。

这一点在收入维度上有所分化。Figure 3 左侧面板显示,从事高薪工作的人,例如软件开发者,传达出的 AI 生产力提升最大。这个结果并不仅由 coding 驱动;在排除计算机和数学职业后,这一结果仍然成立。它呼应了此前 Economic Index 的一项发现,该发现同样更有利于高薪劳动者:在需要更高教育水平的任务中,相对于不使用 AI,Claude 往往能以更高比例减少完成任务所需时间。

一些收入最低的劳动者也描述了较高的生产力提升。其中包括一位客服代表使用“AI 帮我基于另一个回复创建回复,节省了大量时间”。在一些情况下,低工资岗位的人也在技术类副业项目中使用 AI。例如,一位配送司机使用 Claude 创办一家 e-commerce business,一位园艺工人则在构建一款音乐应用。

我们在 Figure 3 右侧面板中更详细地观察了这一点,图中展示按主要职业组推断出的生产力提升。位居顶部的是管理类职业。这些受访者大多是使用 Claude 创建业务的创业者。4 第二高的类别是计算机和数学,其中包括软件开发者。生产力改善最温和的两个群体是科学和法律专业人员。一些律师担心 AI 遵循精确指令的能力。例如:“我已经给出了非常具体的规则,说明什么在哪里、如何阅读一份法律文件、我希望它做什么……但它每次都会偏离。”

随着 AI 在经济中扩散,一个关键问题是收益将归于哪里——劳动者、他们的管理者、消费者,还是企业。约四分之一的访谈中,受访者指出了这些收益的接收方。总体而言,这些人中大多数提到收益归于自己,表现为任务更快、工作范围扩大,以及时间被释放出来。5 但在明确指出接收方的受访者中,10% 表示雇主或客户正在要求并获得更多工作。较小比例的人提到 AI 公司获益,更小比例的人表示 AI 总体上会带来负面影响。这取决于职业阶段:只有 60% 的早期职业阶段劳动者表示自己从 AI 中受益,而资深专业人士的这一比例为 80%。

受访者还分享了他们在哪些方面获得了生产力提升。我们将其分为 scope、speed、quality 和 cost。例如,许多使用 AI 完成 coding 任务的人会说:“我不是技术人员,但现在我是 full stack developer。”这是 scope 的扩展;AI 为他们解锁了新能力。相比之下,一些用户加速了他们本来就在做的任务,比如一位会计说:“我做了一个工具,帮助我在 15 分钟内完成一项融资任务,而这过去需要 2 小时。”quality 提升通常来自对代码、合同和其他文书更彻底的检查。还有一小部分受访者提到使用 AI 的低成本:“[如]果我雇一名社交媒体经理,就超出我的预算了。”

我们发现,最常见的生产力增强体现在 scope 上,在明确提到生产力影响的用户中,有 48% 提到了这一点。提到生产力的用户中,有 40% 强调 speed。

人们使用 Claude 的体验也可能影响他们对 AI 的担忧。为评估这一点,我们通过提取受访者的工作现在是慢得多(编码为 1)、速度没有变化(4),还是快得多(7),来衡量他们报告的 speedup。

我们发现,speedup 与感知到的工作威胁之间呈 U 型关系(见 Figure 6)。最左侧的柱表示报告 AI 使其变慢的受访者。这些受访者更可能表示 AI 对他们的生计构成重大威胁。例如,一些创意工作者,如美术家和作家,发现 AI 对他们自己的工作来说过于束缚和僵硬,难以提供帮助。与此同时,他们担心 AI 向创意领域扩散会让他们更难找到工作。

对于其余受访者而言,感知到的工作威胁会随着其回答所暗示的 speedup 水平而持续上升。这在经济上有一定道理:如果完成自身任务所需时间正在快速缩短,那么该岗位未来可持续性的的不确定性可能会更高。

Economic Index 揭示了人们如何使用 AI。但要理解 AI 的经济影响,另一个关键输入是直接听取人们的体验。这里探讨的回答显示,人们的直觉与使用数据相吻合:在我们观察到 Claude 执行最多工作的职业中,人们最担心 AI 的影响。我们还发现,早期职业阶段劳动者的经济焦虑水平更高,这与过去的研究一致。

也有迹象表明,Claude 赋能了其用户。人们最可能谈论流向自己的收益,而不是流向雇主或 AI 公司。高工资劳动者对 AI 的生产力影响最为积极,但低工资岗位和教育水平较低的人也报告了较大的生产力提升。大多数受访者报告称,Claude 通过拓宽其工作范围或提高工作速度增强了他们的能力。但经历最大 speedup 的用户,也最担心 AI 对工作的影响。

由于数据性质所限,我们的分析有一些重要注意事项。第一,我们的调查仅限于 Claude.ai 个人账户用户中选择回应的人。除其他潜在偏差外,这些用户可能更倾向于认为收益流向了自己。第二,我们并未直接询问用户本文中的许多派生变量,因此我们根据上下文线索推断其职业、职业阶段和其他变量时可能出错。相关地,由于调查是开放式的,我们的衡量基于受访者碰巧提到的内容;这些发现应在结构化调查中通过直接询问相关主题来确认。

尽管如此,这些访谈呈现了人们对 AI 经济学的真实感受,显示了定性数据如何提出定量假设。而与经济相关的担忧占比较大,本身就是一个强信号。

请参见链接 PDF 的最后一节。

我们感谢分享自己故事的 80,508 名 Claude 用户。

Maxim Massenkoff 负责分析并撰写了这篇 blog post。Saffron Huang 负责访谈项目,并在整个过程中提供指导。

Zoe Hitzig 和 Eva Lyubich 提供了关键反馈和方法论指导。Keir Bradwell 和 Rebecca Hiscott 提供了编辑支持。Hanah Ho 和 Kim Withee 参与了设计。Grace Yun、AJ Alt 和 Thomas Millar 在 Claude.ai 中实现了 Anthropic Interviewer。Chelsea Larsson、Jane Leibrock 和 Matt Gallivan 参与了调查和体验设计。Theodore Sumers 参与了数据处理和 clustering 基础设施。Peter McCrory、Deep Ganguli 和 Jack Clark 提供了关键反馈、方向和组织支持。

此外,我们感谢 Miriam Chaum、Ankur Rathi、Santi Ruiz 和 David Saunders 的讨论、反馈与支持。

译自 Anthropic · 研究 · 录于 二〇二六年五月八日