Anthropic · 研究

The Anthropic Institute 的重点领域

Focus areas for The Anthropic Institute

二〇二六年五月八日 · 英文原文

摘要

Anthropic 发布 The Anthropic Institute 研究议程，依托 frontier lab 内部信息研究 AI 影响，涵盖经济扩散、威胁与韧性、现实环境中的 AI 系统、AI-driven R&D 四领域，并将发布 Economic Index 数据、风险研究、AI 工具加速 R&D 信息，供公众、政府、LTBT 和外部机构决策参考。

在 The Anthropic Institute（TAI），我们将利用在 frontier lab 内部能够接触到的信息，研究 AI 对世界的影响，并向公众分享我们的发现。本文将介绍驱动我们研究议程的问题。

我们的议程聚焦于四个研究领域：

经济扩散
威胁与韧性
现实环境中的 AI 系统
AI 驱动的 R&D

在关于 AI Safety 的核心观点中，我们写道，开展有效的 safety 研究需要与 frontier AI 系统保持密切接触。同样的逻辑也适用于对 AI 在安全、经济和社会方面影响的有效研究。

在 Anthropic，我们已经看到早期证据表明，软件工程等工作正在发生根本性变化。我们正在观察 Anthropic 内部经济开始转变、我们构建的系统带来新的威胁，以及 AI 开始帮助加速 AI 自身 research and development 的早期迹象。为了充分实现 AI 进步带来的收益，我们希望尽可能多地分享这些信息。我们正在研究这些动态可能如何塑造外部世界，以及公众如何帮助引导这些变化。

在 TAI，我们将站在 frontier lab 内部的位置研究 AI 的现实影响，然后发布这些发现，帮助外部组织、政府和公众就 AI development 作出更好的决策。

我们将分享研究、数据和工具，让个人研究者和机构更容易围绕这些研究问题开展工作。特别是，我们将分享：

来自 The Anthropic Economic Index 的更细粒度信息，并以更高频率发布，介绍我们在劳动力影响和 AI 使用方面观察到的情况。我们将努力成为重大变化和扰动的早期预警信号。
关于在新的 AI-enabled 安全风险面前，社会中最需要投资提升韧性的领域的研究。
关于 Anthropic 的工作如何因新的 AI 工具而加速的更详细信息，以及关于 AI 系统潜在 recursive self-improvement 影响的思考。

TAI 将影响 Anthropic 作出的决策。这可能表现为公司向世界分享原本不会分享的数据（如 Economic Index），也可能表现为以不同方式发布技术（如 cyber threat analyses，这些分析会为 Project Glasswing 等项目提供输入）。

我们预计，The Anthropic Institute 开展的工作将越来越多地成为 Anthropic 的 Long-Term Benefit Trust（LTBT）的重要输入。LTBT 的使命是确保 Anthropic 持续优化自身行动，以实现人类的长期利益。我们与 LTBT 以及 Anthropic 各团队员工共同制定了这份研究议程。

这是一份动态议程，而非固定议程。随着证据不断积累，我们将继续微调这些问题；我们也预计会出现今天尚未涵盖的新问题。我们欢迎对这份议程提出反馈，并将根据交流中获得的认识对其进行修订。

如果你有兴趣帮助我们回答其中一些问题，欢迎申请成为 Anthropic Fellow。Fellowship 是一个为期四个月、提供资助的机会，你可以在 TAI 团队成员的指导下处理其中一个或多个问题。你可以在这里了解更多并申请下一期 cohort。

我们的研究议程：

最后更新：May 7, 2026

经济扩散

理解越来越强大的 AI 系统部署如何改变经济至关重要。我们还需要发展必要的经济数据和预测能力，以选择以有益于公众的方式部署 AI。

为回答这一研究支柱中的问题，我们将进一步发展 The Anthropic Economic Index 中的数据。我们还将探索其他方法，以改进我们关于强大 AI 可能如何影响社会的模型，包括它是否会导致失业、前所未有的经济增长，或其他影响。

AI 采用与扩散

**谁在采用 AI？**AI development 集中在少数国家的少数公司手中，但部署是全球性的。是什么决定了一个国家、地区或城市能否获得 AI？如果能够获得，它如何从 AI 中获取经济价值？哪些政策和商业模式会实质性改变这种平衡？free 或 open weight 模型如何参与这一动态？
**企业中的采用：**企业层面的 AI 采用由什么驱动，又会产生什么后果？AI 如何改变企业或团队达到最高效率所需的规模？AI 使用在企业之间的集中程度有多高？AI 采用集中度的变化如何转化为 markups 和 labor share？如果一个 3 人团队或公司现在可以完成过去需要 300 人才能完成的工作，产业组织会发生什么变化？或者，如果企业能更容易地集中知识，并且在规模化集中方面存在收益，我们是否会看到更大、更扩张的企业，并且它们更有动力系统性地监控员工？
**AI 是 general purpose technology 吗？**AI 是否在遵循以往 “general purpose technologies” 的模式，即在高利润商业应用中采用最快，而在社会回报超过私人回报的领域采用最慢？是否有政策或决策能够改变这些动态？

生产率与经济增长

**生产率增长：**AI 将对整个经济中的创新速度和生产率增长产生什么影响？
**分享收益：**哪些预分配或再分配机制能够有效地更广泛传播 AI development 与部署带来的收益？
**市场中的交易成本：**AI 如何影响市场中的交换系统和交易成本？在什么情况下，能够代表你进行谈判的 agents 会提升市场效率和公平结果？在什么情况下不会？

广泛的劳动力市场影响

**AI 与工作：**AI 将如何改变经济不同部分的工作和就业？随着 AI 自动化经济中已有的部分，可能出现哪些新任务和新工作？这些变化在不同地区和国家之间会有怎样的差异？我们的 Anthropic Economic Index Survey 将每月提供信号，反映人们如何看待 AI 对其工作的影响，以及他们对未来的预期。我们也在更新 Economic Index，以分享更高频、更细粒度的数据。
**AI 扩散能否被调节？**中央银行试图通过 policy rate 和 forward guidance 等“旋钮”来调节通胀。是否存在类似的旋钮，让 AI 公司（在行业层面与政府合作）可以按部门控制 AI 扩散速度？转动这些旋钮是否会带来明确的公共利益？

工作和工作场所的未来

**劳动者如何看待自己的工作：**经济中各类劳动者如何体验其职业的变化？他们对这些变化有多大影响力，‘worker’ power 能否被保留或转化？
**专业人才管道：**许多职业依赖初级岗位（如 paralegals、junior analysts 和 associate developers）来训练未来的资深从业者。如果 AI 吸收了那些历史上用于建立专业能力的任务，人们最初如何成为专家？这对某一领域 senior judgment 的长期供给意味着什么？
**为未来而学习：**今天人们应该学习什么，才能在未来处于有利位置？未来的职业是什么？AI 如何改变“学会某件事”和发展专业能力的含义？
**有偿工作的角色：**如果 AI 大幅降低有偿工作在人类生活中的中心性，什么条件能够让人们把时间和精力重新分配到其他意义来源上？我们能从历史上或当代那些工作稀缺或可选的人群中学到什么？社会如何应对这一转变？

威胁与韧性

AI 系统往往会同时推进多种能力，包括 dual-use capabilities。一个在生物学方面变得更强的 AI 系统，也会更擅长制造生物武器。能够高效进行计算机编程的 AI 系统，也会更擅长入侵计算机。如果我们能更好地理解 AI 系统可能如何加剧威胁，社会就能更容易地对这一变化后的威胁格局形成韧性。

我们提出这些问题，是为了帮助建立合作伙伴关系，在 transformative AI 面前提升世界的韧性，并为可能出现的新威胁建立早期预警系统。其中许多问题将推动我们的 Frontier Red Team 的研究议程。

评估风险与 dual-use capabilities：

**Dual-use technology：**强大的 AI 天然具有 dual-use 性质：同样的工具既能改善健康和教育，也能支持监控和压制。我们能否构建 observability 工具，来理解这是否正在发生以及如何发生？
**适当为风险定价：**有哪些有效的、市场驱动的方法可以提升社会对 AI 系统预期威胁的韧性？我们能否发展新的风险定价方式，或技术工具与人类组织，以便在可预测威胁（如更强的 AI cyberattack 能力）到来之前提升韧性？
**攻防平衡：**AI-enabled 能力是否会在 cyber 和 bio 等领域结构性地有利于攻击者？当 AI 被应用于更常规的领域，例如更深入地集成到 command and control systems 中时，它是否有利于攻击者？更广泛地说，AI 将如何改变人类冲突的性质？

建立风险缓解措施：

**为危机场景制定计划：**在冷战期间，美国总统有一条直通克里姆林宫的热线，用于核危机发生时的沟通。如果出现涉及 AI 系统的危机场景，需要怎样的地缘政治基础设施？这种基础设施不一定是国家对国家的，也可能是公司对国家，或公司对公司。
**更快的防御机制：**AI capabilities 可能在数月内取得进展。监管、保险和基础设施响应则以年为时间尺度运行。我们如何弥合这一差距？自动化补丁、AI-enabled 威胁检测或预置响应能力等防御机制，能否匹配 AI-enabled 攻击的节奏和规模？还是说这种不对称是结构性的？我们又如何尽可能有效地推出这些防御机制？

用于监控的 intelligence capabilities

**AI 对监控的影响：**AI 如何改变监控的运作方式？它会让监控更便宜、更有效，还是二者兼有？

现实环境中的 AI 系统

人与组织同 AI 系统的互动将成为社会变化的重要来源。理解 AI 系统可能如何改变与其互动的人和机构，是我们的 Societal Impacts 团队的核心关注领域。为了研究这些变化，我们正在推进现有工具并构建新工具来开展研究，包括用于提升平台 observability 的软件，以及用于开展大规模定性调查的工具。

AI 对个人与社会的影响：

**群体 epistemology：**当大量人口都咨询同样少数几个模型时，我们的 epistemology 会发生什么变化？我们能否找到方法，衡量由共同使用 AI 所导致的大规模信念、写作风格和问题解决方法的变化？
**批判性思维：**随着 AI 系统能力增强并获得更多信任，我们如何检测并避免人类批判性思维能力的退化？这种退化可能来自人们越来越顺从 AI 的判断。
**技术界面：**技术的界面会决定人们如何与其互动——电视让人成为被动观看者，计算机则可以让人更容易成为生成式创作者。可以构建哪些界面，使 AI 系统改善并促进 human agency？
**管理 human-AI systems：**人类如何有效管理由人类与 AI 系统混合组成的团队？反过来又如何——AI 系统如何管理由人类、AIs 或二者组合构成的团队？

识别 AI 的重大影响：

**行为效应：**正如社交媒体导致人们的行为发生变化，AI 也可能塑造人类行为。哪些类型的监测或测量能够帮助研究者理解这一动态？
**促进研究：**是否存在 transparency regimes 和工具，使更广泛的人群，而不仅是 frontier AI 公司，能够轻松研究现实世界中的 AI 使用情况？

理解并治理 AI models：

**系统“价值观”：**AI 系统表达出的“价值观”是什么，它们与这些系统的训练方式有什么关系？更具体地说，我们如何衡量 AI “constitution” 在模型部署后对其行为的影响？我们将扩展此前关于这些问题的研究工作。
**治理 autonomous agents：**现有法律、治理系统和问责机制中的哪些方面可以适配 autonomous AI agents？例如，海事法如何处理被遗弃船只，与法律如何处理在无人类监督下运行的 agents 有相关性。反过来，现有法律中是否有一些方面已经适用于 AI agents，并且不应适用？
**Agents 的可靠性：**autonomous AI agents 的哪些方面可以被适配到现有法律、治理系统和问责机制中？例如，我们能否确保 AI agents 具有唯一身份，并且即使在没有直接人类控制的情况下也能可靠输出这一身份？
**AI 对 AI 的治理：**我们能多有效地使用 AI 来治理 AI 系统？在 AI oversight 的哪些领域，人类要么具有 comparative advantage，要么存在法律或规范要求必须 ‘in the loop’？
**Agent 互动：**AI agents 相互互动时会形成哪些规范？不同 agents 可能如何表达不同偏好，而这些偏好又会如何影响其他 agents？

AI 驱动的 R&D

随着 AI 系统变得更强大，科学家正在用它们承担更多研究工作。这意味着越来越多的科学研究正在以自主或半自主方式进行，而来自人类的主动监督越来越少。在 AI research 本身，能力越来越强的系统可能被用来帮助开发它们自己的后续版本。我们有时称之为 “AI-driven AI R&D”。

AI-driven AI R&D 可能是构建更智能、更强系统所带来的“自然红利”。正如 coding capabilities 的进步带来了 dual-use cyber capabilities，scientific capabilities 的进步可能带来 dual-use bio capabilities，复杂技术工作的进步也可能自然产生能够开发 AI 系统的 AI 系统。

AI-driven AI R&D 内含显著危险的潜力。当政策制定者评估他们可以使用的杠杆时，理解 AI 进步速度如何变化，以及 AI research 是否可能开始出现复合回报，将至关重要。

AI for AI R&D

**AI R&D 的治理：**如果 AI 系统正在被用于自主开发和改进自身，人类如何对这些系统获得有意义的可见性与控制力？最终将由什么来治理这些系统？
**消防演练场景：**我们如何为 intelligence explosion 开展一次“消防演练”？什么样的 tabletop exercise 才能真正测试 lab 领导层、董事会和政府的决策能力？
**AI R&D 的 telemetry：**我们如何衡量 AI research and development 的总体速度？为了收集这些信息，必须存在哪些类型的 telemetry 和底层技术 affordances？与 AI R&D 相关的指标可能如何作为 recursive self-improvement 的早期预警信号？
**控制 AI acceleration：**如果 intelligence explosion 已迫在眉睫，哪些干预点有助于放缓或以其他方式改变爆发速度？假设人类能够干预，哪些实体应当掌握这种能力——政府？公司？

一般意义上的 AI for R&D，即其他领域中的 AI-driven research：

**技术树：**AI 正在以远快于其他科学的速度加速某些科学领域，这取决于数据可得性、评估信号，以及知识中有多少是 tacit 或由机构把关的。这一梯度有多不均匀？科学进步组成结构的变化，对哪些人类问题会被率先解决意味着什么？
**参差不齐的 frontier：**模型能力在不同领域强弱不一。具有巨大正外部性的领域——如 drug discovery 和 materials science——获得的投资低于其价值所应得到的水平。市场会根据私人回报引导模型改进方向，但我们能否改进模型表现，以应对社会外部性？

The Anthropic Institute 的重点领域

我们的研究议程：

经济扩散

威胁与韧性

现实环境中的 AI 系统

AI 驱动的 R&D

相关内容

人们如何向 Claude 寻求个人建议

使用 BioMysteryBench 评估 Claude 的 bioinformatics research capabilities

发布 Anthropic Economic Index Survey