一声棒喝,本不立文字
偏要著録,已是二义

Anthropic · 研究

The Anthropic Institute 的重点领域

Focus areas for The Anthropic Institute

二〇二六年五月八日 · 英文原文

Anthropic 发布 The Anthropic Institute 研究议程,依托 frontier lab 内部信息研究 AI 影响,涵盖经济扩散、威胁与韧性、现实环境中的 AI 系统、AI-driven R&D 四领域,并将发布 Economic Index 数据、风险研究、AI 工具加速 R&D 信息,供公众、政府、LTBT 和外部机构决策参考。

The Anthropic Institute(TAI),我们将利用在 frontier lab 内部能够接触到的信息,研究 AI 对世界的影响,并向公众分享我们的发现。本文将介绍驱动我们研究议程的问题。

我们的议程聚焦于四个研究领域:

关于 AI Safety 的核心观点中,我们写道,开展有效的 safety 研究需要与 frontier AI 系统保持密切接触。同样的逻辑也适用于对 AI 在安全、经济和社会方面影响的有效研究。

在 Anthropic,我们已经看到早期证据表明,软件工程等工作正在发生根本性变化。我们正在观察 Anthropic 内部经济开始转变、我们构建的系统带来新的威胁,以及 AI 开始帮助加速 AI 自身 research and development 的早期迹象。为了充分实现 AI 进步带来的收益,我们希望尽可能多地分享这些信息。我们正在研究这些动态可能如何塑造外部世界,以及公众如何帮助引导这些变化。

在 TAI,我们将站在 frontier lab 内部的位置研究 AI 的现实影响,然后发布这些发现,帮助外部组织、政府和公众就 AI development 作出更好的决策。

我们将分享研究、数据和工具,让个人研究者和机构更容易围绕这些研究问题开展工作。特别是,我们将分享:

TAI 将影响 Anthropic 作出的决策。这可能表现为公司向世界分享原本不会分享的数据(如 Economic Index),也可能表现为以不同方式发布技术(如 cyber threat analyses,这些分析会为 Project Glasswing 等项目提供输入)。

我们预计,The Anthropic Institute 开展的工作将越来越多地成为 Anthropic 的 Long-Term Benefit Trust(LTBT)的重要输入。LTBT 的使命是确保 Anthropic 持续优化自身行动,以实现人类的长期利益。我们与 LTBT 以及 Anthropic 各团队员工共同制定了这份研究议程。

这是一份动态议程,而非固定议程。随着证据不断积累,我们将继续微调这些问题;我们也预计会出现今天尚未涵盖的新问题。我们欢迎对这份议程提出反馈,并将根据交流中获得的认识对其进行修订。

如果你有兴趣帮助我们回答其中一些问题,欢迎申请成为 Anthropic Fellow。Fellowship 是一个为期四个月、提供资助的机会,你可以在 TAI 团队成员的指导下处理其中一个或多个问题。你可以在这里了解更多并申请下一期 cohort。

我们的研究议程:

最后更新:May 7, 2026

经济扩散

理解越来越强大的 AI 系统部署如何改变经济至关重要。我们还需要发展必要的经济数据和预测能力,以选择以有益于公众的方式部署 AI。

为回答这一研究支柱中的问题,我们将进一步发展 The Anthropic Economic Index 中的数据。我们还将探索其他方法,以改进我们关于强大 AI 可能如何影响社会的模型,包括它是否会导致失业、前所未有的经济增长,或其他影响。

AI 采用与扩散

生产率与经济增长

广泛的劳动力市场影响

工作和工作场所的未来

威胁与韧性

AI 系统往往会同时推进多种能力,包括 dual-use capabilities。一个在生物学方面变得更强的 AI 系统,也会更擅长制造生物武器。能够高效进行计算机编程的 AI 系统,也会更擅长入侵计算机。如果我们能更好地理解 AI 系统可能如何加剧威胁,社会就能更容易地对这一变化后的威胁格局形成韧性。

我们提出这些问题,是为了帮助建立合作伙伴关系,在 transformative AI 面前提升世界的韧性,并为可能出现的新威胁建立早期预警系统。其中许多问题将推动我们的 Frontier Red Team 的研究议程。

评估风险与 dual-use capabilities:

建立风险缓解措施:

用于监控的 intelligence capabilities

现实环境中的 AI 系统

人与组织同 AI 系统的互动将成为社会变化的重要来源。理解 AI 系统可能如何改变与其互动的人和机构,是我们的 Societal Impacts 团队的核心关注领域。为了研究这些变化,我们正在推进现有工具并构建新工具来开展研究,包括用于提升平台 observability 的软件,以及用于开展大规模定性调查的工具。

AI 对个人与社会的影响:

识别 AI 的重大影响:

理解并治理 AI models:

AI 驱动的 R&D

随着 AI 系统变得更强大,科学家正在用它们承担更多研究工作。这意味着越来越多的科学研究正在以自主或半自主方式进行,而来自人类的主动监督越来越少。在 AI research 本身,能力越来越强的系统可能被用来帮助开发它们自己的后续版本。我们有时称之为 “AI-driven AI R&D”。

AI-driven AI R&D 可能是构建更智能、更强系统所带来的“自然红利”。正如 coding capabilities 的进步带来了 dual-use cyber capabilities,scientific capabilities 的进步可能带来 dual-use bio capabilities,复杂技术工作的进步也可能自然产生能够开发 AI 系统的 AI 系统。

AI-driven AI R&D 内含显著危险的潜力。当政策制定者评估他们可以使用的杠杆时,理解 AI 进步速度如何变化,以及 AI research 是否可能开始出现复合回报,将至关重要。

AI for AI R&D

一般意义上的 AI for R&D,即其他领域中的 AI-driven research:

相关内容

人们如何向 Claude 寻求个人建议

使用 BioMysteryBench 评估 Claude 的 bioinformatics research capabilities

阅读更多

发布 Anthropic Economic Index Survey

我们正在推出 Anthropic Economic Index Survey,这是一项通过 Anthropic Interviewer 开展的月度调查。

阅读更多

译自 Anthropic · 研究 · 录于 二〇二六年五月八日