The Anthropic Institute 的重点领域
Focus areas for The Anthropic Institute
Anthropic 发布 The Anthropic Institute 研究议程,依托 frontier lab 内部信息研究 AI 影响,涵盖经济扩散、威胁与韧性、现实环境中的 AI 系统、AI-driven R&D 四领域,并将发布 Economic Index 数据、风险研究、AI 工具加速 R&D 信息,供公众、政府、LTBT 和外部机构决策参考。
在 The Anthropic Institute(TAI),我们将利用在 frontier lab 内部能够接触到的信息,研究 AI 对世界的影响,并向公众分享我们的发现。本文将介绍驱动我们研究议程的问题。
我们的议程聚焦于四个研究领域:
- 经济扩散
- 威胁与韧性
- 现实环境中的 AI 系统
- AI 驱动的 R&D
在 关于 AI Safety 的核心观点中,我们写道,开展有效的 safety 研究需要与 frontier AI 系统保持密切接触。同样的逻辑也适用于对 AI 在安全、经济和社会方面影响的有效研究。
在 Anthropic,我们已经看到早期证据表明,软件工程等工作正在发生根本性变化。我们正在观察 Anthropic 内部经济开始转变、我们构建的系统带来新的威胁,以及 AI 开始帮助加速 AI 自身 research and development 的早期迹象。为了充分实现 AI 进步带来的收益,我们希望尽可能多地分享这些信息。我们正在研究这些动态可能如何塑造外部世界,以及公众如何帮助引导这些变化。
在 TAI,我们将站在 frontier lab 内部的位置研究 AI 的现实影响,然后发布这些发现,帮助外部组织、政府和公众就 AI development 作出更好的决策。
我们将分享研究、数据和工具,让个人研究者和机构更容易围绕这些研究问题开展工作。特别是,我们将分享:
- 来自 The Anthropic Economic Index 的更细粒度信息,并以更高频率发布,介绍我们在劳动力影响和 AI 使用方面观察到的情况。我们将努力成为重大变化和扰动的早期预警信号。
- 关于在新的 AI-enabled 安全风险面前,社会中最需要投资提升韧性的领域的研究。
- 关于 Anthropic 的工作如何因新的 AI 工具而加速的更详细信息,以及关于 AI 系统潜在 recursive self-improvement 影响的思考。
TAI 将影响 Anthropic 作出的决策。这可能表现为公司向世界分享原本不会分享的数据(如 Economic Index),也可能表现为以不同方式发布技术(如 cyber threat analyses,这些分析会为 Project Glasswing 等项目提供输入)。
我们预计,The Anthropic Institute 开展的工作将越来越多地成为 Anthropic 的 Long-Term Benefit Trust(LTBT)的重要输入。LTBT 的使命是确保 Anthropic 持续优化自身行动,以实现人类的长期利益。我们与 LTBT 以及 Anthropic 各团队员工共同制定了这份研究议程。
这是一份动态议程,而非固定议程。随着证据不断积累,我们将继续微调这些问题;我们也预计会出现今天尚未涵盖的新问题。我们欢迎对这份议程提出反馈,并将根据交流中获得的认识对其进行修订。
如果你有兴趣帮助我们回答其中一些问题,欢迎申请成为 Anthropic Fellow。Fellowship 是一个为期四个月、提供资助的机会,你可以在 TAI 团队成员的指导下处理其中一个或多个问题。你可以在这里了解更多并申请下一期 cohort。
我们的研究议程:
最后更新:May 7, 2026
经济扩散
理解越来越强大的 AI 系统部署如何改变经济至关重要。我们还需要发展必要的经济数据和预测能力,以选择以有益于公众的方式部署 AI。
为回答这一研究支柱中的问题,我们将进一步发展 The Anthropic Economic Index 中的数据。我们还将探索其他方法,以改进我们关于强大 AI 可能如何影响社会的模型,包括它是否会导致失业、前所未有的经济增长,或其他影响。
AI 采用与扩散
- **谁在采用 AI?**AI development 集中在少数国家的少数公司手中,但部署是全球性的。是什么决定了一个国家、地区或城市能否获得 AI?如果能够获得,它如何从 AI 中获取经济价值?哪些政策和商业模式会实质性改变这种平衡?free 或 open weight 模型如何参与这一动态?
- **企业中的采用:**企业层面的 AI 采用由什么驱动,又会产生什么后果?AI 如何改变企业或团队达到最高效率所需的规模?AI 使用在企业之间的集中程度有多高?AI 采用集中度的变化如何转化为 markups 和 labor share?如果一个 3 人团队或公司现在可以完成过去需要 300 人才能完成的工作,产业组织会发生什么变化?或者,如果企业能更容易地集中知识,并且在规模化集中方面存在收益,我们是否会看到更大、更扩张的企业,并且它们更有动力系统性地监控员工?
- **AI 是 general purpose technology 吗?**AI 是否在遵循以往 “general purpose technologies” 的模式,即在高利润商业应用中采用最快,而在社会回报超过私人回报的领域采用最慢?是否有政策或决策能够改变这些动态?
生产率与经济增长
- **生产率增长:**AI 将对整个经济中的创新速度和生产率增长产生什么影响?
- **分享收益:**哪些预分配或再分配机制能够有效地更广泛传播 AI development 与部署带来的收益?
- **市场中的交易成本:**AI 如何影响市场中的交换系统和交易成本?在什么情况下,能够代表你进行谈判的 agents 会提升市场效率和公平结果?在什么情况下不会?
广泛的劳动力市场影响
- **AI 与工作:**AI 将如何改变经济不同部分的工作和就业?随着 AI 自动化经济中已有的部分,可能出现哪些新任务和新工作?这些变化在不同地区和国家之间会有怎样的差异?我们的 Anthropic Economic Index Survey 将每月提供信号,反映人们如何看待 AI 对其工作的影响,以及他们对未来的预期。我们也在更新 Economic Index,以分享更高频、更细粒度的数据。
- **AI 扩散能否被调节?**中央银行试图通过 policy rate 和 forward guidance 等“旋钮”来调节通胀。是否存在类似的旋钮,让 AI 公司(在行业层面与政府合作)可以按部门控制 AI 扩散速度?转动这些旋钮是否会带来明确的公共利益?
工作和工作场所的未来
- **劳动者如何看待自己的工作:**经济中各类劳动者如何体验其职业的变化?他们对这些变化有多大影响力,‘worker’ power 能否被保留或转化?
- **专业人才管道:**许多职业依赖初级岗位(如 paralegals、junior analysts 和 associate developers)来训练未来的资深从业者。如果 AI 吸收了那些历史上用于建立专业能力的任务,人们最初如何成为专家?这对某一领域 senior judgment 的长期供给意味着什么?
- **为未来而学习:**今天人们应该学习什么,才能在未来处于有利位置?未来的职业是什么?AI 如何改变“学会某件事”和发展专业能力的含义?
- **有偿工作的角色:**如果 AI 大幅降低有偿工作在人类生活中的中心性,什么条件能够让人们把时间和精力重新分配到其他意义来源上?我们能从历史上或当代那些工作稀缺或可选的人群中学到什么?社会如何应对这一转变?
威胁与韧性
AI 系统往往会同时推进多种能力,包括 dual-use capabilities。一个在生物学方面变得更强的 AI 系统,也会更擅长制造生物武器。能够高效进行计算机编程的 AI 系统,也会更擅长入侵计算机。如果我们能更好地理解 AI 系统可能如何加剧威胁,社会就能更容易地对这一变化后的威胁格局形成韧性。
我们提出这些问题,是为了帮助建立合作伙伴关系,在 transformative AI 面前提升世界的韧性,并为可能出现的新威胁建立早期预警系统。其中许多问题将推动我们的 Frontier Red Team 的研究议程。
评估风险与 dual-use capabilities:
- **Dual-use technology:**强大的 AI 天然具有 dual-use 性质:同样的工具既能改善健康和教育,也能支持监控和压制。我们能否构建 observability 工具,来理解这是否正在发生以及如何发生?
- **适当为风险定价:**有哪些有效的、市场驱动的方法可以提升社会对 AI 系统预期威胁的韧性?我们能否发展新的风险定价方式,或技术工具与人类组织,以便在可预测威胁(如更强的 AI cyberattack 能力)到来之前提升韧性?
- **攻防平衡:**AI-enabled 能力是否会在 cyber 和 bio 等领域结构性地有利于攻击者?当 AI 被应用于更常规的领域,例如更深入地集成到 command and control systems 中时,它是否有利于攻击者?更广泛地说,AI 将如何改变人类冲突的性质?
建立风险缓解措施:
- **为危机场景制定计划:**在冷战期间,美国总统有一条直通克里姆林宫的热线,用于核危机发生时的沟通。如果出现涉及 AI 系统的危机场景,需要怎样的地缘政治基础设施?这种基础设施不一定是国家对国家的,也可能是公司对国家,或公司对公司。
- **更快的防御机制:**AI capabilities 可能在数月内取得进展。监管、保险和基础设施响应则以年为时间尺度运行。我们如何弥合这一差距?自动化补丁、AI-enabled 威胁检测或预置响应能力等防御机制,能否匹配 AI-enabled 攻击的节奏和规模?还是说这种不对称是结构性的?我们又如何尽可能有效地推出这些防御机制?
用于监控的 intelligence capabilities
- **AI 对监控的影响:**AI 如何改变监控的运作方式?它会让监控更便宜、更有效,还是二者兼有?
现实环境中的 AI 系统
人与组织同 AI 系统的互动将成为社会变化的重要来源。理解 AI 系统可能如何改变与其互动的人和机构,是我们的 Societal Impacts 团队的核心关注领域。为了研究这些变化,我们正在推进现有工具并构建新工具来开展研究,包括用于提升平台 observability 的软件,以及用于开展大规模定性调查的工具。
AI 对个人与社会的影响:
- **群体 epistemology:**当大量人口都咨询同样少数几个模型时,我们的 epistemology 会发生什么变化?我们能否找到方法,衡量由共同使用 AI 所导致的大规模信念、写作风格和问题解决方法的变化?
- **批判性思维:**随着 AI 系统能力增强并获得更多信任,我们如何检测并避免人类批判性思维能力的退化?这种退化可能来自人们越来越顺从 AI 的判断。
- **技术界面:**技术的界面会决定人们如何与其互动——电视让人成为被动观看者,计算机则可以让人更容易成为生成式创作者。可以构建哪些界面,使 AI 系统改善并促进 human agency?
- **管理 human-AI systems:**人类如何有效管理由人类与 AI 系统混合组成的团队?反过来又如何——AI 系统如何管理由人类、AIs 或二者组合构成的团队?
识别 AI 的重大影响:
- **行为效应:**正如社交媒体导致人们的行为发生变化,AI 也可能塑造人类行为。哪些类型的监测或测量能够帮助研究者理解这一动态?
- **促进研究:**是否存在 transparency regimes 和工具,使更广泛的人群,而不仅是 frontier AI 公司,能够轻松研究现实世界中的 AI 使用情况?
理解并治理 AI models:
- **系统“价值观”:**AI 系统表达出的“价值观”是什么,它们与这些系统的训练方式有什么关系?更具体地说,我们如何衡量 AI “constitution” 在模型部署后对其行为的影响?我们将扩展此前关于这些问题的研究工作。
- **治理 autonomous agents:**现有法律、治理系统和问责机制中的哪些方面可以适配 autonomous AI agents?例如,海事法如何处理被遗弃船只,与法律如何处理在无人类监督下运行的 agents 有相关性。反过来,现有法律中是否有一些方面已经适用于 AI agents,并且不应适用?
- **Agents 的可靠性:**autonomous AI agents 的哪些方面可以被适配到现有法律、治理系统和问责机制中?例如,我们能否确保 AI agents 具有唯一身份,并且即使在没有直接人类控制的情况下也能可靠输出这一身份?
- **AI 对 AI 的治理:**我们能多有效地使用 AI 来治理 AI 系统?在 AI oversight 的哪些领域,人类要么具有 comparative advantage,要么存在法律或规范要求必须 ‘in the loop’?
- **Agent 互动:**AI agents 相互互动时会形成哪些规范?不同 agents 可能如何表达不同偏好,而这些偏好又会如何影响其他 agents?
AI 驱动的 R&D
随着 AI 系统变得更强大,科学家正在用它们承担更多研究工作。这意味着越来越多的科学研究正在以自主或半自主方式进行,而来自人类的主动监督越来越少。在 AI research 本身,能力越来越强的系统可能被用来帮助开发它们自己的后续版本。我们有时称之为 “AI-driven AI R&D”。
AI-driven AI R&D 可能是构建更智能、更强系统所带来的“自然红利”。正如 coding capabilities 的进步带来了 dual-use cyber capabilities,scientific capabilities 的进步可能带来 dual-use bio capabilities,复杂技术工作的进步也可能自然产生能够开发 AI 系统的 AI 系统。
AI-driven AI R&D 内含显著危险的潜力。当政策制定者评估他们可以使用的杠杆时,理解 AI 进步速度如何变化,以及 AI research 是否可能开始出现复合回报,将至关重要。
AI for AI R&D
- **AI R&D 的治理:**如果 AI 系统正在被用于自主开发和改进自身,人类如何对这些系统获得有意义的可见性与控制力?最终将由什么来治理这些系统?
- **消防演练场景:**我们如何为 intelligence explosion 开展一次“消防演练”?什么样的 tabletop exercise 才能真正测试 lab 领导层、董事会和政府的决策能力?
- **AI R&D 的 telemetry:**我们如何衡量 AI research and development 的总体速度?为了收集这些信息,必须存在哪些类型的 telemetry 和底层技术 affordances?与 AI R&D 相关的指标可能如何作为 recursive self-improvement 的早期预警信号?
- **控制 AI acceleration:**如果 intelligence explosion 已迫在眉睫,哪些干预点有助于放缓或以其他方式改变爆发速度?假设人类能够干预,哪些实体应当掌握这种能力——政府?公司?
一般意义上的 AI for R&D,即其他领域中的 AI-driven research:
- **技术树:**AI 正在以远快于其他科学的速度加速某些科学领域,这取决于数据可得性、评估信号,以及知识中有多少是 tacit 或由机构把关的。这一梯度有多不均匀?科学进步组成结构的变化,对哪些人类问题会被率先解决意味着什么?
- **参差不齐的 frontier:**模型能力在不同领域强弱不一。具有巨大正外部性的领域——如 drug discovery 和 materials science——获得的投资低于其价值所应得到的水平。市场会根据私人回报引导模型改进方向,但我们能否改进模型表现,以应对社会外部性?
相关内容
人们如何向 Claude 寻求个人建议
使用 BioMysteryBench 评估 Claude 的 bioinformatics research capabilities
发布 Anthropic Economic Index Survey
我们正在推出 Anthropic Economic Index Survey,这是一项通过 Anthropic Interviewer 开展的月度调查。