社会科学中的编码智能体
Coding agents in the social sciences
一项针对1,260名定量社会科学家的调查显示,81%的受访者曾使用AI聊天机器人辅助研究,主要用于编写代码和编辑文稿,但仅20%定期使用Claude Code等编码agent。编码agent采用存在显著差异:拥有典型男性名字的研究人员使用比例是女性名字的两倍,顶尖大学研究人员使用可能性高出40%。用户发布了更多工作论文和资助申请,但期刊投稿量未增加。研究人员对AI提升论文生产力的乐观程度高于对社会科学领域整体影响的乐观程度。该调查由Thomas Lyttelton、Maxim Massenkoff和Nathan Wilmers于2026年2月至3月进行。
摘要
- 我们展示了一项针对 1,260 名社会科学家的调查结果,内容涉及 AI 和编码 agent 的使用情况,该调查于 2026 年 2 月和 3 月进行。
- 绝大多数受访者(81%)曾尝试在研究中使用 AI 聊天机器人,主要用于编写代码和编辑文稿。但只有 20% 的人已将编码 agent——例如 Claude Code 这类能自主编写并执行分析代码的工具——纳入其工作流程。
- 编码 agent 的使用存在显著差异。拥有典型男性名字的研究人员使用编码 agent 的比例是拥有女性名字的两倍。顶尖大学的研究人员使用编码 agent 的可能性比其他研究人员高出 40%。
- 编码 agent 的用户比同一学科和职业阶段的其他研究人员发布了更多工作论文和资助申请,但这可能反映了早期采用者之间已有的差异。
- 研究人员对 AI 帮助撰写可发表论文的乐观程度,高于对 AI 对整个社会科学领域影响的乐观程度。
AI 编码 agent 如何改变我们研究经济与社会的方式?
人文科学正在发生转变:核心研究任务首次可以交由机器完成。AI 聊天机器人越来越多地应用于科学研究,包括在最负盛名的出版物和社会科学领域。这激发了人们对 AI 可能提升研究生产力的乐观情绪,同时也引发了关于同行评审负担过重和学术垃圾泛滥的担忧。
然而,虽然轮流对话的 AI 聊天机器人主要用于写作辅助,但编码 agent 可能更彻底地重构社会科学研究。像 Claude Code 和 Codex 这样的 agentic 编码平台可以接收一个研究想法和一个数据集,编写并运行分析,解释输出结果,并自主迭代。经验研究中那些曾经不可简化的人类步骤,首次得以自动化。在极端情况下,研究人员已经构建了多 agent 流水线来自动化计算机科学研究,并自主执行社会科学研究想法。
这些工具可以加速科学进步并使其更具冒险精神:快速的研究执行意味着廉价且丰富的发现。它们也可能放大研究资源方面的差距,并加剧学术记录的拥堵。更深远地看,随着 AI 处理越来越多的研究任务,其独特的分析选择可能会烙印在我们对经济、社会和自身的集体理解上。
在这篇文章中,我们基于 2026 年初对 1,260 名定量社会科学家进行的一项调查,提供了初步观察。该调查是一项更大规模、持续进行的研究的基线轮次,该研究旨在考察编码 agent 如何影响研究生产力,其中包括一项为研究人员提供 Claude Code 访问权限的随机实验。我们将在未来公布这项实验的结果。目前,我们报告基线调查揭示的内容:谁在使用这些工具以及用于什么目的;用户与非用户之间的产出差异;以及研究人员对日益普及所带来的影响有何预期。
一项关于定量社会科学家使用 AI 编码 agent 的新调查
我们在 2026 年 2 月底和 3 月进行了这项调查,目标人群是活跃的定量社会科学家。这不是一个代表性样本——受访者是被招募参加一项提供 Claude Max 账户访问权限的研究,因此样本选择可能偏向于对 AI 工具好奇的研究人员。然而,受访者与之前收到更通用邀请的样本相当相似(见附录中的表 A2)。
受访者在经济学、政治学和社会学之间分布均匀,每个学科约占样本的五分之一,管理科学和心理学紧随其后(见表 A1)。我们还收到了来自公共卫生、教育和传播学研究人员数量较少的回复。大约 40% 是正教授或副教授,25% 是助理教授,约 30% 是博士生。
编码 agent 尚未触及大多数社会科学家
我们通过两种方式衡量了 AI 的整体使用情况。首先,我们问:“您之前是否使用过 genAI 模型来辅助您的研究过程?” 81% 的受访者回答是。
但那些真正将能力日益增强的编码 agent 纳入工作流程的人呢?在此,我们问:“您是否定期(每周超过一次)使用集成到命令行中的 AI 编码助手(例如 Codex、Cursor 或 Claude Code)?” 在后续问题中,我们确认他们使用了这些工具之一(或 Google Antigravity)。¹
只有 20% 的受访者使用编码 agent。我们的调查大约是在 2025 年 12 月底引发关于 Claude Code 和 Opus 4.6 的热议之后两个月进行的。然而,即使在那些自我选择参加我们调查的感兴趣的受访者中,也只有 1/5 的人将 agent 纳入了工作流程。Claude Code 是报告中最常见的编码 agent 工具,86% 的用户报告使用了 Claude Code(31% 报告使用了 Codex,这是第二常见的工具)。

图 1:经济学家和政治学家报告了最多的编码 agent 使用。编码 agent 使用定义为对“您是否定期(每周超过一次)使用集成到命令行中的 AI 编码助手(例如 Codex、Cursor 或 Claude Code)?”回答“是”,并通过后续问题确认使用了这些工具之一或 Google Antigravity。学科分类在附录中描述。
采用率极不均衡
图 1 显示总体采用率存在巨大差异,从经济学家的 39% 和政治学家的 25% 到公共卫生(6%)、教育(4%)和传播学(6%)的个位数。这种梯度大致反映了各领域在 AI 整体使用上的差异,但编码 agent 采用的差异平均而言更为陡峭。
略超过四分之一的博士生和博士后每周至少使用一次编码 agent;在终身教授中,这一比例下降了一半以上。采用编码 agent 的研究人员是初级人员——他们技术更熟练,更可能直接处理代码和数据,并且面临更大的职业压力来产出研究成果。

图 2:早期职业研究人员的采用率最高。蓝色系列显示了按职业阶段划分的、报告使用 AI 辅助研究的百分比。下方的橙色系列显示了报告定期使用编码 agent 进行研究的百分比。
采用差异不仅限于学科和职业阶段。我们根据性别对研究人员姓名进行分类,发现拥有典型男性名字的受访者采用编码 agent 的比例是拥有典型女性名字的受访者的两倍以上。高地位大学和私立大学的使用率也显著更高。所有这些差异在 p<0.05 水平上显著。这些差异比 AI 整体使用率的差异更为明显,并表明至少在编码 agent 采用的早期阶段,不平等程度更高。
编码 agent 使用中的性别差距不仅仅反映了尝试 AI 的比率差距。在曾尝试将 AI 用于研究的受访者中,定期使用编码 agent 的性别差距甚至比总体样本中略大。在比较同一学科和职业阶段的不同性别时,这些差异也持续存在。

图 3:编码 agent 的采用显示出显著差异。按职业阶段、性别和大学属性划分的研究人员使用 AI(左图)和编码 agent(右图)的百分比差异。男性和女性类别通过姓名分类衡量。前 25 名大学根据 Nature Index Leading Institutions 定义。各组之间的采用差异在 p < 0.05 时具有统计显著性。
研究人员主要使用 AI 来编码和编辑,而非写作
在使用 AI(无论是通过编码 agent 还是聊天机器人)的研究人员中,他们实际用它来做什么?关于 AI 在学术研究中应用的争论主要集中在写作上:幻觉式的文献综述、公式化引言中充斥的“不是 X,而是 Y”,以及完全自动化论文写作的可能性。
但图 4 显示,对于编码 agent 用户和其他用户来说,最常见的用途都是编写定量数据分析代码:97% 的编码 agent 用户和 77% 的其他 AI 用户报告使用它来生成代码。其次是编辑文稿,然后是寻求方法建议和先前研究的背景信息。汇总编码 agent 用户和其他用户的数据,所有 AI 用户中只有三分之一曾使用它来起草文稿。这些模式在各学科中普遍成立,只有经济学家和管理学研究人员普遍使用 AI 来起草文稿。

图 4:最常见的用例是代码和编辑。左图显示了表示每个特定用例的用户比例,按他们是否在研究中使用编码 agent 或仅使用 genAI 进行划分。受访者可以指示多个类别(问题仅限于研究用例)。右图显示了按学科划分的相同回答。
编码 agent 用户发布了更多工作论文并提交了更多资助申请,但向期刊提交的论文并未增加
编码 agent 是否让研究人员更高效?这是启动这项调查的更广泛研究所要回答的问题。我们正在进行的关于这个问题的实验仍在进行中。但基线调查让我们能够在研究过程的许多检查点上比较编码 agent 用户和其他人。这种比较纯粹是描述性的:我们将选择使用编码 agent 的研究人员与未选择使用的研究人员进行比较,并预期这两组人在许多我们无法调整的方面存在差异。差异不应被解释为因果关系,而应被视为编码 agent 用户与非用户之间的初步比较。

图 5:定期 AI 编码 agent 用户与其他研究人员在研究产出方面的生产力差异。结果由受访者自我报告。发布的工作论文、期刊投稿和期刊重新投稿是互斥的类别。模型在附录中描述。须状线显示使用按结果均值缩放的稳健标准误计算的 95% 置信区间。* p < 0.05, ** p < 0.01。
图 5 显示了调查前六个月内,在研究过程不同阶段(从启动项目到提交论文)的自我报告产出。调整后的估计值比较了编码 agent 用户和其他人,控制了职业阶段、学科和完成调查的周数。编码 agent 用户启动了更多项目,发布了更多工作论文,提交了更多资助申请,并且可能提交了更多会议投稿。
那么,编码 agent 用户是否撰写了更多论文?首先,考虑编码 agent 用户和其他人在早期流程产出上的差异。编码 agent 用户启动项目的速度比非 agent 用户多约四分之一篇论文,发布的工作论文多约半篇。按百分比计算,编码 agent 用户在其学科和职业阶段看起来比其他人生产力高出约 10%(启动的实证项目)到 75%(发布的工作论文)。
然而,这种生产力差异仅出现在这些早期流程指标上。我们没有发现证据表明编码 agent 用户向期刊提交了更多新论文或更快地重新提交论文。这可能反映了论文提交的时间线,因为编码 agent 的使用是最近才出现的现象。但也可能表明编码 agent 在启动和运行项目方面比在完善论文以提交给期刊的“最后一英里”更有用。
研究人员期望 AI 工具提高生产力,但对它们能否整体改善社会科学信心不足
我们还询问了研究人员对 AI 工具的期望。AI 是否使社会科学家在撰写可发表论文方面更高效?他们认为 AI 会使社会科学变得更好还是更差?
研究人员对 AI 提高论文写作生产力持乐观态度。在 1 到 10 的评分中,88% 的受访者评分高于 5,一半人评分在 8 或以上。图 6 显示这些评分与 AI 使用情况密切相关。图的左侧显示,将 AI 用于更多类型任务的研究人员更为乐观。右侧显示,编码 agent 用户比其他用户更乐观。

图 6:研究人员对 AI 如何影响狭义生产力的信念,与对 AI 如何影响整个研究领域的信念的比较。信念通过 10 点滑块量表测量。生产力问题是:“就撰写可发表论文而言,您认为 AI 使社会科学家效率更低还是更高?”滑块标记为“效率更低到效率更高”。领域影响问题是:“您认为 AI 会使社会科学变得更糟还是更好?”滑块标记为“更糟到更好”。采用的 AI 用例数量汇总了图 4 中列出的类别。
这项调查的对象是对尝试这些工具感兴趣的人,因此看到一些对生产力的乐观情绪并不奇怪。但即使在这些乐观主义者中,关于 AI 狭义地帮助撰写可发表论文与广义地影响社会科学的看法之间也存在真正的差距。70% 的受访者对论文生产力的乐观程度高于对更广泛领域影响的乐观程度。很少有研究人员对领域影响的乐观程度高于对论文生产力的乐观程度,而许多人对领域影响更为悲观。
讨论
使用编码 agent 的社会科学家发布了更多工作论文并申请了更多资助。与他们学科和职业阶段的其他研究人员相比,他们也启动了更多项目。但截至 2026 年 3 月,他们尚未推动期刊投稿量的激增。项目启动数量的增加可能是生产力提高的早期证据。这也可能表明早期采用者已经是生产力更高的研究人员。
总体而言,编码 agent 的早期采用倾向于早期职业研究人员、男性和高地位大学的研究人员。目前,编码 agent 使用在这些类别中的分布比更广泛的 LLM 使用更不均衡。我们还发现暗示性证据,表明研究人员担心论文生产力提高的直接收益可能伴随着领域层面的成本。也许更多的论文意味着拥堵和对注意力的竞争;也许受访者担心一些研究人员会以加剧社会科学现有问题的方式使用 AI 工具,例如选择性报告和规避风险、渐进式的研究。
本报告中的发现存在若干注意事项。这里呈现的数据基于对定量社会科学家的电子邮件调查,这些调查是明确招募来参与一项关于工作流程和 AI 使用的研究的。我们预计受访者比未回复者更重度使用 LLM,并且对 LLM 更乐观。我们看到的早期阶段生产力差异应被描述性地解释。编码 agent 的早期采用者可能生产力更高,并且在许多我们无法在调查中直接衡量的方面与非采用者不同。最后,我们这里只考察了研究人员报告的项目数量,并未报告任何关于其质量的信息。在这项研究的未来更新中,我们将展示将编码 agent 用户与一个干净的对照组进行比较的结果,并评估由编码 agent 增强的工作的内容(而不仅仅是数量)是否看起来不同。
尽管存在这些局限性,我们表明编码 agent 正在渗透到社会科学中。例如,我们研究经济和政治的方式,越来越多地通过部分由 AI 编码 agent 做出的分析决策来进行。我们计划在未来的报告中带来更多关于这种自动化潜力和风险的证据。
Thomas Lyttelton, Maxim Massenkoff, Nathan Wilmers
致谢
Tim Belonax, Keir Bradwell, Jake Eaton, Rebecca Hiscott, Peter McCrory, Kerry Persen, Sarah Pollack, Santi Ruiz, Heather Whitney, Jack Clark.
附录
可在此处获取:链接。
引用
@online{lyttelton2026agents,
author = {Thomas Lyttelton and Maxim Massenkoff and Nathan Wilmers},
title = {Coding Agents in the Social Sciences},
date = {2026-05-27},
year = {2026},
url = {https://www.anthropic.com/research/coding-agents-social-sciences},
}
参考文献
Alvero, A. J., Stoltz, D. S., Stuhler, O., & Taylor, M. A. (2026). Generative AI in Sociological Research: State of the Discipline. Sociological Science, 13, 45-62.
Korinek, A. (2025). AI agents for economic research (No. w34202). National Bureau of Economic Research. NBER Working Paper Series.
Liang, W., Zhang, Y., Wu, Z., Lepp, H., Ji, W., Zhao, X., ... & Zou, J. (2025). Quantifying large language model usage in scientific papers. Nature Human Behaviour, 1-11.
Lu, C., Lu, C., Lange, R. T., Yamada, Y., Hu, S., Foerster, J., ... & Clune, J. (2026). Towards end-to-end automation of AI research. Nature, 651(8107), 914-919.
Wilmers, N., & Engzell, P. (2026). The Paper Factory. SocArXiv Preprints.
相关内容
Project Glasswing:初步更新
关于我们从 Project Glasswing 中学到的东西的早期更新。
2028:全球 AI 领导力的两种情景
我们对中美 AI 竞争的看法。
教 Claude 理解“为什么”
关于我们如何减少 agent 失调的新研究。