代码即代理工具

Code as Agent Harness

Xuying Ning, Katherine Tieu, Dongqi Fu, Tianxin Wei, Zihao Li, Yuanchen Bei, Jiaru Zou, Mengting Ai 等 42 位

二〇二六年五月十九日 · arXiv:2605.18747 · PDF · Code

摘要

近期大型语言模型（LLM）在代码理解与生成方面展现出强大能力，涵盖从竞赛编程到仓库级软件工程等场景。在新兴的智能体（agent）系统中，代码不再仅是目标输出，而是日益成为智能体推理、行动、环境建模及基于执行的验证的操作基础。我们通过智能体框架（agent harness）的视角审视这一转变，提出"代码即智能体框架"（code as agent harness）的统一观点，将代码定位为智能体基础设施的核心。为系统研究这一视角，本文围绕三个关联层次组织综述。首先，研究框架接口（harness interface）——代码在此连接智能体的推理、行动与环境建模。其次，考察框架机制（harness mechanisms）：面向长程执行的规划、记忆与工具使用，以及使框架可靠且自适应的反馈驱动控制与优化。第三，讨论框架从单智能体系统向多智能体场景的扩展——共享代码构件在此支撑多智能体协调、审查与验证。跨层次梳理中，我们总结了"代码即智能体框架"的代表性方法与实际应用，涵盖编码助手、GUI/OS自动化、具身智能体、科学发现、个性化推荐、DevOps及企业工作流。进一步，我们概述了框架工程面临的开放挑战，包括超越最终任务成功的评估、不完整反馈下的验证、无回归的框架改进、多智能体间一致的共享状态、安全关键行动的人类监督，以及向多模态环境的扩展。通过将代码定位为智能体AI的框架，本综述为构建可执行、可验证、有状态的AI智能体系统提供了统一路线图。

译自 Hugging Face · Daily Papers · arXiv:2605.18747 · 录于二〇二六年五月十九日