代码即代理工具
Code as Agent Harness
摘要
近期大型语言模型(LLM)在代码理解与生成方面展现出强大能力,涵盖从竞赛编程到仓库级软件工程等场景。在新兴的智能体(agent)系统中,代码不再仅是目标输出,而是日益成为智能体推理、行动、环境建模及基于执行的验证的操作基础。我们通过智能体框架(agent harness)的视角审视这一转变,提出"代码即智能体框架"(code as agent harness)的统一观点,将代码定位为智能体基础设施的核心。为系统研究这一视角,本文围绕三个关联层次组织综述。首先,研究框架接口(harness interface)——代码在此连接智能体的推理、行动与环境建模。其次,考察框架机制(harness mechanisms):面向长程执行的规划、记忆与工具使用,以及使框架可靠且自适应的反馈驱动控制与优化。第三,讨论框架从单智能体系统向多智能体场景的扩展——共享代码构件在此支撑多智能体协调、审查与验证。跨层次梳理中,我们总结了"代码即智能体框架"的代表性方法与实际应用,涵盖编码助手、GUI/OS自动化、具身智能体、科学发现、个性化推荐、DevOps及企业工作流。进一步,我们概述了框架工程面临的开放挑战,包括超越最终任务成功的评估、不完整反馈下的验证、无回归的框架改进、多智能体间一致的共享状态、安全关键行动的人类监督,以及向多模态环境的扩展。通过将代码定位为智能体AI的框架,本综述为构建可执行、可验证、有状态的AI智能体系统提供了统一路线图。
译自 Hugging Face · Daily Papers · arXiv:2605.18747 · 录于 二〇二六年五月十九日