Inspect Cyber：Agentic网络评估新标准

Inspect Cyber: A New Standard for Agentic Cyber Evaluations

二〇二六年五月十五日 · 英文原文

摘要

英国AI安全研究所（AISI）发布开源Python包Inspect Cyber，用于标准化和简化智能体（agent）网络评估的创建与运行流程。该工具基于Inspect评估平台，通过两个配置文件定义评估与基础设施，支持生成评估变体、验证可解性，并继承Inspect的自定义智能体、评分机制、沙盒环境等功能。团队已在夺旗挑战、Active Directory服务及关键基础设施模拟等场景中内部使用，旨在降低开发时间、促进协作并提升评估可靠性。

AI系统在网络领域正变得愈发强大。这意味着它们既能越来越多地被用于防御网络威胁，也可能被利用来制造威胁。随着能力的提升，对更严谨、更真实、更具可重复性的评估的需求也在不断增长。

然而，当前构建这些网络评估的流程效率低下，团队在设计新基准时常常需要重写大量的环境搭建代码。这种低效拖慢了研究进度，阻碍了协作，也增加了可靠性方面的复杂性。今天，我们发布 Inspect Cyber，旨在标准化并简化创建和运行智能体网络评估的流程——这类评估用于测试AI智能体在不同环境中自主完成网络安全目标的能力。

当前实践的不足之处

当前创建和运行智能体网络评估的流程过于复杂。每一个新的评估或基准都需要重复相同的环境搭建工作，包括创建沙盒基础设施、将智能体连接到模型、以及开发运行脚本。缺乏标准化导致了几个关键问题：

开发时间膨胀，因为创建者花费大量时间编写环境搭建代码，而非专注于评估的核心部分——智能体所处的环境
协作受阻，由于实现方式上的差异，团队之间难以共享、理解并基于彼此的工作进行开发
可靠性下降，因为实验结果难以复现和验证

Inspect Cyber：一个标准化的解决方案

我们开发了 Inspect Cyber 来解决这些低效问题。它构建在我们稳健的 Inspect 评估平台之上，为创建和运行智能体网络评估提供了一个直观、标准化的框架。这使得开发者能够更快地工作，专注于评估中最重要的方面，并更有效地进行协作。简而言之，这个开源 Python 包：

提供了一套清晰、一致的流程，仅需两个配置文件（一个用于评估，另一个用于所需的基础设施）即可创建智能体网络评估
使研究人员能够轻松生成评估的多个变体，例如使用不同的智能体提示或能力设定
推广AI评估的最佳实践，例如验证可解性
通过推荐的项目结构增强可读性

此外，由于 Inspect Cyber 构建在 Inspect 之上，它继承了 Inspect 的所有强大功能，包括支持使用自定义智能体、评分机制、沙盒环境以及人工监督或基线策略，轻松地在不同模型上运行评估。

加入我们的社区

几个月来，我们已在内部将 Inspect Cyber 用于一系列评估场景，从基础的夺旗挑战到模拟 Active Directory 服务、企业网络和关键国家基础设施的日益复杂的网络靶场。事实证明，它非常直接、稳健且强大。

然而，我们意识到 Inspect Cyber 可能尚未充分满足所有用户的工作流程。通过开源这个包，我们邀请社区提供反馈和贡献。我们的目标是继续降低创建智能体网络评估的门槛，使研究人员能够更顺畅地将他们的评估想法变为现实。

开始使用

我们建议从查阅包的文档开始。在那里，你还会找到演示如何使用 Inspect Cyber 构建夺旗和网络靶场评估的示例。

我们鼓励你通过 GitHub 仓库分享你的想法和贡献。如果 Inspect Cyber 不适合你的工作流程，或者你对新功能有想法，请提交 issue 或 pull request。

让我们共同努力，开发我们这个领域所需的网络评估，以跟上快速发展的AI系统的步伐。我们很期待看到你的成果！

译自 UK AI Security Institute · 录于二〇二六年五月十五日