实録译稿 社区 24h

术语频次

封存归档

ControlArena

· 27 次 · 收录于 6 篇

AI控制实验开源评估库

  1. RepliBench:衡量AI系统中的自主复制能力 研究 · UK AISI · 05-16
  2. 如何评估AI agent的控制措施? 研究 · UK AISI · 05-16
  3. 压力测试AI编码代理的异步监控 研究 · UK AISI · 05-15
  4. Introducing ControlArena:用于运行AI控制实验的库 工程 · UK AISI · 05-15
  5. 我们的2025年度回顾 评测 · UK AISI · 05-14
  6. AI agent 能逃出沙箱吗?容器逃逸能力安全基准测试 研究 · UK AISI · 05-14