ControlArena
█
·
27 次
·
收录于 6 篇
AI控制实验开源评估库
-
RepliBench:衡量AI系统中的自主复制能力
研究 · UK AISI · 05-16
-
如何评估AI agent的控制措施?
研究 · UK AISI · 05-16
-
压力测试AI编码代理的异步监控
研究 · UK AISI · 05-15
-
Introducing ControlArena:用于运行AI控制实验的库
工程 · UK AISI · 05-15
-
我们的2025年度回顾
评测 · UK AISI · 05-14
-
AI agent 能逃出沙箱吗?容器逃逸能力安全基准测试
研究 · UK AISI · 05-14