jailbreak
▁▂█
·
31 次
·
收录于 13 篇
越狱 · 绕过模型安全限制的输入
-
AISI的安全案例
研究 · UK AISI · 05-17
-
安全案例如何助力前沿AI安全
研究 · UK AISI · 05-16
-
让安全评估可操作
研究 · UK AISI · 05-15
-
压力测试AI编码代理的异步监控
研究 · UK AISI · 05-15
-
2028:全球AI领导力的两种情景
研究 · Anthropic Research · 05-15
-
边界点越狱:突破最强AI防御的新方法
研究 · UK AISI · 05-15
-
我们的2025年度回顾
评测 · UK AISI · 05-14
-
AI在欺诈与网络犯罪中滥用的评估框架
研究 · UK AISI · 05-14
-
我们对OpenAI GPT-5.5网络能力的评估
评测 · UK AISI · 05-13
-
蒸馏恐慌
对话 · Interconnects · 05-12
-
教 Claude 理解为什么
研究 · Anthropic Research · 05-09
-
rohitg00/从零开始的 AI 工程
工程 · GitHub · 05-08
-
GPT-5.5 生物 Bug Bounty
OpenAI · 04-30