实録译稿 社区 24h

术语频次

封存归档

jailbreak

▁▂█ · 31 次 · 收录于 13 篇

越狱 · 绕过模型安全限制的输入

  1. AISI的安全案例 研究 · UK AISI · 05-17
  2. 安全案例如何助力前沿AI安全 研究 · UK AISI · 05-16
  3. 让安全评估可操作 研究 · UK AISI · 05-15
  4. 压力测试AI编码代理的异步监控 研究 · UK AISI · 05-15
  5. 2028:全球AI领导力的两种情景 研究 · Anthropic Research · 05-15
  6. 边界点越狱:突破最强AI防御的新方法 研究 · UK AISI · 05-15
  7. 我们的2025年度回顾 评测 · UK AISI · 05-14
  8. AI在欺诈与网络犯罪中滥用的评估框架 研究 · UK AISI · 05-14
  9. 我们对OpenAI GPT-5.5网络能力的评估 评测 · UK AISI · 05-13
  10. 蒸馏恐慌 对话 · Interconnects · 05-12
  11. 教 Claude 理解为什么 研究 · Anthropic Research · 05-09
  12. rohitg00/从零开始的 AI 工程 工程 · GitHub · 05-08
  13. GPT-5.5 生物 Bug Bounty OpenAI · 04-30