实録译稿 社区 24h

术语频次

封存归档

prompt injection

█▃▂▂ · 19 次 · 收录于 13 篇

提示注入 · 通过输入操纵模型行为的攻击

  1. Google I/O、Gemini Spark、反重力 产品 · Simon Willison · 05-21
  2. 压力测试AI编码代理的异步监控 研究 · UK AISI · 05-15
  3. Agent pull request 无处不在,如何 review 它们 工程 · GitHub AI/ML · 05-09
  4. Arthur-Ficial/apfel 工程 · GitHub · 05-08
  5. rohitg00/从零开始的 AI 工程 工程 · GitHub · 05-08
  6. Claude Opus 4.7 介绍 Anthropic · 05-03
  7. Cursor 安全评审 Cursor · 05-03
  8. FlashRT:面向 Prompt Injection 和 Knowledge Corruption 的计算与内存高效 Red-Teaming HF Papers · 05-02
  9. 用 sandboxing 让 Claude Code 更安全、更自主 Anthropic Engineering · 05-01
  10. Claude Code auto 模式:更安全地跳过权限确认 Anthropic Engineering · 05-01
  11. 扩展 Managed Agents:将大脑与双手解耦 Anthropic Engineering · 05-01
  12. 在 ChatGPT 中引入工作区 agents OpenAI · 04-30
  13. 实践中的可信 agent Anthropic Research · 04-30