録实録译稿议社区 24h

词术语频次

历封存归档

prompt injection

█▃▂▂ · 19 次 · 收录于 13 篇

提示注入 · 通过输入操纵模型行为的攻击

Google I/O、Gemini Spark、反重力产品 · Simon Willison · 05-21
压力测试AI编码代理的异步监控研究 · UK AISI · 05-15
Agent pull request 无处不在，如何 review 它们工程 · GitHub AI/ML · 05-09
Arthur-Ficial/apfel 工程 · GitHub · 05-08
rohitg00/从零开始的 AI 工程工程 · GitHub · 05-08
Claude Opus 4.7 介绍 Anthropic · 05-03
Cursor 安全评审 Cursor · 05-03
FlashRT：面向 Prompt Injection 和 Knowledge Corruption 的计算与内存高效 Red-Teaming HF Papers · 05-02
用 sandboxing 让 Claude Code 更安全、更自主 Anthropic Engineering · 05-01
Claude Code auto 模式：更安全地跳过权限确认 Anthropic Engineering · 05-01
扩展 Managed Agents：将大脑与双手解耦 Anthropic Engineering · 05-01
在 ChatGPT 中引入工作区 agents OpenAI · 04-30
实践中的可信 agent Anthropic Research · 04-30

更新于五月二十五日 09:40