实録译稿 社区 24h

术语频次

封存归档

GPT-5.1

█▃ · 9 次 · 收录于 4 篇

GPT-5 的小幅迭代版本

  1. 五分钟看懂LLM过去六个月 评测 · Simon Willison · 05-19
  2. 我们对Claude Mythos Preview网络能力的评估 评测 · UK AISI · 05-13
  3. 红队测试Anthropic内部Agent监控系统 研究 · METR · 05-13
  4. Anthropic 风险报告(2026年2月)中“自动化研发风险”章节评述 评测 · METR · 05-13