实録译稿 社区 24h

术语频次

封存归档

Claude Opus

█▄▆▅ · 47 次 · 收录于 26 篇

Claude 系列大型档

  1. Project Glasswing:初步更新 研究 · Anthropic Research · 05-23
  2. 专业化胜过规模化:多数AI采购决策忽视的战略变量 研究 · HF Blog · 05-22
  3. 大规模推理基准测试:编码智能体 评测 · Together AI · 05-20
  4. 五分钟看懂LLM过去六个月 评测 · Simon Willison · 05-19
  5. DavidAU 团队基于 Qwen3.5-27B 拼接训练出非官方 Qwen3.5-40B Dense 模型 研究 · X · 05-15
  6. esengine/DeepSeek-Reasonix 工程 · GitHub · 05-15
  7. 研究不对齐模型 研究 · UK AISI · 05-14
  8. 我们对Claude Mythos Preview网络能力的评估 评测 · UK AISI · 05-13
  9. Anthropic 风险报告(2026年2月)中“自动化研发风险”章节评述 评测 · METR · 05-13
  10. Import AI 453:破解AI智能体;MirrorCode;以及关于渐进式失能的十种观点 研究 · Import AI · 05-12
  11. Import AI 455:AI系统即将开始自我构建 研究 · Import AI · 05-12
  12. Import AI 454:自动化对齐研究;中国模型安全评估;HiFloat4 研究 · Import AI · 05-12
  13. 教 Claude 理解为什么 研究 · Anthropic Research · 05-09
  14. wanshuiyin/睡眠中自动 Claude Code 研究 工程 · GitHub · 05-08
  15. 自然语言 Autoencoders 研究 · Anthropic Research · 05-08
  16. moonshotai/Kimi-K2.6 产品 · Kimi · 05-03
  17. Coding Agent 的组成部分 Sebastian Raschka · 05-03
  18. 介绍 talkie:来自 1930 年的 13B 复古语言模型 Simon Willison · 05-03
  19. 近期 Claude Code 质量报告更新 Anthropic Engineering · 05-01
  20. 我们如何构建多-agent研究系统 Anthropic Engineering · 05-01
  21. Claude Opus 4.6 在 BrowseComp 表现中的 eval awareness Anthropic Engineering · 05-01
  22. 长时间运行的应用开发的 harness 设计 Anthropic Engineering · 05-01
  23. Claude Code auto 模式:更安全地跳过权限确认 Anthropic Engineering · 05-01
  24. 扩展 Managed Agents:将大脑与双手解耦 Anthropic Engineering · 05-01
  25. Anthropic 经济指数报告:学习曲线 Anthropic Research · 04-30
  26. 自动化对齐研究者:使用 LLM 扩展可扩展监督 Anthropic Research · 04-30