实録译稿 社区 24h

术语频次

封存归档

Claude Sonnet

█▄▇▂ · 37 次 · 收录于 23 篇

Claude 系列中型档

  1. 五分钟看懂LLM过去六个月 评测 · Simon Willison · 05-19
  2. 自主AI网络能力进步有多快? 评测 · UK AISI · 05-15
  3. 问而不告:减少大语言模型中的谄媚行为 研究 · UK AISI · 05-13
  4. Opus 4.7:你需要知道的一切 产品 · Artificial Analysis · 05-12
  5. Kimi K2.6:新的领先开源权重模型 产品 · Artificial Analysis · 05-12
  6. DeepSeek 携 V4 Pro 与 V4 Flash 重返领先开源权重模型行列 产品 · Artificial Analysis · 05-12
  7. xAI 推出 Grok 4.3,提升智能体性能并降低定价 产品 · Artificial Analysis · 05-12
  8. Import AI 454:自动化对齐研究;中国模型安全评估;HiFloat4 研究 · Import AI · 05-12
  9. SocialReasoning-Bench:衡量AI智能体是否以用户最佳利益行事 研究 · MS Research · 05-12
  10. 用 Amazon Nova 多模态嵌入实现制造智能 工程 · AWS ML · 05-12
  11. 提升 GitHub Agentic Workflows 中的 token 效率 工程 · GitHub AI/ML · 05-09
  12. 教 Claude 理解为什么 研究 · Anthropic Research · 05-09
  13. 捐赠我们的开源对齐工具 工程 · Anthropic Research · 05-08
  14. LLM 0.32a0 是一次重大的向后兼容重构 Simon Willison · 05-03
  15. 介绍 talkie:来自 1930 年的 13B 复古语言模型 Simon Willison · 05-03
  16. 我们如何构建多-agent研究系统 Anthropic Engineering · 05-01
  17. 用 AI agents 编写高效工具 Anthropic Engineering · 05-01
  18. Claude Opus 4.6 在 BrowseComp 表现中的 eval awareness Anthropic Engineering · 05-01
  19. 长时间运行的应用开发的 harness 设计 Anthropic Engineering · 05-01
  20. 扩展 Managed Agents:将大脑与双手解耦 Anthropic Engineering · 05-01
  21. 人们如何向 Claude 寻求个人指导 Anthropic Research · 05-01
  22. 大语言模型中的情感概念及其功能 Anthropic Research · 04-30
  23. 自动化对齐研究者:使用 LLM 扩展可扩展监督 Anthropic Research · 04-30