録实録译稿议社区 24h

词术语频次

历封存归档

Claude Sonnet

█▄▇▂ · 37 次 · 收录于 23 篇

Claude 系列中型档

五分钟看懂LLM过去六个月评测 · Simon Willison · 05-19
自主AI网络能力进步有多快？评测 · UK AISI · 05-15
问而不告：减少大语言模型中的谄媚行为研究 · UK AISI · 05-13
Opus 4.7：你需要知道的一切产品 · Artificial Analysis · 05-12
Kimi K2.6：新的领先开源权重模型产品 · Artificial Analysis · 05-12
DeepSeek 携 V4 Pro 与 V4 Flash 重返领先开源权重模型行列产品 · Artificial Analysis · 05-12
xAI 推出 Grok 4.3，提升智能体性能并降低定价产品 · Artificial Analysis · 05-12
Import AI 454：自动化对齐研究；中国模型安全评估；HiFloat4 研究 · Import AI · 05-12
SocialReasoning-Bench：衡量AI智能体是否以用户最佳利益行事研究 · MS Research · 05-12
用 Amazon Nova 多模态嵌入实现制造智能工程 · AWS ML · 05-12
提升 GitHub Agentic Workflows 中的 token 效率工程 · GitHub AI/ML · 05-09
教 Claude 理解为什么研究 · Anthropic Research · 05-09
捐赠我们的开源对齐工具工程 · Anthropic Research · 05-08
LLM 0.32a0 是一次重大的向后兼容重构 Simon Willison · 05-03
介绍 talkie：来自 1930 年的 13B 复古语言模型 Simon Willison · 05-03
我们如何构建多-agent研究系统 Anthropic Engineering · 05-01
用 AI agents 编写高效工具 Anthropic Engineering · 05-01
Claude Opus 4.6 在 BrowseComp 表现中的 eval awareness Anthropic Engineering · 05-01
长时间运行的应用开发的 harness 设计 Anthropic Engineering · 05-01
扩展 Managed Agents：将大脑与双手解耦 Anthropic Engineering · 05-01
人们如何向 Claude 寻求个人指导 Anthropic Research · 05-01
大语言模型中的情感概念及其功能 Anthropic Research · 04-30
自动化对齐研究者：使用 LLM 扩展可扩展监督 Anthropic Research · 04-30