録实録译稿议社区 24h

词术语频次

历封存归档

Claude Opus

█▄▆▅ · 47 次 · 收录于 26 篇

Claude 系列大型档

Project Glasswing：初步更新研究 · Anthropic Research · 05-23
专业化胜过规模化：多数AI采购决策忽视的战略变量研究 · HF Blog · 05-22
大规模推理基准测试：编码智能体评测 · Together AI · 05-20
五分钟看懂LLM过去六个月评测 · Simon Willison · 05-19
DavidAU 团队基于 Qwen3.5-27B 拼接训练出非官方 Qwen3.5-40B Dense 模型研究 · X · 05-15
esengine/DeepSeek-Reasonix 工程 · GitHub · 05-15
研究不对齐模型研究 · UK AISI · 05-14
我们对Claude Mythos Preview网络能力的评估评测 · UK AISI · 05-13
Anthropic 风险报告（2026年2月）中“自动化研发风险”章节评述评测 · METR · 05-13
Import AI 453：破解AI智能体；MirrorCode；以及关于渐进式失能的十种观点研究 · Import AI · 05-12
Import AI 455：AI系统即将开始自我构建研究 · Import AI · 05-12
Import AI 454：自动化对齐研究；中国模型安全评估；HiFloat4 研究 · Import AI · 05-12
教 Claude 理解为什么研究 · Anthropic Research · 05-09
wanshuiyin/睡眠中自动 Claude Code 研究工程 · GitHub · 05-08
自然语言 Autoencoders 研究 · Anthropic Research · 05-08
moonshotai/Kimi-K2.6 产品 · Kimi · 05-03
Coding Agent 的组成部分 Sebastian Raschka · 05-03
介绍 talkie：来自 1930 年的 13B 复古语言模型 Simon Willison · 05-03
近期 Claude Code 质量报告更新 Anthropic Engineering · 05-01
我们如何构建多-agent研究系统 Anthropic Engineering · 05-01
Claude Opus 4.6 在 BrowseComp 表现中的 eval awareness Anthropic Engineering · 05-01
长时间运行的应用开发的 harness 设计 Anthropic Engineering · 05-01
Claude Code auto 模式：更安全地跳过权限确认 Anthropic Engineering · 05-01
扩展 Managed Agents：将大脑与双手解耦 Anthropic Engineering · 05-01
Anthropic 经济指数报告：学习曲线 Anthropic Research · 04-30
自动化对齐研究者：使用 LLM 扩展可扩展监督 Anthropic Research · 04-30