録实録译稿议社区 24h

词术语频次

历封存归档

Claude

█▃▂▂ · 1390 次 · 收录于 129 篇

Anthropic 大语言模型系列总称

疯狂屋 — Usborne 恐怖电脑游戏工程 · Simon Willison · 05-25
walkinglabs/learn-harness-engineering 工程 · GitHub · 05-23
Project Glasswing：初步更新研究 · Anthropic Research · 05-23
Qwen 3.7-Max 在 agent 任务中以更低成本击败 Opus 4.7 和 GPT-5.5 评测 · X Trending · 05-23
专业化胜过规模化：多数AI采购决策忽视的战略变量研究 · HF Blog · 05-22
如何通过评估与可观测性赢得利益相关者信任产品 · Braintrust · 05-22
Karpathy 的 CLAUDE.md 以 65 行规则将 AI 编码准确率从 65% 提升至 94% 工程 · X Trending · 05-22
Datasette Agent 工程 · Simon Willison · 05-22
Modal C轮融资：以46.5亿美元估值募资3.55亿美元产品 · Modal · 05-22
在Claude设置中粘贴提示词，强制其诚实表达不确定性并禁止编造来源工程 · X Trending · 05-22
Anthropic 发布 claude-code-setup 插件，将 Claude Code 升级为完整 AI 开发环境产品 · X Trending · 05-21
推出带 Modal 沙箱的 Claude 托管 Agent 产品 · Modal · 05-20
推出 Ettin Reranker 系列产品 · HF Blog · 05-19
AgriciDaniel/claude-obsidian 工程 · GitHub · 05-19
Anthropic 发布 claude-code-setup 插件，将 Claude Code 升级为完整 AI 开发环境产品 · X Trending · 05-18
Imbad0202/学术研究技能工程 · GitHub · 05-18
neilsonnn/image-blaster 工程 · GitHub · 05-17
AI系统应该像人一样行事吗？研究 · UK AISI · 05-17
长文本任务研究 · UK AISI · 05-16
OpenAI o1 模型部署前评估评测 · UK AISI · 05-16
Anthropic 升级版 Claude 3.5 Sonnet 的部署前评估评测 · UK AISI · 05-16
Claude 百万上下文窗口可设自动压缩阈值避免污染工程 · X · 05-16
Claude Code 百万 token 上下文窗口的双刃剑效应与会话管理策略工程 · X · 05-16
datasette-llm-limits 0.1a0 工程 · Simon Willison · 05-16
iNaturalist-clumper 0.1 工程 · Simon Willison · 05-16
安全评估原则研究 · UK AISI · 05-16
DavidAU 团队基于 Qwen3.5-27B 拼接训练出非官方 Qwen3.5-40B Dense 模型研究 · X · 05-15
让安全评估可操作研究 · UK AISI · 05-15
esengine/DeepSeek-Reasonix 工程 · GitHub · 05-15
op7418/guizang-ppt-skill 工程 · GitHub · 05-15
Intern-S2-Preview 研究 · InternLM · 05-15
Intern-S2-Preview-FP8 研究 · InternLM · 05-15
自主AI网络能力进步有多快？评测 · UK AISI · 05-15
当前AI系统的局限性映射研究 · UK AISI · 05-15
压力测试AI编码代理的异步监控研究 · UK AISI · 05-15
Stream Vision Agents 与 Amazon Nova 2 Sonic 实时语音代理工程 · AWS ML · 05-15
欢迎来到 Datasette 博客工程 · Simon Willison · 05-14
AI网络任务中推理扩展的证据：增加评估预算揭示更高成功率研究 · UK AISI · 05-14
引用 Boris Mann 工程 · Simon Willison · 05-14
我们对Claude Mythos Preview网络能力的评估评测 · UK AISI · 05-13
我们对OpenAI GPT-5.5网络能力的评估评测 · UK AISI · 05-13
评估AI模型是否会破坏AI安全研究评测 · UK AISI · 05-13
红队测试Anthropic内部Agent监控系统研究 · METR · 05-13
分享通过 OpenRouter 和 Ollama 从开放权重模型生成蒸馏数据的实用工具工程 · X · 05-13
如何与AI协作并实现复利工程 · Eugene Yan · 05-12
Opus 4.7：你需要知道的一切产品 · Artificial Analysis · 05-12
近期开源权重模型发布产品 · Artificial Analysis · 05-12
中国AI实验室内部笔记对话 · Interconnects · 05-12
解读今日开放-封闭性能差距研究 · Interconnects · 05-12
蒸馏恐慌对话 · Interconnects · 05-12
我对开源模型的押注，2026年中研究 · Interconnects · 05-12
Import AI 455：AI系统即将开始自我构建研究 · Import AI · 05-12
Import AI 454：自动化对齐研究；中国模型安全评估；HiFloat4 研究 · Import AI · 05-12
SocialReasoning-Bench：衡量AI智能体是否以用户最佳利益行事研究 · MS Research · 05-12
用 Amazon Nova 多模态嵌入实现制造智能工程 · AWS ML · 05-12
Claude Code 可接入 17000+ 股票与 crypto 实时数据工程 · X Trending · 05-10
open-multi-agent/open-multi-agent 工程 · GitHub · 05-10
Claude Code 团队成员分享用 HTML 替代 Markdown 的场景工程 · X · 05-09
Claude Code 源码快照泄露，展示 repo context 与 subagent 设计工程 · X · 05-09
Harness 是一切：如何优化你的 Harness 工程 · Baseten · 05-09
提升 GitHub Agentic Workflows 中的 token 效率工程 · GitHub AI/ML · 05-09
Narcooo/inkos 工程 · GitHub · 05-09
使用 Claude Code：HTML 不合常理的有效性工程 · Simon Willison · 05-09
教 Claude 理解为什么研究 · Anthropic Research · 05-09
Arthur-Ficial/apfel 工程 · GitHub · 05-08
nidhinjs/prompt-master 工程 · GitHub · 05-08
rohitg00/从零开始的 AI 工程工程 · GitHub · 05-08
wanshuiyin/睡眠中自动 Claude Code 研究工程 · GitHub · 05-08
自然语言 Autoencoders 研究 · Anthropic Research · 05-08
捐赠我们的开源对齐工具工程 · Anthropic Research · 05-08
llm-gemini 0.31 工程 · Simon Willison · 05-08
大词工程 · Simon Willison · 05-08
关于 xAI/Anthropic 数据中心交易的几点说明产品 · Simon Willison · 05-08
幕后：用 Claude Mythos Preview 加固 Firefox 工程 · Simon Willison · 05-08
The Anthropic Institute 的重点领域研究 · Anthropic Research · 05-07
Claude-Opus-4.7 测试显示视觉提升但后端下降研究 · X · 05-07
Farzapedia 展示基于本地文件的 AI 个性化方案工程 · X · 05-07
vibe agents 被指让整个文件系统成为攻击面工程 · X · 05-07
ConardLi/garden-skills 工程 · GitHub · 05-07
HKUDS/Vibe-Trading 工程 · GitHub · 05-07
JackChen-me/open-multi-agent 工程 · GitHub · 05-07
nesquena/hermes-webui 工程 · GitHub · 05-07
2026 年 4 月通讯 Simon Willison · 05-05
引用 Anthropic Simon Willison · 05-04
Qwen3.6-27B-FP8 产品 · Qwen · 05-03
Qwen3.6-27B 产品 · Qwen · 05-03
Claude Code 最佳实践 - Claude Code 文档 Anthropic Engineering · 05-03
Claude Opus 4.7 介绍 Anthropic · 05-03
Claude 是一个思考空间 | Anthropic Anthropic · 05-03
揭秘 AI agents 的 evals Anthropic Engineering · 05-03
moonshotai/Kimi-K2.6 产品 · Kimi · 05-03
Popsa 如何使用 Amazon Nova 通过个性化标题建议启发客户 AWS ML · 05-03
我理解 LLM 架构的工作流 Sebastian Raschka · 05-03
对agent网络进行红队测试：理解AI agent大规模交互时会出什么问题 MS Research · 05-03
LLM 0.32a0 是一次重大的向后兼容重构 Simon Willison · 05-03
我们需要 RSS 来分享大量 vibe-coded 应用 Simon Willison · 05-03
我们对 OpenAI GPT-5.5 网络安全能力的评估 Simon Willison · 05-03
iNaturalist 目击记录 Simon Willison · 05-03
目击记录 Simon Willison · 05-03
近期 Claude Code 质量报告更新 Anthropic Engineering · 05-01
近期三个问题的复盘 Anthropic Engineering · 05-01
我们如何构建多-agent研究系统 Anthropic Engineering · 05-01
面向 AI agents 的有效 context engineering Anthropic Engineering · 05-01
Claude Developer Platform 推出高级工具使用 Anthropic Engineering · 05-01
Claude Desktop Extensions：为 Claude Desktop 一键安装 MCP server Anthropic Engineering · 05-01
用 Agent Skills 让 agent 适应真实世界 Anthropic Engineering · 05-01
用 AI agents 编写高效工具 Anthropic Engineering · 05-01
长时间运行 agent 的有效 harness Anthropic Engineering · 05-01
用 sandboxing 让 Claude Code 更安全、更自主 Anthropic Engineering · 05-01
“think”工具：让 Claude 停下来思考 Anthropic Engineering · 05-01
使用 MCP 执行代码：构建更高效的 AI agents Anthropic Engineering · 05-01
Claude Opus 4.6 在 BrowseComp 表现中的 eval awareness Anthropic Engineering · 05-01
长时间运行的应用开发的 harness 设计 Anthropic Engineering · 05-01
Claude Code auto 模式：更安全地跳过权限确认 Anthropic Engineering · 05-01
用一组并行 Claude 构建 C 编译器 Anthropic Engineering · 05-01
扩展 Managed Agents：将大脑与双手解耦 Anthropic Engineering · 05-01
量化 agentic 编码评测中的基础设施噪声 Anthropic Engineering · 05-01
人们如何向 Claude 寻求个人指导 Anthropic Research · 05-01
Anthropic Labs 推出 Claude Design Anthropic · 04-30
大语言模型中的情感概念及其功能 Anthropic Research · 04-30
介绍我们的 Science Blog Anthropic Research · 04-30
实践中的可信 agent Anthropic Research · 04-30
Anthropic 经济指数报告：学习曲线 Anthropic Research · 04-30
自动化对齐研究者：使用 LLM 扩展可扩展监督 Anthropic Research · 04-30
澳大利亚如何使用 Claude：Anthropic Economic Index 的发现 Anthropic Research · 04-30
81,000 人告诉我们的 AI 经济学 Anthropic Research · 04-30
Anthropic Economic Index 调查公布 Anthropic Research · 04-30
Claude 用于创意工作 Anthropic · 04-30
Anthropic 与 NEC 合作在日本大规模构建 AI-native 工程 Anthropic · 04-30