词
历Anthropic
AI 公司 · 创始 2021 · Claude 系列出品方
- walkinglabs/learn-harness-engineering
- Project Glasswing:初步更新
- 微软因 token 计费成本过高取消 Claude Code 许可,Uber 四个月烧光 2026 年 AI 预算
- Anthropic 发布 claude-code-setup 插件,将 Claude Code 升级为完整 AI 开发环境
- 引用SpaceX S-1
- 10 tokens每秒到底有多快?
- 字节跳动发布开源全模态模型Lance,3B参数支持图文视频理解与生成
- 推出带 Modal 沙箱的 Claude 托管 Agent
- Import AI 457:AI 震网;诅咒的 Muon 优化器;与正向对齐
- 五分钟看懂LLM过去六个月
- ImageNet 创造者发布 BEHAVIOR 统一机器人基准测试
- Anthropic 发布 claude-code-setup 插件,将 Claude Code 升级为完整 AI 开发环境
- Imbad0202/学术研究技能
- “无法”论证的安全案例模板
- 前沿AI问答评估开发早期洞察
- AISI的安全案例
- 第四次进展报告
- 新型评估与Agent脚手架赏金计划
- OpenAI o1 模型部署前评估
- Anthropic 升级版 Claude 3.5 Sonnet 的部署前评估
- 发布 Inspect Evals
- 我们的第一年
- datasette-llm-limits 0.1a0
- iNaturalist-clumper 0.1
- 我们如何弥合AI能力与防护之间的差距
- RepliBench:衡量AI系统中的自主复制能力
- esengine/DeepSeek-Reasonix
- Intern-S2-Preview
- Intern-S2-Preview-FP8
- 管理日益强大的开放权重AI系统的风险
- 大规模后门数据投毒研究
- 当前AI系统的局限性映射
- 2028:全球AI领导力的两种情景
- 我们如何与前沿AI开发者合作提升模型安全性
- 审计游戏以检测沙袋行为
- 边界点越狱:突破最强AI防御的新方法
- Introducing ControlArena:用于运行AI控制实验的库
- Stream Vision Agents 与 Amazon Nova 2 Sonic 实时语音代理
- 研究不对齐模型
- 我们的2025年度回顾
- 欢迎来到 Datasette 博客
- 资助60个项目推进AI对齐研究
- AI在欺诈与网络犯罪中滥用的评估框架
- 引用 Boris Mann
- 我们对Claude Mythos Preview网络能力的评估
- 环境因素如何影响AI行为?
- 我们对OpenAI GPT-5.5网络能力的评估
- 评估AI模型是否会破坏AI安全研究
- 红队测试Anthropic内部Agent监控系统
- Anthropic 风险报告(2026年2月)中“自动化研发风险”章节评述
- Opus 4.7:你需要知道的一切
- Kimi K2.6:新的领先开源权重模型
- OpenAI的GPT-5.5成为领先AI模型
- 中国AI实验室内部笔记
- 解读今日开放-封闭性能差距
- 蒸馏恐慌
- Import AI 455:AI系统即将开始自我构建
- Import AI 456:RSI与经济增长;AI监管的激进可选性;神经计算机
- Import AI 454:自动化对齐研究;中国模型安全评估;HiFloat4
- 用 Amazon Nova 多模态嵌入实现制造智能
- MachinaCheck:基于 AMD MI300X 构建 Multi-Agent CNC 可制造性系统
- open-multi-agent/open-multi-agent
- xAI将Colossus 1租给Anthropic做inference
- Harness 是一切:如何优化你的 Harness
- Narcooo/inkos
- 使用 Claude Code:HTML 不合常理的有效性
- 教 Claude 理解为什么
- Arthur-Ficial/apfel
- rohitg00/从零开始的 AI 工程
- wanshuiyin/睡眠中自动 Claude Code 研究
- 自然语言 Autoencoders
- 捐赠我们的开源对齐工具
- llm-gemini 0.31
- 大词
- 关于 xAI/Anthropic 数据中心交易的几点说明
- 幕后:用 Claude Mythos Preview 加固 Firefox
- The Anthropic Institute 的重点领域
- Claude-Opus-4.7 测试显示视觉提升但后端下降
- ConardLi/garden-skills
- HKUDS/Vibe-Trading
- JackChen-me/open-multi-agent
- nesquena/hermes-webui
- Vibe coding 和 agentic engineering 比我希望的更接近了
- 基于编排轨迹的 LLM multi-agent 系统强化学习
- 引用 Anthropic
- Claude Code 最佳实践 - Claude Code 文档
- 关于我们选举保障措施的更新
- Claude Opus 4.7 介绍
- Claude 是一个思考空间 | Anthropic
- 揭秘 AI agents 的 evals
- moonshotai/Kimi-K2.6
- Anthropic 悉尼办公室
- Anthropic 的 Long-Term Benefit Trust 任命 Vas Narasimhan 加入董事会
- Anthropic扩大与Google和Broadcom在数吉瓦级下一代算力上的合作
- Popsa 如何使用 Amazon Nova 通过个性化标题建议启发客户
- LLM 0.32a0 是一次重大的向后兼容重构
- Zig 项目坚持反 AI 贡献政策的理由
- 我们对 OpenAI GPT-5.5 网络安全能力的评估
- 近期 Claude Code 质量报告更新
- 近期三个问题的复盘
- 我们如何构建多-agent研究系统
- 面向 AI agents 的有效 context engineering
- Claude Developer Platform 推出高级工具使用
- Claude Desktop Extensions:为 Claude Desktop 一键安装 MCP server
- 用 Agent Skills 让 agent 适应真实世界
- 用 AI agents 编写高效工具
- 长时间运行 agent 的有效 harness
- 使用 MCP 执行代码:构建更高效的 AI agents
- Claude Opus 4.6 在 BrowseComp 表现中的 eval awareness
- 用一组并行 Claude 构建 C 编译器
- 量化 agentic 编码评测中的基础设施噪声
- 人们如何向 Claude 寻求个人指导
- Anthropic Labs 推出 Claude Design
- 大语言模型中的情感概念及其功能
- 介绍我们的 Science Blog
- 实践中的可信 agent
- Anthropic 经济指数报告:学习曲线
- 自动化对齐研究者:使用 LLM 扩展可扩展监督
- 澳大利亚如何使用 Claude:Anthropic Economic Index 的发现
- 81,000 人告诉我们的 AI 经济学
- Anthropic Economic Index 调查公布
- Claude 用于创意工作
- Anthropic 与 NEC 合作在日本大规模构建 AI-native 工程
- Anthropic 与 Amazon 扩大合作,新增算力最高达 5 吉瓦