词
历Claude
Anthropic 大语言模型系列总称
- 疯狂屋 — Usborne 恐怖电脑游戏
- walkinglabs/learn-harness-engineering
- Project Glasswing:初步更新
- Qwen 3.7-Max 在 agent 任务中以更低成本击败 Opus 4.7 和 GPT-5.5
- 专业化胜过规模化:多数AI采购决策忽视的战略变量
- 如何通过评估与可观测性赢得利益相关者信任
- Karpathy 的 CLAUDE.md 以 65 行规则将 AI 编码准确率从 65% 提升至 94%
- Datasette Agent
- Modal C轮融资:以46.5亿美元估值募资3.55亿美元
- 在Claude设置中粘贴提示词,强制其诚实表达不确定性并禁止编造来源
- Anthropic 发布 claude-code-setup 插件,将 Claude Code 升级为完整 AI 开发环境
- 推出带 Modal 沙箱的 Claude 托管 Agent
- 推出 Ettin Reranker 系列
- AgriciDaniel/claude-obsidian
- Anthropic 发布 claude-code-setup 插件,将 Claude Code 升级为完整 AI 开发环境
- Imbad0202/学术研究技能
- neilsonnn/image-blaster
- AI系统应该像人一样行事吗?
- 长文本任务
- OpenAI o1 模型部署前评估
- Anthropic 升级版 Claude 3.5 Sonnet 的部署前评估
- Claude 百万上下文窗口可设自动压缩阈值避免污染
- Claude Code 百万 token 上下文窗口的双刃剑效应与会话管理策略
- datasette-llm-limits 0.1a0
- iNaturalist-clumper 0.1
- 安全评估原则
- DavidAU 团队基于 Qwen3.5-27B 拼接训练出非官方 Qwen3.5-40B Dense 模型
- 让安全评估可操作
- esengine/DeepSeek-Reasonix
- op7418/guizang-ppt-skill
- Intern-S2-Preview
- Intern-S2-Preview-FP8
- 自主AI网络能力进步有多快?
- 当前AI系统的局限性映射
- 压力测试AI编码代理的异步监控
- Stream Vision Agents 与 Amazon Nova 2 Sonic 实时语音代理
- 欢迎来到 Datasette 博客
- AI网络任务中推理扩展的证据:增加评估预算揭示更高成功率
- 引用 Boris Mann
- 我们对Claude Mythos Preview网络能力的评估
- 我们对OpenAI GPT-5.5网络能力的评估
- 评估AI模型是否会破坏AI安全研究
- 红队测试Anthropic内部Agent监控系统
- 分享通过 OpenRouter 和 Ollama 从开放权重模型生成蒸馏数据的实用工具
- 如何与AI协作并实现复利
- Opus 4.7:你需要知道的一切
- 近期开源权重模型发布
- 中国AI实验室内部笔记
- 解读今日开放-封闭性能差距
- 蒸馏恐慌
- 我对开源模型的押注,2026年中
- Import AI 455:AI系统即将开始自我构建
- Import AI 454:自动化对齐研究;中国模型安全评估;HiFloat4
- SocialReasoning-Bench:衡量AI智能体是否以用户最佳利益行事
- 用 Amazon Nova 多模态嵌入实现制造智能
- Claude Code 可接入 17000+ 股票与 crypto 实时数据
- open-multi-agent/open-multi-agent
- Claude Code 团队成员分享用 HTML 替代 Markdown 的场景
- Claude Code 源码快照泄露,展示 repo context 与 subagent 设计
- Harness 是一切:如何优化你的 Harness
- 提升 GitHub Agentic Workflows 中的 token 效率
- Narcooo/inkos
- 使用 Claude Code:HTML 不合常理的有效性
- 教 Claude 理解为什么
- Arthur-Ficial/apfel
- nidhinjs/prompt-master
- rohitg00/从零开始的 AI 工程
- wanshuiyin/睡眠中自动 Claude Code 研究
- 自然语言 Autoencoders
- 捐赠我们的开源对齐工具
- llm-gemini 0.31
- 大词
- 关于 xAI/Anthropic 数据中心交易的几点说明
- 幕后:用 Claude Mythos Preview 加固 Firefox
- The Anthropic Institute 的重点领域
- Claude-Opus-4.7 测试显示视觉提升但后端下降
- Farzapedia 展示基于本地文件的 AI 个性化方案
- vibe agents 被指让整个文件系统成为攻击面
- ConardLi/garden-skills
- HKUDS/Vibe-Trading
- JackChen-me/open-multi-agent
- nesquena/hermes-webui
- 2026 年 4 月通讯
- 引用 Anthropic
- Qwen3.6-27B-FP8
- Qwen3.6-27B
- Claude Code 最佳实践 - Claude Code 文档
- Claude Opus 4.7 介绍
- Claude 是一个思考空间 | Anthropic
- 揭秘 AI agents 的 evals
- moonshotai/Kimi-K2.6
- Popsa 如何使用 Amazon Nova 通过个性化标题建议启发客户
- 我理解 LLM 架构的工作流
- 对agent网络进行红队测试:理解AI agent大规模交互时会出什么问题
- LLM 0.32a0 是一次重大的向后兼容重构
- 我们需要 RSS 来分享大量 vibe-coded 应用
- 我们对 OpenAI GPT-5.5 网络安全能力的评估
- iNaturalist 目击记录
- 目击记录
- 近期 Claude Code 质量报告更新
- 近期三个问题的复盘
- 我们如何构建多-agent研究系统
- 面向 AI agents 的有效 context engineering
- Claude Developer Platform 推出高级工具使用
- Claude Desktop Extensions:为 Claude Desktop 一键安装 MCP server
- 用 Agent Skills 让 agent 适应真实世界
- 用 AI agents 编写高效工具
- 长时间运行 agent 的有效 harness
- 用 sandboxing 让 Claude Code 更安全、更自主
- “think”工具:让 Claude 停下来思考
- 使用 MCP 执行代码:构建更高效的 AI agents
- Claude Opus 4.6 在 BrowseComp 表现中的 eval awareness
- 长时间运行的应用开发的 harness 设计
- Claude Code auto 模式:更安全地跳过权限确认
- 用一组并行 Claude 构建 C 编译器
- 扩展 Managed Agents:将大脑与双手解耦
- 量化 agentic 编码评测中的基础设施噪声
- 人们如何向 Claude 寻求个人指导
- Anthropic Labs 推出 Claude Design
- 大语言模型中的情感概念及其功能
- 介绍我们的 Science Blog
- 实践中的可信 agent
- Anthropic 经济指数报告:学习曲线
- 自动化对齐研究者:使用 LLM 扩展可扩展监督
- 澳大利亚如何使用 Claude:Anthropic Economic Index 的发现
- 81,000 人告诉我们的 AI 经济学
- Anthropic Economic Index 调查公布
- Claude 用于创意工作
- Anthropic 与 NEC 合作在日本大规模构建 AI-native 工程