词
历tool use
工具使用 · 模型借助外部工具完成任务
- 代码即代理工具
- 可扩展语音代理设计:Amazon Nova Sonic 的多代理、工具与会话分割
- 开放Agent排行榜
- 新型评估与Agent脚手架赏金计划
- OpenAI o1 模型部署前评估
- 综述评估 agent 的基准:Terminal-Bench、Tau-Bench 等十余项及校准方法
- 关于AI委托与长期可靠性近期研究的进一步说明
- vllm v0.21.0
- 国际联合测试演习:Agentic 测试
- Intern-S2-Preview
- Intern-S2-Preview-FP8
- Stream Vision Agents 与 Amazon Nova 2 Sonic 实时语音代理
- 有效训练长上下文视觉语言模型,泛化能力超越128K上下文
- 使用 Amazon Nova Sonic 和 WebRTC 构建实时语音流应用
- Kimi K2.6:新的领先开源权重模型
- 在脚本的 shebang 行中使用 LLM
- MiniCPM-V-4.6-gguf
- MiniCPM-V-4.6-Thinking-gguf
- MiniCPM-V-4.6-Thinking
- MiniCPM-V-4.6-AWQ
- MiniCPM-V-4.6-BNB
- MiniCPM-V-4.6-GPTQ
- MiniCPM-V-4.6-Thinking-AWQ
- MiniCPM-V-4.6-Thinking-GPTQ
- MiniCPM-V-4.6-Thinking-BNB
- 提出四种subagent编排模式及适用边界
- Agent 如何管理其他 Agent:2026 年四种 Subagent 模式
- 提升 GitHub Agentic Workflows 中的 token 效率
- Narcooo/inkos
- 教 Claude 理解为什么
- Arthur-Ficial/apfel
- rohitg00/从零开始的 AI 工程
- 用 GPT-5.5 和 GPT-5.5-Cyber 扩展网络安全可信访问
- 短文梳理 coding agent 的四类构建模块
- 综述梳理 MOPD 在近期 LLM 后训练中的应用
- 面向医疗 agent 的 Healthcare AI GYM
- 基于编排轨迹的 LLM multi-agent 系统强化学习
- HeavySkill:将 Heavy Thinking 作为 Agentic Harness 的内在技能
- PORTool:用于多工具集成推理的奖励树重要性感知 Policy Optimization
- OpenAI 如何大规模交付低延迟语音 AI
- [Product] 串联起来:在 Studio 中使用内置和自定义 MCP 构建,将企业数据连接到你的 AI 应用,用可复用连接器、直接工具调用和 human-in-the-loop 审批控制
- Qwen3.6-27B-FP8
- Together AI 与 Adaption 建立合作伙伴关系
- Qwen3.6-27B
- moonshotai/Kimi-K2.6
- NVIDIA Nemotron 3 Nano Omni:面向文档、音频和视频 agent 的长上下文多模态智能
- NVIDIA Nemotron 3 Nano Omni 模型现可在 Amazon SageMaker JumpStart 使用
- 用 Amazon Nova 2 Sonic 将文本 agent 迁移为语音助手
- Coding Agent 的组成部分
- 对agent网络进行红队测试:理解AI agent大规模交互时会出什么问题
- 近期 Claude Code 质量报告更新
- 我们如何构建多-agent研究系统
- Claude Developer Platform 推出高级工具使用
- 用 AI agents 编写高效工具
- “think”工具:让 Claude 停下来思考
- Claude Opus 4.6 在 BrowseComp 表现中的 eval awareness
- FAMA:面向交互式工具使用环境中开源 LLM 的失败感知 Meta-Agentic 框架
- OpenAI 模型、Codex 和 Managed Agents 登陆 AWS
- 实践中的可信 agent
- GLM-5V-Turbo:迈向多模态 agent 的原生基础模型