録实録译稿议社区 24h

词术语频次

历封存归档

tool use

█▃▄▁ · 143 次 · 收录于 60 篇

工具使用 · 模型借助外部工具完成任务

代码即代理工具研究 · HF Papers · 05-20
可扩展语音代理设计：Amazon Nova Sonic 的多代理、工具与会话分割工程 · AWS ML · 05-20
开放Agent排行榜评测 · HF Blog · 05-18
新型评估与Agent脚手架赏金计划研究 · UK AISI · 05-16
OpenAI o1 模型部署前评估评测 · UK AISI · 05-16
综述评估 agent 的基准：Terminal-Bench、Tau-Bench 等十余项及校准方法研究 · X · 05-16
关于AI委托与长期可靠性近期研究的进一步说明研究 · MS Research · 05-16
vllm v0.21.0 工程 · GitHub Release · 05-15
国际联合测试演习：Agentic 测试评测 · UK AISI · 05-15
Intern-S2-Preview 研究 · InternLM · 05-15
Intern-S2-Preview-FP8 研究 · InternLM · 05-15
Stream Vision Agents 与 Amazon Nova 2 Sonic 实时语音代理工程 · AWS ML · 05-15
有效训练长上下文视觉语言模型，泛化能力超越128K上下文研究 · HF Papers · 05-15
使用 Amazon Nova Sonic 和 WebRTC 构建实时语音流应用工程 · AWS ML · 05-14
Kimi K2.6：新的领先开源权重模型产品 · Artificial Analysis · 05-12
在脚本的 shebang 行中使用 LLM 工程 · Simon Willison · 05-12
MiniCPM-V-4.6-gguf 工程 · OpenBMB · 05-12
MiniCPM-V-4.6-Thinking-gguf 产品 · OpenBMB · 05-11
MiniCPM-V-4.6-Thinking 产品 · OpenBMB · 05-11
MiniCPM-V-4.6-AWQ 产品 · OpenBMB · 05-11
MiniCPM-V-4.6-BNB 产品 · OpenBMB · 05-11
MiniCPM-V-4.6-GPTQ 产品 · OpenBMB · 05-11
MiniCPM-V-4.6-Thinking-AWQ 产品 · OpenBMB · 05-11
MiniCPM-V-4.6-Thinking-GPTQ 产品 · OpenBMB · 05-11
MiniCPM-V-4.6-Thinking-BNB 产品 · OpenBMB · 05-11
提出四种subagent编排模式及适用边界工程 · X · 05-09
Agent 如何管理其他 Agent：2026 年四种 Subagent 模式工程 · Phil Schmid · 05-09
提升 GitHub Agentic Workflows 中的 token 效率工程 · GitHub AI/ML · 05-09
Narcooo/inkos 工程 · GitHub · 05-09
教 Claude 理解为什么研究 · Anthropic Research · 05-09
Arthur-Ficial/apfel 工程 · GitHub · 05-08
rohitg00/从零开始的 AI 工程工程 · GitHub · 05-08
用 GPT-5.5 和 GPT-5.5-Cyber 扩展网络安全可信访问产品 · OpenAI · 05-08
短文梳理 coding agent 的四类构建模块工程 · X · 05-07
综述梳理 MOPD 在近期 LLM 后训练中的应用研究 · X · 05-07
面向医疗 agent 的 Healthcare AI GYM HF Papers · 05-06
基于编排轨迹的 LLM multi-agent 系统强化学习 HF Papers · 05-06
HeavySkill：将 Heavy Thinking 作为 Agentic Harness 的内在技能 HF Papers · 05-06
PORTool：用于多工具集成推理的奖励树重要性感知 Policy Optimization Apple ML · 05-05
OpenAI 如何大规模交付低延迟语音 AI OpenAI · 05-05
[Product] 串联起来：在 Studio 中使用内置和自定义 MCP 构建，将企业数据连接到你的 AI 应用，用可复用连接器、直接工具调用和 human-in-the-loop 审批控制 Mistral · 05-04
Qwen3.6-27B-FP8 产品 · Qwen · 05-03
Together AI 与 Adaption 建立合作伙伴关系 Together AI · 05-03
Qwen3.6-27B 产品 · Qwen · 05-03
moonshotai/Kimi-K2.6 产品 · Kimi · 05-03
NVIDIA Nemotron 3 Nano Omni：面向文档、音频和视频 agent 的长上下文多模态智能 HF Blog · 05-03
NVIDIA Nemotron 3 Nano Omni 模型现可在 Amazon SageMaker JumpStart 使用 AWS ML · 05-03
用 Amazon Nova 2 Sonic 将文本 agent 迁移为语音助手 AWS ML · 05-03
Coding Agent 的组成部分 Sebastian Raschka · 05-03
对agent网络进行红队测试：理解AI agent大规模交互时会出什么问题 MS Research · 05-03
近期 Claude Code 质量报告更新 Anthropic Engineering · 05-01
我们如何构建多-agent研究系统 Anthropic Engineering · 05-01
Claude Developer Platform 推出高级工具使用 Anthropic Engineering · 05-01
用 AI agents 编写高效工具 Anthropic Engineering · 05-01
“think”工具：让 Claude 停下来思考 Anthropic Engineering · 05-01
Claude Opus 4.6 在 BrowseComp 表现中的 eval awareness Anthropic Engineering · 05-01
FAMA：面向交互式工具使用环境中开源 LLM 的失败感知 Meta-Agentic 框架 HF Papers · 05-01
OpenAI 模型、Codex 和 Managed Agents 登陆 AWS OpenAI · 04-30
实践中的可信 agent Anthropic Research · 04-30
GLM-5V-Turbo：迈向多模态 agent 的原生基础模型 HF Papers · 04-30