实録译稿 社区 24h

术语频次

封存归档

tool use

█▃▄▁ · 143 次 · 收录于 60 篇

工具使用 · 模型借助外部工具完成任务

  1. 代码即代理工具 研究 · HF Papers · 05-20
  2. 可扩展语音代理设计:Amazon Nova Sonic 的多代理、工具与会话分割 工程 · AWS ML · 05-20
  3. 开放Agent排行榜 评测 · HF Blog · 05-18
  4. 新型评估与Agent脚手架赏金计划 研究 · UK AISI · 05-16
  5. OpenAI o1 模型部署前评估 评测 · UK AISI · 05-16
  6. 综述评估 agent 的基准:Terminal-Bench、Tau-Bench 等十余项及校准方法 研究 · X · 05-16
  7. 关于AI委托与长期可靠性近期研究的进一步说明 研究 · MS Research · 05-16
  8. vllm v0.21.0 工程 · GitHub Release · 05-15
  9. 国际联合测试演习:Agentic 测试 评测 · UK AISI · 05-15
  10. Intern-S2-Preview 研究 · InternLM · 05-15
  11. Intern-S2-Preview-FP8 研究 · InternLM · 05-15
  12. Stream Vision Agents 与 Amazon Nova 2 Sonic 实时语音代理 工程 · AWS ML · 05-15
  13. 有效训练长上下文视觉语言模型,泛化能力超越128K上下文 研究 · HF Papers · 05-15
  14. 使用 Amazon Nova Sonic 和 WebRTC 构建实时语音流应用 工程 · AWS ML · 05-14
  15. Kimi K2.6:新的领先开源权重模型 产品 · Artificial Analysis · 05-12
  16. 在脚本的 shebang 行中使用 LLM 工程 · Simon Willison · 05-12
  17. MiniCPM-V-4.6-gguf 工程 · OpenBMB · 05-12
  18. MiniCPM-V-4.6-Thinking-gguf 产品 · OpenBMB · 05-11
  19. MiniCPM-V-4.6-Thinking 产品 · OpenBMB · 05-11
  20. MiniCPM-V-4.6-AWQ 产品 · OpenBMB · 05-11
  21. MiniCPM-V-4.6-BNB 产品 · OpenBMB · 05-11
  22. MiniCPM-V-4.6-GPTQ 产品 · OpenBMB · 05-11
  23. MiniCPM-V-4.6-Thinking-AWQ 产品 · OpenBMB · 05-11
  24. MiniCPM-V-4.6-Thinking-GPTQ 产品 · OpenBMB · 05-11
  25. MiniCPM-V-4.6-Thinking-BNB 产品 · OpenBMB · 05-11
  26. 提出四种subagent编排模式及适用边界 工程 · X · 05-09
  27. Agent 如何管理其他 Agent:2026 年四种 Subagent 模式 工程 · Phil Schmid · 05-09
  28. 提升 GitHub Agentic Workflows 中的 token 效率 工程 · GitHub AI/ML · 05-09
  29. Narcooo/inkos 工程 · GitHub · 05-09
  30. 教 Claude 理解为什么 研究 · Anthropic Research · 05-09
  31. Arthur-Ficial/apfel 工程 · GitHub · 05-08
  32. rohitg00/从零开始的 AI 工程 工程 · GitHub · 05-08
  33. 用 GPT-5.5 和 GPT-5.5-Cyber 扩展网络安全可信访问 产品 · OpenAI · 05-08
  34. 短文梳理 coding agent 的四类构建模块 工程 · X · 05-07
  35. 综述梳理 MOPD 在近期 LLM 后训练中的应用 研究 · X · 05-07
  36. 面向医疗 agent 的 Healthcare AI GYM HF Papers · 05-06
  37. 基于编排轨迹的 LLM multi-agent 系统强化学习 HF Papers · 05-06
  38. HeavySkill:将 Heavy Thinking 作为 Agentic Harness 的内在技能 HF Papers · 05-06
  39. PORTool:用于多工具集成推理的奖励树重要性感知 Policy Optimization Apple ML · 05-05
  40. OpenAI 如何大规模交付低延迟语音 AI OpenAI · 05-05
  41. [Product] 串联起来:在 Studio 中使用内置和自定义 MCP 构建,将企业数据连接到你的 AI 应用,用可复用连接器、直接工具调用和 human-in-the-loop 审批控制 Mistral · 05-04
  42. Qwen3.6-27B-FP8 产品 · Qwen · 05-03
  43. Together AI 与 Adaption 建立合作伙伴关系 Together AI · 05-03
  44. Qwen3.6-27B 产品 · Qwen · 05-03
  45. moonshotai/Kimi-K2.6 产品 · Kimi · 05-03
  46. NVIDIA Nemotron 3 Nano Omni:面向文档、音频和视频 agent 的长上下文多模态智能 HF Blog · 05-03
  47. NVIDIA Nemotron 3 Nano Omni 模型现可在 Amazon SageMaker JumpStart 使用 AWS ML · 05-03
  48. 用 Amazon Nova 2 Sonic 将文本 agent 迁移为语音助手 AWS ML · 05-03
  49. Coding Agent 的组成部分 Sebastian Raschka · 05-03
  50. 对agent网络进行红队测试:理解AI agent大规模交互时会出什么问题 MS Research · 05-03
  51. 近期 Claude Code 质量报告更新 Anthropic Engineering · 05-01
  52. 我们如何构建多-agent研究系统 Anthropic Engineering · 05-01
  53. Claude Developer Platform 推出高级工具使用 Anthropic Engineering · 05-01
  54. 用 AI agents 编写高效工具 Anthropic Engineering · 05-01
  55. “think”工具:让 Claude 停下来思考 Anthropic Engineering · 05-01
  56. Claude Opus 4.6 在 BrowseComp 表现中的 eval awareness Anthropic Engineering · 05-01
  57. FAMA:面向交互式工具使用环境中开源 LLM 的失败感知 Meta-Agentic 框架 HF Papers · 05-01
  58. OpenAI 模型、Codex 和 Managed Agents 登陆 AWS OpenAI · 04-30
  59. 实践中的可信 agent Anthropic Research · 04-30
  60. GLM-5V-Turbo:迈向多模态 agent 的原生基础模型 HF Papers · 04-30