nvidia-developer
流式 Tokens 与工具:NVIDIA Dynamo 中的多轮 Agentic Harness 支持
Streaming Tokens and Tools: Multi-Turn Agentic Harness Support in NVIDIA Dynamo
摘要
内容说明 agentic exchange 需保留结构化交互:assistant 轮次交错呈现 reasoning 与 tool calls,后续 user 轮次返回 tool results。reasoning replay 依模型和轮次决定保留或丢弃,inference engine 需支持该交互形式。
agentic exchange 必须保留一种结构化交互:assistant 轮次将 reasoning 与一个或多个 tool calls 交错呈现,随后的 user 轮次会把对应的 tool results 返回到模型上下文中。reasoning replay 取决于模型和轮次:有些 reasoning 应保留,有些则应丢弃。inference engine 负责支持这种更具表达力的……来源
译自 nvidia-developer · 录于 二〇二六年五月八日