NVIDIA · Developer 博客
NVIDIA Vera Rubin 平台如何解决 Agentic AI 的扩展问题
How the NVIDIA Vera Rubin Platform is Solving Agentic AI’s Scale-Up Problem
摘要
NVIDIA Vera Rubin NVL72 承担了 Agentic inference(智能体推理)中大部分推理负载。该推理方式通过引入非确定性轨迹(即 AI agent 在处理任务时产生的动作、观察和决策),改变了推理工作负载的运行时动态。这些轨迹在每个会话中累积了数百次推理请求的端到端延迟。
Agentic inference(智能体推理)通过引入非确定性轨迹——AI agent(智能体)在处理任务时产生的动作、观察和决策——从根本上改变了推理工作负载的运行时动态。这些轨迹在每个会话中累积了数百次推理请求的端到端延迟。NVIDIA Vera Rubin NVL72 承担了其中大部分的推理负载,作为……来源
译自 NVIDIA · Developer 博客 · 录于 二〇二六年五月十四日