一声棒喝,本不立文字
偏要著録,已是二义

NVIDIA · Developer 博客

NVIDIA Vera Rubin 平台如何解决 Agentic AI 的扩展问题

How the NVIDIA Vera Rubin Platform is Solving Agentic AI’s Scale-Up Problem

二〇二六年五月十四日 · 英文原文

NVIDIA Vera Rubin NVL72 承担了 Agentic inference(智能体推理)中大部分推理负载。该推理方式通过引入非确定性轨迹(即 AI agent 在处理任务时产生的动作、观察和决策),改变了推理工作负载的运行时动态。这些轨迹在每个会话中累积了数百次推理请求的端到端延迟。

Agentic inference(智能体推理)通过引入非确定性轨迹——AI agent(智能体)在处理任务时产生的动作、观察和决策——从根本上改变了推理工作负载的运行时动态。这些轨迹在每个会话中累积了数百次推理请求的端到端延迟。NVIDIA Vera Rubin NVL72 承担了其中大部分的推理负载,作为……来源

译自 NVIDIA · Developer 博客 · 录于 二〇二六年五月十四日