録实録译稿议社区 24h

词术语频次

历封存归档

NVIDIA

█▃▄▄ · 435 次 · 收录于 70 篇

英伟达人工智能芯片公司

Nemotron-Labs 扩散语言模型实现光速级文本生成产品 · HF Blog · 05-23
在电信AI工厂上构建Token计量的AI服务工程 · NVIDIA Developer · 05-22
在NVIDIA GB200 NVL72上通过Slurm拓扑感知作业调度解锁百亿亿次性能工程 · NVIDIA Developer · 05-22
Midjourney 创始人自曝因用TPU弃N卡导致产品迭代落后一年工程 · X · 05-21
NVIDIA 验证的 Agent 技能为 AI Agent 提供能力治理工程 · NVIDIA Developer · 05-20
vLLM 中的弹性专家并行工程 · vLLM · 05-20
大规模推理基准测试：编码智能体评测 · Together AI · 05-20
让内容创建与编辑过程更易理解产品 · DeepMind · 05-20
推出 Ettin Reranker 系列产品 · HF Blog · 05-19
使用 LoRA/DoRA 微调 NVIDIA Cosmos Predict 2.5 生成机器人视频工程 · HF Blog · 05-19
VeRL-Omni 发布：扩散与全模态模型的简易、快速、稳定 RL 训练工程 · vLLM · 05-18
LLM架构最新进展：KV共享、mHC与压缩注意力研究 · Sebastian Raschka · 05-17
sglang v0.5.12 工程 · GitHub Release · 05-17
nanochat 单节点 8XH100 训练 2 小时达 GPT-2 级别能力，数据集切换至 NVIDIA ClimbMix 工程 · X · 05-16
特斯拉 AI5 芯片流片成功，带宽接近 MacStudio M2 Ultra 产品 · X · 05-15
vllm v0.21.0 工程 · GitHub Release · 05-15
2028：全球AI领导力的两种情景研究 · Anthropic Research · 05-15
Granite Embedding Multilingual R2：Apache 2.0 开源多语言嵌入，32K 上下文 — 最佳 Sub-100M 检索质量产品 · HF Blog · 05-15
NVIDIA Vera Rubin 平台如何解决 Agentic AI 的扩展问题工程 · NVIDIA Developer · 05-15
vLLM x Mooncake 规模化服务 Agent 工作负载工程 · vLLM · 05-15
vLLM 登顶 Artificial Analysis 排行榜工程 · vLLM · 05-15
AIMIP 发布：AI 天气与气候模型比对项目 | Ai2 评测 · Allen AI · 05-14
用AI Agent与技能将视频转化为即时可搜索、可行动的情报产品 · NVIDIA Developer · 05-14
如何实现真正的无服务器GPU 工程 · Modal · 05-12
Sub-32B 开放权重产品 · Artificial Analysis · 05-12
近期开源权重模型发布产品 · Artificial Analysis · 05-12
中国AI实验室内部笔记对话 · Interconnects · 05-12
蒸馏恐慌对话 · Interconnects · 05-12
我对开源模型的押注，2026年中研究 · Interconnects · 05-12
AWS 上基础模型训练与推理的构建模块工程 · HF Blog · 05-12
vLLM 登顶 Artificial Analysis 排行榜工程 · vLLM · 05-12
xAI将Colossus 1租给Anthropic做inference 工程 · X Trending · 05-10
用一个 Python 字典将多模态推理性能提升 >10% 工程 · Modal · 05-09
流式 Tokens 与工具：NVIDIA Dynamo 中的多轮 Agentic Harness 支持工程 · NVIDIA Developer · 05-09
通过语法约束解码改进小型语言模型的 Bash 生成研究 · NVIDIA Developer · 05-09
服务 DeepSeek-V4：为什么百万 token 上下文是推理系统问题工程 · Together AI · 05-09
MedQA：在 AMD ROCm 上微调临床 AI，无需 CUDA 工程 · HF Blog · 05-08
rohitg00/从零开始的 AI 工程工程 · GitHub · 05-08
克服奖励信号挑战：在 SageMaker AI 上使用 GRPO 进行基于可验证奖励的强化学习工程 · AWS ML · 05-08
模型量化：使用 NVIDIA Model Optimizer 进行训练后量化工程 · NVIDIA Developer · 05-08
Nvidia 发布 Nemotron 3 Super 120B-A12B，throughput 突出研究 · X · 05-07
NVIDIA 机器人实验室发布 GR00T、Dreams、SONIC 等成果产品 · X · 05-07
DreamDojo 开源基于人类视频的机器人 world model 产品 · X · 05-07
EgoScale用2万小时人类第一视角视频训练灵巧手人形机器人研究 · X · 05-07
SONIC：42M Transformer实现人形机器人全身控制并开源产品 · X · 05-07
CaP-X开源：机器人agentic toolkit与CaP-Gym 研究 · X · 05-07
用 vLLM x Mooncake 大规模服务 Agentic 工作负载工程 · vLLM · 05-07
用 MRC（Multipath Reliable Connection）解锁大规模 AI 训练网络工程 · OpenAI · 05-06
如何用 NVIDIA 构建车载 AI agent：从云端到汽车 NVIDIA Developer · 05-06
MolmoAct 2：面向现实世界机器人工作的开放基础 | Ai2 Allen AI · 05-06
使用 NVIDIA cuOpt Agent Skills 优化供应链决策系统 NVIDIA Developer · 05-05
支撑大规模高效推理的基础研究 Together AI · 05-05
Vibe 中的远程 agent，由 Mistral Medium 3.5 驱动 Mistral · 05-04
[公司] Mistral AI 与 NVIDIA 合作加速开放前沿模型，作为 NVIDIA Nemotron Coalition 创始成员贡献大规模模型开发和多模态能力 Mistral · 05-04
Together AI 与 Adaption 建立合作伙伴关系 Together AI · 05-03
vLLM 中的 DeepSeek V4：高效长上下文 Attention vLLM · 05-03
介绍 GPT-5.5 OpenAI · 05-03
NVIDIA Nemotron 3 Nano Omni：面向文档、音频和视频 agent 的长上下文多模态智能 HF Blog · 05-03
vLLM 中混合 SSM 模型的分离式 Serving vLLM · 05-03
用 vLLM 运行基于 NVIDIA Nemotron 3 Nano Omni 的高效多模态 agentic AI vLLM · 05-03
NVIDIA Nemotron 3 Nano Omni 模型现可在 Amazon SageMaker JumpStart 使用 AWS ML · 05-03
Together AI 首日向开发者提供 NVIDIA Nemotron 3 Nano Omni 产品 · Together AI · 05-03
从 732 字节到无处可去：在生产环境中关闭 Copy Fail 工程 · Together AI · 05-03
使用 NVIDIA FLARE 实现无重构开销的联邦学习 NVIDIA Developer · 05-03
使用 NVIDIA Blackwell 和 GPU 加速端点基于 DeepSeek V4 构建 NVIDIA Developer · 05-03
借助 NVIDIA Megatron 推进新兴优化器以加速 LLM 训练 NVIDIA Developer · 05-03
如何在 ComfyUI 中构建、运行和扩展高质量创作者工作流 NVIDIA Developer · 05-03
用 NVIDIA TensorRT for RTX Runtime 加速 Unreal Engine NNE 推理 NVIDIA Developer · 05-03
近期三个问题的复盘 Anthropic Engineering · 05-01
为 Intelligence Age 构建计算基础设施 OpenAI · 04-30