词
历NVIDIA
英伟达人工智能芯片公司
- Nemotron-Labs 扩散语言模型实现光速级文本生成
- 在电信AI工厂上构建Token计量的AI服务
- 在NVIDIA GB200 NVL72上通过Slurm拓扑感知作业调度解锁百亿亿次性能
- Midjourney 创始人自曝因用TPU弃N卡导致产品迭代落后一年
- NVIDIA 验证的 Agent 技能为 AI Agent 提供能力治理
- vLLM 中的弹性专家并行
- 大规模推理基准测试:编码智能体
- 让内容创建与编辑过程更易理解
- 推出 Ettin Reranker 系列
- 使用 LoRA/DoRA 微调 NVIDIA Cosmos Predict 2.5 生成机器人视频
- VeRL-Omni 发布:扩散与全模态模型的简易、快速、稳定 RL 训练
- LLM架构最新进展:KV共享、mHC与压缩注意力
- sglang v0.5.12
- nanochat 单节点 8XH100 训练 2 小时达 GPT-2 级别能力,数据集切换至 NVIDIA ClimbMix
- 特斯拉 AI5 芯片流片成功,带宽接近 MacStudio M2 Ultra
- vllm v0.21.0
- 2028:全球AI领导力的两种情景
- Granite Embedding Multilingual R2:Apache 2.0 开源多语言嵌入,32K 上下文 — 最佳 Sub-100M 检索质量
- NVIDIA Vera Rubin 平台如何解决 Agentic AI 的扩展问题
- vLLM x Mooncake 规模化服务 Agent 工作负载
- vLLM 登顶 Artificial Analysis 排行榜
- AIMIP 发布:AI 天气与气候模型比对项目 | Ai2
- 用AI Agent与技能将视频转化为即时可搜索、可行动的情报
- 如何实现真正的无服务器GPU
- Sub-32B 开放权重
- 近期开源权重模型发布
- 中国AI实验室内部笔记
- 蒸馏恐慌
- 我对开源模型的押注,2026年中
- AWS 上基础模型训练与推理的构建模块
- vLLM 登顶 Artificial Analysis 排行榜
- xAI将Colossus 1租给Anthropic做inference
- 用一个 Python 字典将多模态推理性能提升 >10%
- 流式 Tokens 与工具:NVIDIA Dynamo 中的多轮 Agentic Harness 支持
- 通过语法约束解码改进小型语言模型的 Bash 生成
- 服务 DeepSeek-V4:为什么百万 token 上下文是推理系统问题
- MedQA:在 AMD ROCm 上微调临床 AI,无需 CUDA
- rohitg00/从零开始的 AI 工程
- 克服奖励信号挑战:在 SageMaker AI 上使用 GRPO 进行基于可验证奖励的强化学习
- 模型量化:使用 NVIDIA Model Optimizer 进行训练后量化
- Nvidia 发布 Nemotron 3 Super 120B-A12B,throughput 突出
- NVIDIA 机器人实验室发布 GR00T、Dreams、SONIC 等成果
- DreamDojo 开源基于人类视频的机器人 world model
- EgoScale用2万小时人类第一视角视频训练灵巧手人形机器人
- SONIC:42M Transformer实现人形机器人全身控制并开源
- CaP-X开源:机器人agentic toolkit与CaP-Gym
- 用 vLLM x Mooncake 大规模服务 Agentic 工作负载
- 用 MRC(Multipath Reliable Connection)解锁大规模 AI 训练网络
- 如何用 NVIDIA 构建车载 AI agent:从云端到汽车
- MolmoAct 2:面向现实世界机器人工作的开放基础 | Ai2
- 使用 NVIDIA cuOpt Agent Skills 优化供应链决策系统
- 支撑大规模高效推理的基础研究
- Vibe 中的远程 agent,由 Mistral Medium 3.5 驱动
- [公司] Mistral AI 与 NVIDIA 合作加速开放前沿模型,作为 NVIDIA Nemotron Coalition 创始成员贡献大规模模型开发和多模态能力
- Together AI 与 Adaption 建立合作伙伴关系
- vLLM 中的 DeepSeek V4:高效长上下文 Attention
- 介绍 GPT-5.5
- NVIDIA Nemotron 3 Nano Omni:面向文档、音频和视频 agent 的长上下文多模态智能
- vLLM 中混合 SSM 模型的分离式 Serving
- 用 vLLM 运行基于 NVIDIA Nemotron 3 Nano Omni 的高效多模态 agentic AI
- NVIDIA Nemotron 3 Nano Omni 模型现可在 Amazon SageMaker JumpStart 使用
- Together AI 首日向开发者提供 NVIDIA Nemotron 3 Nano Omni
- 从 732 字节到无处可去:在生产环境中关闭 Copy Fail
- 使用 NVIDIA FLARE 实现无重构开销的联邦学习
- 使用 NVIDIA Blackwell 和 GPU 加速端点基于 DeepSeek V4 构建
- 借助 NVIDIA Megatron 推进新兴优化器以加速 LLM 训练
- 如何在 ComfyUI 中构建、运行和扩展高质量创作者工作流
- 用 NVIDIA TensorRT for RTX Runtime 加速 Unreal Engine NNE 推理
- 近期三个问题的复盘
- 为 Intelligence Age 构建计算基础设施