词
历DeepSeek-R1
DeepSeek 首个开源推理类模型
- vllm v0.21.0
- 印度发布 Sarvam 30B 和 105B 开源推理模型,105B 采用 DeepSeek 风格 MLA 注意力
- transformers v5.7.0
- DeepSeek 携 V4 Pro 与 V4 Flash 重返领先开源权重模型行列
- nidhinjs/prompt-master
- 克服奖励信号挑战:在 SageMaker AI 上使用 GRPO 进行基于可验证奖励的强化学习
- 支撑大规模高效推理的基础研究
- Together AI 与 Adaption 建立合作伙伴关系
- 用分布感知 speculative decoding 将 RL rollouts 加速最高 50%
- Together AI 首日向开发者提供 NVIDIA Nemotron 3 Nano Omni
- DeepSeek-V4 Pro 现已在 Together AI 上可用
- 从 732 字节到无处可去:在生产环境中关闭 Copy Fail
- 无冲突的容量:面向 AI-native 团队的多租户 GPU 集群设计指南