録实録译稿议社区 24h

词术语频次

历封存归档

DeepSeek-R1

█▂▂ · 51 次 · 收录于 13 篇

DeepSeek 首个开源推理类模型

vllm v0.21.0 工程 · GitHub Release · 05-15
印度发布 Sarvam 30B 和 105B 开源推理模型，105B 采用 DeepSeek 风格 MLA 注意力研究 · X · 05-13
transformers v5.7.0 工程 · GitHub Release · 05-12
DeepSeek 携 V4 Pro 与 V4 Flash 重返领先开源权重模型行列产品 · Artificial Analysis · 05-12
nidhinjs/prompt-master 工程 · GitHub · 05-08
克服奖励信号挑战：在 SageMaker AI 上使用 GRPO 进行基于可验证奖励的强化学习工程 · AWS ML · 05-08
支撑大规模高效推理的基础研究 Together AI · 05-05
Together AI 与 Adaption 建立合作伙伴关系 Together AI · 05-03
用分布感知 speculative decoding 将 RL rollouts 加速最高 50% Together AI · 05-03
Together AI 首日向开发者提供 NVIDIA Nemotron 3 Nano Omni 产品 · Together AI · 05-03
DeepSeek-V4 Pro 现已在 Together AI 上可用 Together AI · 05-03
从 732 字节到无处可去：在生产环境中关闭 Copy Fail 工程 · Together AI · 05-03
无冲突的容量：面向 AI-native 团队的多租户 GPU 集群设计指南 Together AI · 05-03

更新于五月二十五日 09:40