録实録译稿议社区 24h

词术语频次

历封存归档

DeepSeek-V3

▇▃█▂ · 90 次 · 收录于 27 篇

DeepSeek 第三代开源大模型 · MoE 架构

vLLM x Novita AI：PegaFlow 实现生产级外部 KV 缓存工程 · vLLM · 05-20
开放Agent排行榜评测 · HF Blog · 05-18
LLM架构最新进展：KV共享、mHC与压缩注意力研究 · Sebastian Raschka · 05-17
sglang v0.5.12 工程 · GitHub Release · 05-17
vLLM 登顶 Artificial Analysis 排行榜工程 · vLLM · 05-15
开放模型生态如何持续放大优势研究 · Interconnects · 05-13
sglang v0.5.11 工程 · GitHub Release · 05-12
transformers v5.8.0 工程 · GitHub Release · 05-12
DeepSeek 携 V4 Pro 与 V4 Flash 重返领先开源权重模型行列产品 · Artificial Analysis · 05-12
近期开源权重模型发布产品 · Artificial Analysis · 05-12
Import AI 454：自动化对齐研究；中国模型安全评估；HiFloat4 研究 · Import AI · 05-12
vLLM 登顶 Artificial Analysis 排行榜工程 · vLLM · 05-12
服务 DeepSeek-V4：为什么百万 token 上下文是推理系统问题工程 · Together AI · 05-09
rohitg00/从零开始的 AI 工程工程 · GitHub · 05-08
混元3架构解析：整合Apertus、DeepSeek与Qwen MoE 工程 · X · 05-07
HKUDS/Vibe-Trading 工程 · GitHub · 05-07
JackChen-me/open-multi-agent 工程 · GitHub · 05-07
Together AI 与 Adaption 建立合作伙伴关系 Together AI · 05-03
现代 LLM 中 Attention 变体的可视化指南 Sebastian Raschka · 05-03
vLLM 中的 DeepSeek V4：高效长上下文 Attention vLLM · 05-03
vLLM 中 FP8 KV-Cache 与 Attention 量化的现状工程 · vLLM · 05-03
moonshotai/Kimi-K2.6 产品 · Kimi · 05-03
deepseek-ai/DeepSeek-V4-Pro 产品 · DeepSeek · 05-03
deepseek-ai/DeepSeek-V4-Flash 产品 · DeepSeek · 05-03
Together AI 首日向开发者提供 NVIDIA Nemotron 3 Nano Omni 产品 · Together AI · 05-03
DeepSeek-V4 Pro 现已在 Together AI 上可用 Together AI · 05-03
从 732 字节到无处可去：在生产环境中关闭 Copy Fail 工程 · Together AI · 05-03