録实録译稿议社区 24h

词术语频次

历封存归档

DeepSeek-V4

█▃▅ · 248 次 · 收录于 33 篇

DeepSeek第四代模型系列

LLM架构最新进展：KV共享、mHC与压缩注意力研究 · Sebastian Raschka · 05-17
sglang v0.5.12 工程 · GitHub Release · 05-17
最新开放制品（#21）：开放模型大爆发！Gemma 4、DeepSeek V4、Kimi K2.6、MiMo 2.5、GLM-5.1 等。附 CAISI V4 评估。评测 · Interconnects · 05-17
从Gemma 4到DeepSeek V4：LLM长上下文效率优化技术导览研究 · X · 05-17
vllm v0.21.0 工程 · GitHub Release · 05-15
vLLM 登顶 Artificial Analysis 排行榜工程 · vLLM · 05-15
印度发布 Sarvam 30B 和 105B 开源推理模型，105B 采用 DeepSeek 风格 MLA 注意力研究 · X · 05-13
transformers v5.8.0 工程 · GitHub Release · 05-12
vllm v0.20.2 工程 · GitHub Release · 05-12
DeepSeek 携 V4 Pro 与 V4 Flash 重返领先开源权重模型行列产品 · Artificial Analysis · 05-12
近期开源权重模型发布产品 · Artificial Analysis · 05-12
vLLM 登顶 Artificial Analysis 排行榜工程 · vLLM · 05-12
服务 DeepSeek-V4：为什么百万 token 上下文是推理系统问题工程 · Together AI · 05-09
DeepSeek-V4 测试新增 SillyTavern 工程能力评测研究 · X · 05-07
DeepSeek-V4-Pro与Flash大象牙膏测试优于V3但指令遵循存疑研究 · X · 05-07
DeepSeek-V4需回传空reasoning_content以避免400 工程 · X · 05-07
综述梳理 MOPD 在近期 LLM 后训练中的应用研究 · X · 05-07
llm-echo 0.5a0 工程 · Simon Willison · 05-06
datasette-llm 0.1a7 工程 · Simon Willison · 05-06
引用 John Gruber Simon Willison · 05-05
现代 LLM 中 Attention 变体的可视化指南 Sebastian Raschka · 05-03
vLLM 中的 DeepSeek V4：高效长上下文 Attention vLLM · 05-03
vLLM 中 FP8 KV-Cache 与 Attention 量化的现状工程 · vLLM · 05-03
deepseek-ai/DeepSeek-V4-Flash-Base 产品 · DeepSeek · 05-03
DeepInfra 登陆 Hugging Face 推理服务提供商 🔥 产品 · HF Blog · 05-03
deepseek-ai/DeepSeek-V4-Pro 产品 · DeepSeek · 05-03
vLLM 中混合 SSM 模型的分离式 Serving vLLM · 05-03
deepseek-ai/DeepSeek-V4-Pro-Base 产品 · DeepSeek · 05-03
deepseek-ai/DeepSeek-V4-Flash 产品 · DeepSeek · 05-03
用 vLLM 运行基于 NVIDIA Nemotron 3 Nano Omni 的高效多模态 agentic AI vLLM · 05-03
DeepSeek-V4 Pro 现已在 Together AI 上可用 Together AI · 05-03
使用 NVIDIA Blackwell 和 GPU 加速端点基于 DeepSeek V4 构建 NVIDIA Developer · 05-03
DeepSeek-V4：agent 真能用的百万 token 上下文 HF Blog · 05-03