词
历DeepSeek-V4
DeepSeek第四代模型系列
- LLM架构最新进展:KV共享、mHC与压缩注意力
- sglang v0.5.12
- 最新开放制品(#21):开放模型大爆发!Gemma 4、DeepSeek V4、Kimi K2.6、MiMo 2.5、GLM-5.1 等。附 CAISI V4 评估。
- 从Gemma 4到DeepSeek V4:LLM长上下文效率优化技术导览
- vllm v0.21.0
- vLLM 登顶 Artificial Analysis 排行榜
- 印度发布 Sarvam 30B 和 105B 开源推理模型,105B 采用 DeepSeek 风格 MLA 注意力
- transformers v5.8.0
- vllm v0.20.2
- DeepSeek 携 V4 Pro 与 V4 Flash 重返领先开源权重模型行列
- 近期开源权重模型发布
- vLLM 登顶 Artificial Analysis 排行榜
- 服务 DeepSeek-V4:为什么百万 token 上下文是推理系统问题
- DeepSeek-V4 测试新增 SillyTavern 工程能力评测
- DeepSeek-V4-Pro与Flash大象牙膏测试优于V3但指令遵循存疑
- DeepSeek-V4需回传空reasoning_content以避免400
- 综述梳理 MOPD 在近期 LLM 后训练中的应用
- llm-echo 0.5a0
- datasette-llm 0.1a7
- 引用 John Gruber
- 现代 LLM 中 Attention 变体的可视化指南
- vLLM 中的 DeepSeek V4:高效长上下文 Attention
- vLLM 中 FP8 KV-Cache 与 Attention 量化的现状
- deepseek-ai/DeepSeek-V4-Flash-Base
- DeepInfra 登陆 Hugging Face 推理服务提供商 🔥
- deepseek-ai/DeepSeek-V4-Pro
- vLLM 中混合 SSM 模型的分离式 Serving
- deepseek-ai/DeepSeek-V4-Pro-Base
- deepseek-ai/DeepSeek-V4-Flash
- 用 vLLM 运行基于 NVIDIA Nemotron 3 Nano Omni 的高效多模态 agentic AI
- DeepSeek-V4 Pro 现已在 Together AI 上可用
- 使用 NVIDIA Blackwell 和 GPU 加速端点基于 DeepSeek V4 构建
- DeepSeek-V4:agent 真能用的百万 token 上下文