实録译稿 社区 24h

术语频次

封存归档

DeepSeek-V4

█▃▅ · 248 次 · 收录于 33 篇

DeepSeek第四代模型系列

  1. LLM架构最新进展:KV共享、mHC与压缩注意力 研究 · Sebastian Raschka · 05-17
  2. sglang v0.5.12 工程 · GitHub Release · 05-17
  3. 最新开放制品(#21):开放模型大爆发!Gemma 4、DeepSeek V4、Kimi K2.6、MiMo 2.5、GLM-5.1 等。附 CAISI V4 评估。 评测 · Interconnects · 05-17
  4. 从Gemma 4到DeepSeek V4:LLM长上下文效率优化技术导览 研究 · X · 05-17
  5. vllm v0.21.0 工程 · GitHub Release · 05-15
  6. vLLM 登顶 Artificial Analysis 排行榜 工程 · vLLM · 05-15
  7. 印度发布 Sarvam 30B 和 105B 开源推理模型,105B 采用 DeepSeek 风格 MLA 注意力 研究 · X · 05-13
  8. transformers v5.8.0 工程 · GitHub Release · 05-12
  9. vllm v0.20.2 工程 · GitHub Release · 05-12
  10. DeepSeek 携 V4 Pro 与 V4 Flash 重返领先开源权重模型行列 产品 · Artificial Analysis · 05-12
  11. 近期开源权重模型发布 产品 · Artificial Analysis · 05-12
  12. vLLM 登顶 Artificial Analysis 排行榜 工程 · vLLM · 05-12
  13. 服务 DeepSeek-V4:为什么百万 token 上下文是推理系统问题 工程 · Together AI · 05-09
  14. DeepSeek-V4 测试新增 SillyTavern 工程能力评测 研究 · X · 05-07
  15. DeepSeek-V4-Pro与Flash大象牙膏测试优于V3但指令遵循存疑 研究 · X · 05-07
  16. DeepSeek-V4需回传空reasoning_content以避免400 工程 · X · 05-07
  17. 综述梳理 MOPD 在近期 LLM 后训练中的应用 研究 · X · 05-07
  18. llm-echo 0.5a0 工程 · Simon Willison · 05-06
  19. datasette-llm 0.1a7 工程 · Simon Willison · 05-06
  20. 引用 John Gruber Simon Willison · 05-05
  21. 现代 LLM 中 Attention 变体的可视化指南 Sebastian Raschka · 05-03
  22. vLLM 中的 DeepSeek V4:高效长上下文 Attention vLLM · 05-03
  23. vLLM 中 FP8 KV-Cache 与 Attention 量化的现状 工程 · vLLM · 05-03
  24. deepseek-ai/DeepSeek-V4-Flash-Base 产品 · DeepSeek · 05-03
  25. DeepInfra 登陆 Hugging Face 推理服务提供商 🔥 产品 · HF Blog · 05-03
  26. deepseek-ai/DeepSeek-V4-Pro 产品 · DeepSeek · 05-03
  27. vLLM 中混合 SSM 模型的分离式 Serving vLLM · 05-03
  28. deepseek-ai/DeepSeek-V4-Pro-Base 产品 · DeepSeek · 05-03
  29. deepseek-ai/DeepSeek-V4-Flash 产品 · DeepSeek · 05-03
  30. 用 vLLM 运行基于 NVIDIA Nemotron 3 Nano Omni 的高效多模态 agentic AI vLLM · 05-03
  31. DeepSeek-V4 Pro 现已在 Together AI 上可用 Together AI · 05-03
  32. 使用 NVIDIA Blackwell 和 GPU 加速端点基于 DeepSeek V4 构建 NVIDIA Developer · 05-03
  33. DeepSeek-V4:agent 真能用的百万 token 上下文 HF Blog · 05-03