实録译稿 社区 24h

术语频次

封存归档

DeepSeek-V3

▇▃█▂ · 90 次 · 收录于 27 篇

DeepSeek 第三代开源大模型 · MoE 架构

  1. vLLM x Novita AI:PegaFlow 实现生产级外部 KV 缓存 工程 · vLLM · 05-20
  2. 开放Agent排行榜 评测 · HF Blog · 05-18
  3. LLM架构最新进展:KV共享、mHC与压缩注意力 研究 · Sebastian Raschka · 05-17
  4. sglang v0.5.12 工程 · GitHub Release · 05-17
  5. vLLM 登顶 Artificial Analysis 排行榜 工程 · vLLM · 05-15
  6. 开放模型生态如何持续放大优势 研究 · Interconnects · 05-13
  7. sglang v0.5.11 工程 · GitHub Release · 05-12
  8. transformers v5.8.0 工程 · GitHub Release · 05-12
  9. DeepSeek 携 V4 Pro 与 V4 Flash 重返领先开源权重模型行列 产品 · Artificial Analysis · 05-12
  10. 近期开源权重模型发布 产品 · Artificial Analysis · 05-12
  11. Import AI 454:自动化对齐研究;中国模型安全评估;HiFloat4 研究 · Import AI · 05-12
  12. vLLM 登顶 Artificial Analysis 排行榜 工程 · vLLM · 05-12
  13. 服务 DeepSeek-V4:为什么百万 token 上下文是推理系统问题 工程 · Together AI · 05-09
  14. rohitg00/从零开始的 AI 工程 工程 · GitHub · 05-08
  15. 混元3架构解析:整合Apertus、DeepSeek与Qwen MoE 工程 · X · 05-07
  16. HKUDS/Vibe-Trading 工程 · GitHub · 05-07
  17. JackChen-me/open-multi-agent 工程 · GitHub · 05-07
  18. Together AI 与 Adaption 建立合作伙伴关系 Together AI · 05-03
  19. 现代 LLM 中 Attention 变体的可视化指南 Sebastian Raschka · 05-03
  20. vLLM 中的 DeepSeek V4:高效长上下文 Attention vLLM · 05-03
  21. vLLM 中 FP8 KV-Cache 与 Attention 量化的现状 工程 · vLLM · 05-03
  22. moonshotai/Kimi-K2.6 产品 · Kimi · 05-03
  23. deepseek-ai/DeepSeek-V4-Pro 产品 · DeepSeek · 05-03
  24. deepseek-ai/DeepSeek-V4-Flash 产品 · DeepSeek · 05-03
  25. Together AI 首日向开发者提供 NVIDIA Nemotron 3 Nano Omni 产品 · Together AI · 05-03
  26. DeepSeek-V4 Pro 现已在 Together AI 上可用 Together AI · 05-03
  27. 从 732 字节到无处可去:在生产环境中关闭 Copy Fail 工程 · Together AI · 05-03