实録译稿 社区 24h

术语频次

封存归档

MoE

▅█▇▅ · 184 次 · 收录于 48 篇

Mixture of Experts · 混合专家 · 稀疏激活架构

  1. 为何MoE模型能从推测解码中获益更多 研究 · Cohere · 05-21
  2. transformers v5.9.0 工程 · GitHub Release · 05-20
  3. vLLM 中的弹性专家并行 工程 · vLLM · 05-20
  4. LLM架构最新进展:KV共享、mHC与压缩注意力 研究 · Sebastian Raschka · 05-17
  5. sglang v0.5.12 工程 · GitHub Release · 05-17
  6. 最新开放制品(#21):开放模型大爆发!Gemma 4、DeepSeek V4、Kimi K2.6、MiMo 2.5、GLM-5.1 等。附 CAISI V4 评估。 评测 · Interconnects · 05-17
  7. vllm v0.21.0 工程 · GitHub Release · 05-15
  8. TurboQuant 首次全面研究:精度与性能 评测 · vLLM · 05-15
  9. vLLM 登顶 Artificial Analysis 排行榜 工程 · vLLM · 05-15
  10. MinT:训练与服务百万级LLM的托管基础设施 研究 · HF Papers · 05-14
  11. 开放模型生态如何持续放大优势 研究 · Interconnects · 05-13
  12. sglang v0.5.11 工程 · GitHub Release · 05-12
  13. vllm v0.19.1 工程 · GitHub Release · 05-12
  14. transformers v5.6.2 工程 · GitHub Release · 05-12
  15. transformers v5.8.0 工程 · GitHub Release · 05-12
  16. vllm v0.20.2 工程 · GitHub Release · 05-12
  17. transformers v5.7.0 工程 · GitHub Release · 05-12
  18. Sub-32B 开放权重 产品 · Artificial Analysis · 05-12
  19. Kimi K2.6:新的领先开源权重模型 产品 · Artificial Analysis · 05-12
  20. 近期开源权重模型发布 产品 · Artificial Analysis · 05-12
  21. 中国AI实验室内部笔记 对话 · Interconnects · 05-12
  22. Import AI 456:RSI与经济增长;AI监管的激进可选性;神经计算机 研究 · Import AI · 05-12
  23. Import AI 454:自动化对齐研究;中国模型安全评估;HiFloat4 研究 · Import AI · 05-12
  24. AWS 上基础模型训练与推理的构建模块 工程 · HF Blog · 05-12
  25. vLLM 登顶 Artificial Analysis 排行榜 工程 · vLLM · 05-12
  26. TurboQuant 首次全面研究:精度与性能 研究 · vLLM · 05-12
  27. MACE-Dance:用于音乐驱动舞蹈视频生成的运动-外观级联专家 研究 · HF Papers · 05-11
  28. 服务 DeepSeek-V4:为什么百万 token 上下文是推理系统问题 工程 · Together AI · 05-09
  29. EMO:为涌现模块化预训练 Mixture of Experts | Ai2 研究 · Allen AI · 05-09
  30. EMO:为涌现模块化预训练混合专家 研究 · HF Blog · 05-09
  31. rohitg00/从零开始的 AI 工程 工程 · GitHub · 05-08
  32. 混元3架构解析:整合Apertus、DeepSeek与Qwen MoE 工程 · X · 05-07
  33. Gemma 4 架构近似前代,benchmark 明显提升 研究 · X · 05-07
  34. JackChen-me/open-multi-agent 工程 · GitHub · 05-07
  35. SpecMD:推测式专家预取的全面研究 研究 · Apple ML · 05-07
  36. 超越 SFT-to-RL:通过 Black-Box On-Policy Distillation 进行多模态 RL 的预对齐 HF Papers · 05-06
  37. 现代 LLM 中 Attention 变体的可视化指南 Sebastian Raschka · 05-03
  38. vLLM 中的 DeepSeek V4:高效长上下文 Attention vLLM · 05-03
  39. vLLM 中 FP8 KV-Cache 与 Attention 量化的现状 工程 · vLLM · 05-03
  40. moonshotai/Kimi-K2.6 产品 · Kimi · 05-03
  41. NVIDIA Nemotron 3 Nano Omni:面向文档、音频和视频 agent 的长上下文多模态智能 HF Blog · 05-03
  42. deepseek-ai/DeepSeek-V4-Pro 产品 · DeepSeek · 05-03
  43. deepseek-ai/DeepSeek-V4-Flash 产品 · DeepSeek · 05-03
  44. 用 vLLM 运行基于 NVIDIA Nemotron 3 Nano Omni 的高效多模态 agentic AI vLLM · 05-03
  45. NVIDIA Nemotron 3 Nano Omni 模型现可在 Amazon SageMaker JumpStart 使用 AWS ML · 05-03
  46. Together AI 首日向开发者提供 NVIDIA Nemotron 3 Nano Omni 产品 · Together AI · 05-03
  47. DeepSeek-V4 Pro 现已在 Together AI 上可用 Together AI · 05-03
  48. 扭转 TIDE:Diffusion 大语言模型的跨架构蒸馏 HF Papers · 04-30