实録译稿 社区 24h

术语频次

封存归档

Gemma 4

▂▃█▁ · 107 次 · 收录于 27 篇

Google 开源权重模型系列

  1. 腾讯发布Hy-MT2系列翻译模型,30B-A3B版本在DomainMTBench超越DeepSeek-V4-Pro 产品 · X · 05-22
  2. transformers v5.9.0 工程 · GitHub Release · 05-20
  3. 五分钟看懂LLM过去六个月 评测 · Simon Willison · 05-19
  4. LLM架构最新进展:KV共享、mHC与压缩注意力 研究 · Sebastian Raschka · 05-17
  5. sglang v0.5.12 工程 · GitHub Release · 05-17
  6. 最新开放制品(#21):开放模型大爆发!Gemma 4、DeepSeek V4、Kimi K2.6、MiMo 2.5、GLM-5.1 等。附 CAISI V4 评估。 评测 · Interconnects · 05-17
  7. 从Gemma 4到DeepSeek V4:LLM长上下文效率优化技术导览 研究 · X · 05-17
  8. 特斯拉 AI5 芯片流片成功,带宽接近 MacStudio M2 Ultra 产品 · X · 05-15
  9. vllm v0.21.0 工程 · GitHub Release · 05-15
  10. sglang v0.5.11 工程 · GitHub Release · 05-12
  11. vllm v0.19.1 工程 · GitHub Release · 05-12
  12. transformers v5.8.0 工程 · GitHub Release · 05-12
  13. Sub-32B 开放权重 产品 · Artificial Analysis · 05-12
  14. 近期开源权重模型发布 产品 · Artificial Analysis · 05-12
  15. 我一直在做的事:ATOM报告、后训练课程、完成书籍与持续研究 研究 · Interconnects · 05-12
  16. 我对开源模型的押注,2026年中 研究 · Interconnects · 05-12
  17. Import AI 456:RSI与经济增长;AI监管的激进可选性;神经计算机 研究 · Import AI · 05-12
  18. Qwen3.6-35B-A3B多项benchmark显示Agent能力提升 研究 · X · 05-07
  19. Google 发布 Gemma 4 专用 draft model,推测解码最高提速 3.1x 产品 · X · 05-07
  20. Gemma 4 架构近似前代,benchmark 明显提升 研究 · X · 05-07
  21. 介绍用 Gemma 4 26B 和 Pi 本地运行 coding agent 工程 · X · 05-07
  22. Gemma 4 MTP drafters 发布,零质量损失提速最高 3x 产品 · X · 05-07
  23. JackChen-me/open-multi-agent 工程 · GitHub · 05-07
  24. Qwen3.6-27B-FP8 产品 · Qwen · 05-03
  25. Qwen3.6-27B 产品 · Qwen · 05-03
  26. vLLM 中的 DeepSeek V4:高效长上下文 Attention vLLM · 05-03
  27. 用 vLLM 运行基于 NVIDIA Nemotron 3 Nano Omni 的高效多模态 agentic AI vLLM · 05-03