録实録译稿议社区 24h

词术语频次

历封存归档

Gemma 4

▂▃█▁ · 107 次 · 收录于 27 篇

Google 开源权重模型系列

腾讯发布Hy-MT2系列翻译模型，30B-A3B版本在DomainMTBench超越DeepSeek-V4-Pro 产品 · X · 05-22
transformers v5.9.0 工程 · GitHub Release · 05-20
五分钟看懂LLM过去六个月评测 · Simon Willison · 05-19
LLM架构最新进展：KV共享、mHC与压缩注意力研究 · Sebastian Raschka · 05-17
sglang v0.5.12 工程 · GitHub Release · 05-17
最新开放制品（#21）：开放模型大爆发！Gemma 4、DeepSeek V4、Kimi K2.6、MiMo 2.5、GLM-5.1 等。附 CAISI V4 评估。评测 · Interconnects · 05-17
从Gemma 4到DeepSeek V4：LLM长上下文效率优化技术导览研究 · X · 05-17
特斯拉 AI5 芯片流片成功，带宽接近 MacStudio M2 Ultra 产品 · X · 05-15
vllm v0.21.0 工程 · GitHub Release · 05-15
sglang v0.5.11 工程 · GitHub Release · 05-12
vllm v0.19.1 工程 · GitHub Release · 05-12
transformers v5.8.0 工程 · GitHub Release · 05-12
Sub-32B 开放权重产品 · Artificial Analysis · 05-12
近期开源权重模型发布产品 · Artificial Analysis · 05-12
我一直在做的事：ATOM报告、后训练课程、完成书籍与持续研究研究 · Interconnects · 05-12
我对开源模型的押注，2026年中研究 · Interconnects · 05-12
Import AI 456：RSI与经济增长；AI监管的激进可选性；神经计算机研究 · Import AI · 05-12
Qwen3.6-35B-A3B多项benchmark显示Agent能力提升研究 · X · 05-07
Google 发布 Gemma 4 专用 draft model，推测解码最高提速 3.1x 产品 · X · 05-07
Gemma 4 架构近似前代，benchmark 明显提升研究 · X · 05-07
介绍用 Gemma 4 26B 和 Pi 本地运行 coding agent 工程 · X · 05-07
Gemma 4 MTP drafters 发布，零质量损失提速最高 3x 产品 · X · 05-07
JackChen-me/open-multi-agent 工程 · GitHub · 05-07
Qwen3.6-27B-FP8 产品 · Qwen · 05-03
Qwen3.6-27B 产品 · Qwen · 05-03
vLLM 中的 DeepSeek V4：高效长上下文 Attention vLLM · 05-03
用 vLLM 运行基于 NVIDIA Nemotron 3 Nano Omni 的高效多模态 agentic AI vLLM · 05-03