词
历Gemma 4
Google 开源权重模型系列
- 腾讯发布Hy-MT2系列翻译模型,30B-A3B版本在DomainMTBench超越DeepSeek-V4-Pro
- transformers v5.9.0
- 五分钟看懂LLM过去六个月
- LLM架构最新进展:KV共享、mHC与压缩注意力
- sglang v0.5.12
- 最新开放制品(#21):开放模型大爆发!Gemma 4、DeepSeek V4、Kimi K2.6、MiMo 2.5、GLM-5.1 等。附 CAISI V4 评估。
- 从Gemma 4到DeepSeek V4:LLM长上下文效率优化技术导览
- 特斯拉 AI5 芯片流片成功,带宽接近 MacStudio M2 Ultra
- vllm v0.21.0
- sglang v0.5.11
- vllm v0.19.1
- transformers v5.8.0
- Sub-32B 开放权重
- 近期开源权重模型发布
- 我一直在做的事:ATOM报告、后训练课程、完成书籍与持续研究
- 我对开源模型的押注,2026年中
- Import AI 456:RSI与经济增长;AI监管的激进可选性;神经计算机
- Qwen3.6-35B-A3B多项benchmark显示Agent能力提升
- Google 发布 Gemma 4 专用 draft model,推测解码最高提速 3.1x
- Gemma 4 架构近似前代,benchmark 明显提升
- 介绍用 Gemma 4 26B 和 Pi 本地运行 coding agent
- Gemma 4 MTP drafters 发布,零质量损失提速最高 3x
- JackChen-me/open-multi-agent
- Qwen3.6-27B-FP8
- Qwen3.6-27B
- vLLM 中的 DeepSeek V4:高效长上下文 Attention
- 用 vLLM 运行基于 NVIDIA Nemotron 3 Nano Omni 的高效多模态 agentic AI