Artificial Analysis · 评测

OpenBMB 发布 MiniCPM-V 4.6 1.3B Instruct

OpenBMB launches MiniCPM-V 4.6 1.3B Instruct

二〇二六年五月十二日 · 英文原文

摘要

OpenBMB（清华大学与ModelBest于2022年共同创立）发布MiniCPM-V 4.6 1.3B Instruct，一款1.3B参数的密集视觉语言模型，支持文本、图像和视频输入。该模型在Artificial Analysis Intelligence Index上得分为13，是2B参数以下开放权重模型中最高分，在MMMU-Pro上得分为38%，同样居2B以下模型之首。运行Index仅需540万输出token，比Qwen3.5 0.8B（非推理）少约19倍。模型权重以Apache 2.0许可证发布在Hugging Face上。

OpenBMB（清华大学 / ModelBest 开放权重合作项目）发布 MiniCPM-V 4.6 1.3B Instruct，一款在 Artificial Analysis Intelligence Index 上得分为 13 的微型非推理模型

该模型在 Intelligence Index 上领先 Qwen3.5 0.8B（非推理，10 分）3 分，落后 Qwen3.5 2B（非推理，15 分）2 分，在我们的 Intelligence vs. Total Parameters 图表上建立了一个新的帕累托最优（Pareto-optimal）点。微型模型适用于高效推理和端侧（on-device）应用场景。

MiniCPM-V 4.6 1.3B Instruct 是一个视觉语言模型（vision-language model），支持文本、图像和视频输入，输出文本。OpenBMB 是一个中国实验室，由清华大学 NLP 实验室和 ModelBest Inc. 于 2022 年共同创立。

该模型的权重已在 Hugging Face 上以 Apache 2.0 许可证发布。

关键结果：

➤ 在 1.3B 参数规模下，MiniCPM-V 4.6 1.3B Instruct 在 Artificial Analysis Intelligence Index 上得分为 13，是 2B 参数以下所有开放权重模型中得分最高的。 同等规模下次智能的开放权重模型是 Qwen3.5 0.8B（推理，11 分），其运行 Intelligence Index 所需的 token 数量是前者的 43 倍；Qwen3.5 2B 得分为 16（推理）和 15（非推理），但参数数量是前者的 1.7 倍（2.27B）。MiniCPM-V 4.6 1.3B Instruct 在 MMMU-Pro 上也位居 2B 以下开放权重模型之首，得分为 38%。

➤ MiniCPM-V 4.6 1.3B Instruct 扩展了 Intelligence vs. Total Parameters 的开放权重帕累托前沿（Pareto frontier）。 由于该模型是密集模型（dense model），总参数和活跃参数数量均为 1.3B，因此它同时推进了两个前沿。次智能的 2B 以下模型（Qwen3.5 0.8B（推理），11 分）落后 2 分，尽管它也使用了推理模式。

➤ MiniCPM-V 4.6 1.3B Instruct 具有极高的 token 效率，运行 Intelligence Index 仅使用了 540 万个输出 token，比 Qwen3.5 0.8B（非推理，1.01 亿）少约 19 倍，比 Qwen3.5 0.8B（推理，2.33 亿）少约 43 倍。这是在 Index 上得分达到 10 或以上的 4B 总参数以下开放权重模型中，测得的输出 token 数量最低的（次低的是 Ministral 3 3B，为 1550 万）。

➤ MiniCPM-V 4.6 1.3B Instruct 支持原生多模态输入，包括文本、图像和视频，在 MMMU-Pro 上得分为 38%。 这是 2B 参数以下所有开放权重模型中测得的最高视觉推理得分，领先于 LFM2.5-VL-1.6B（27%）和 Qwen3.5 0.8B（非推理，26%）。在此参数规模下支持视频输入并不常见。

➤ 知识召回能力较低，与其他 2B 以下模型一致。 AA-Omniscience 得分为 -85，处于 2B 以下非推理模型的典型范围（Qwen3.5 0.8B（非推理）为 -89，Exaone 4.0 1.2B（非推理）为 -83），落后于 Qwen3.5 2B（非推理）的 -83（参数数量是其 1.7 倍）2 分。

其他模型细节：

➤ 规模： 1.3B 总参数（密集模型）

➤ 上下文窗口： 262K

➤ 精度： BF16

➤ 许可证： Apache 2.0

➤ 提供商： 发布时无确认的提供商

MiniCPM-V 4.6 1.3B Instruct 在 2B 以下规模，同时扩展了 Intelligence vs. Total Parameters 和 Intelligence vs. Active Parameters 的开放权重帕累托前沿。

MiniCPM-V 4.6 1.3B Instruct 具有极高的 token 效率， 运行 Artificial Analysis Intelligence Index 仅使用了 540 万个输出 token，这是在 Intelligence Index 上得分达到 10 或以上的 4B 以下开放权重模型中，测得的输出 token 数量最低的。

MiniCPM-V 4.6 1.3B Instruct 在知识召回和幻觉避免方面表现出弱点。 其 AA-Omniscience 得分为 -85，与其他 2B 以下非推理模型处于同一范围（Qwen3.5 0.8B（非推理）为 -89，Exaone 4.0 1.2B（非推理）为 -83）。

Intelligence Index 和 MMMU-Pro 的完整结果：

译自 Artificial Analysis · 评测 · 录于二〇二六年五月十二日