一声棒喝,本不立文字
偏要著録,已是二义

Artificial Analysis · 评测

OpenBMB 发布 MiniCPM-V 4.6 1.3B Instruct

OpenBMB launches MiniCPM-V 4.6 1.3B Instruct

二〇二六年五月十二日 · 英文原文

OpenBMB(清华大学与ModelBest于2022年共同创立)发布MiniCPM-V 4.6 1.3B Instruct,一款1.3B参数的密集视觉语言模型,支持文本、图像和视频输入。该模型在Artificial Analysis Intelligence Index上得分为13,是2B参数以下开放权重模型中最高分,在MMMU-Pro上得分为38%,同样居2B以下模型之首。运行Index仅需540万输出token,比Qwen3.5 0.8B(非推理)少约19倍。模型权重以Apache 2.0许可证发布在Hugging Face上。

OpenBMB(清华大学 / ModelBest 开放权重合作项目)发布 MiniCPM-V 4.6 1.3B Instruct,一款在 Artificial Analysis Intelligence Index 上得分为 13 的微型非推理模型

该模型在 Intelligence Index 上领先 Qwen3.5 0.8B(非推理,10 分)3 分,落后 Qwen3.5 2B(非推理,15 分)2 分,在我们的 Intelligence vs. Total Parameters 图表上建立了一个新的帕累托最优(Pareto-optimal)点。微型模型适用于高效推理和端侧(on-device)应用场景。

MiniCPM-V 4.6 1.3B Instruct 是一个视觉语言模型(vision-language model),支持文本、图像和视频输入,输出文本。OpenBMB 是一个中国实验室,由清华大学 NLP 实验室和 ModelBest Inc. 于 2022 年共同创立。

该模型的权重已在 Hugging Face 上以 Apache 2.0 许可证发布。

关键结果:

在 1.3B 参数规模下,MiniCPM-V 4.6 1.3B Instruct 在 Artificial Analysis Intelligence Index 上得分为 13,是 2B 参数以下所有开放权重模型中得分最高的。 同等规模下次智能的开放权重模型是 Qwen3.5 0.8B(推理,11 分),其运行 Intelligence Index 所需的 token 数量是前者的 43 倍;Qwen3.5 2B 得分为 16(推理)和 15(非推理),但参数数量是前者的 1.7 倍(2.27B)。MiniCPM-V 4.6 1.3B Instruct 在 MMMU-Pro 上也位居 2B 以下开放权重模型之首,得分为 38%。

MiniCPM-V 4.6 1.3B Instruct 扩展了 Intelligence vs. Total Parameters 的开放权重帕累托前沿(Pareto frontier)。 由于该模型是密集模型(dense model),总参数和活跃参数数量均为 1.3B,因此它同时推进了两个前沿。次智能的 2B 以下模型(Qwen3.5 0.8B(推理),11 分)落后 2 分,尽管它也使用了推理模式。

MiniCPM-V 4.6 1.3B Instruct 具有极高的 token 效率,运行 Intelligence Index 仅使用了 540 万个输出 token,比 Qwen3.5 0.8B(非推理,1.01 亿)少约 19 倍,比 Qwen3.5 0.8B(推理,2.33 亿)少约 43 倍。 这是在 Index 上得分达到 10 或以上的 4B 总参数以下开放权重模型中,测得的输出 token 数量最低的(次低的是 Ministral 3 3B,为 1550 万)。

MiniCPM-V 4.6 1.3B Instruct 支持原生多模态输入,包括文本、图像和视频,在 MMMU-Pro 上得分为 38%。 这是 2B 参数以下所有开放权重模型中测得的最高视觉推理得分,领先于 LFM2.5-VL-1.6B(27%)和 Qwen3.5 0.8B(非推理,26%)。在此参数规模下支持视频输入并不常见。

知识召回能力较低,与其他 2B 以下模型一致。 AA-Omniscience 得分为 -85,处于 2B 以下非推理模型的典型范围(Qwen3.5 0.8B(非推理)为 -89,Exaone 4.0 1.2B(非推理)为 -83),落后于 Qwen3.5 2B(非推理)的 -83(参数数量是其 1.7 倍)2 分。

其他模型细节:

规模: 1.3B 总参数(密集模型)

上下文窗口: 262K

精度: BF16

许可证: Apache 2.0

提供商: 发布时无确认的提供商

Image 1

MiniCPM-V 4.6 1.3B Instruct 在 2B 以下规模,同时扩展了 Intelligence vs. Total Parameters 和 Intelligence vs. Active Parameters 的开放权重帕累托前沿。

Image 2

MiniCPM-V 4.6 1.3B Instruct 具有极高的 token 效率, 运行 Artificial Analysis Intelligence Index 仅使用了 540 万个输出 token,这是在 Intelligence Index 上得分达到 10 或以上的 4B 以下开放权重模型中,测得的输出 token 数量最低的。

Image 3

MiniCPM-V 4.6 1.3B Instruct 在知识召回和幻觉避免方面表现出弱点。 其 AA-Omniscience 得分为 -85,与其他 2B 以下非推理模型处于同一范围(Qwen3.5 0.8B(非推理)为 -89,Exaone 4.0 1.2B(非推理)为 -83)。

Image 4

Intelligence Index 和 MMMU-Pro 的完整结果:

Image 5

译自 Artificial Analysis · 评测 · 录于 二〇二六年五月十二日