OlmoEarth v1.1:更高效的模型系列 | Ai2
OlmoEarth v1.1: A more efficient family of models | Ai2
Ai2于2026年5月19日发布OlmoEarth v1.1,该模型系列通过将Sentinel-2影像中多个分辨率的token合并为单个token,将token序列长度缩减至原来的三分之一,从而将计算成本降低多达3倍,同时在与合作伙伴共同构建的研究基准和任务组合上保持v1性能。模型提供Base、Tiny、Nano三种规模,权重与训练代码已在Hugging Face和GitHub开源。
2026年5月19日
Gabriel Tseng - Ai2
我们在2025年11月发布了OlmoEarth (v1)。自那以来,合作伙伴已将其应用于广泛的任务,从追踪红树林变化、分类森林损失驱动因素,到在数天内生成国家级作物类型地图,并将部署规模扩展到国家、大陆乃至全球范围。每一次发布都让我们更接近使命:将最先进的AI带给致力于保护人类和地球的组织与社区。
当OlmoEarth处理卫星影像以在数万至数十万平方公里范围内进行预测时,效率决定了可能性。在运行OlmoEarth的完整生命周期中——数据导出、预处理、推理和后处理——计算成本是迄今为止最高的开销。更高效的模型意味着我们可以在OlmoEarth平台上支持更多合作伙伴,也意味着任何自行运行OlmoEarth的用户都能以更低成本、更快速度利用这项技术。
正因如此,我们构建了OlmoEarth v1.1:一个新的模型系列,可将计算成本降低多达3倍,同时在与合作伙伴共同构建的研究基准和任务组合上保持OlmoEarth v1的性能。
通过缩短序列长度提升效率
OlmoEarth模型基于Transformer架构,这是当今机器学习的主流架构之一。为了处理遥感数据,我们首先将其转换为模型可以理解的_token_序列。
控制Transformer模型效率有两个重要杠杆:模型大小(这也是我们发布模型系列的原因,用户可根据计算预算选择合适的大小)和token序列长度。计算成本与token序列长度呈二次方关系,因此即使是微小的缩减也能显著降低运行模型的成本。
设计token
这引出了基于Transformer的遥感模型的一个重要问题:一个token应该代表什么?
以我们常处理的Sentinel-2影像为例。一个Sentinel-2输入是一个具有高度和宽度(H, W代表纬度和经度像素)、时间维度T以及12个Sentinel-2通道([H, W, T, D=12])的张量。
目前,我们将数据拆分为_基于分辨率的图块_。具体来说,我们会选择某个空间图块大小p,并将整个Sentinel-2图像分割成大小为p x p的图块:
对于每个图块,我们为_每个时间步、每个分辨率_创建一个token。因此,一个包含2个时间步的Sentinel-2输入,每个图块会产生6个token(2个时间步 x 3个分辨率:10m、20m和60m)。
总的来说,一个[H, W, T, D=12]的Sentinel-2输入将产生H/p x W/p x T x 3个token。
在处理Sentinel-2数据时,为每个分辨率使用独立的token是一种常见技术——Galileo和SatMAE都采用了这种方法,且SatMAE在这样做时显示出显著更好的结果。然而,这并非普遍做法:CROMA是一个仅对所有波段使用单个token的模型,无论分辨率如何。由于token数量会成倍增加,将多个分辨率合并为一个token可产生三倍更少的token,并在预训练、微调和推理中节省大量资源。
如果简单地将token合并,会导致性能显著下降,包括m-eurosat kNN(遥感模型常用基准任务)下降10个百分点。我们假设,将Sentinel-2波段分离到不同token中,使得OlmoEarth更容易建模重要的跨波段关系。
要在不影响性能的情况下合并token,我们需要修改预训练方案。我们在论文中详细描述了这些改动。
面向开发者
结果是,这个模型系列能以更少资源完成更多工作。在每种规模下,OlmoEarth v1.1的运行成本比OlmoEarth v1低三倍,使得每个运行OlmoEarth的团队都能更经济地实现频繁的全球尺度地图更新。如果你正在使用原始OlmoEarth系列的模型,请尝试OlmoEarth v1.1。它在仅需三分之一计算量的情况下提供与OlmoEarth v1相似的性能,尽管我们观察到一些退化(详情请参阅我们的技术报告)。如果它适用于你的任务,你应该会在微调和推理过程中看到显著的加速。
面向研究者
预训练的遥感模型具有许多自由度,这使得它们难以研究。当性能发生变化时,是架构、数据集还是预训练算法导致的?
我们在与OlmoEarth v1相同的数据集上训练OlmoEarth v1.1,因此两者之间的任何差异都隔离了方法论变化的影响。我们希望这能推动对遥感模型预训练科学原理的理解。
开始使用
查看OlmoEarth v1.1的权重和训练代码,包括Base、Tiny和Nano模型的权重。