一声棒喝,本不立文字
偏要著録,已是二义

Microsoft Research · 学术

MatterSim 推动材料AI:实验合成、更快模拟与多任务模型

Advancing AI for materials with MatterSim: experimental synthesis, faster simulation, and multi-task models

二〇二六年五月十二日 · 英文原文

MatterSim-v1 经高通量筛选识别四方相磷化钽(TaP)为潜在高导热材料,实验合成后测得热导率 152 W/m/K,接近硅。模型推理速度提升 3-5 倍,集成至 LAMMPS 支持多 GPU 模拟。发布 MatterSim-MT 多任务基础模型,预训练于 3500 万结构(89 元素、5000 K、1000 GPa),可预测 Bader 电荷、磁矩、Born 有效电荷等属性,用于振动光谱、铁电开关和电化学氧化还原模拟。合作方包括德克萨斯大学达拉斯分校、伊利诺伊大学厄巴纳-香槟分校和加州大学戴维斯分校。

概览

实验验证:通过使用 MatterSim-v1 进行高通量筛选,我们此前已识别出四方相磷化钽(TaP)是一种潜在的高性能导热材料。现在,我们已通过实验成功合成该材料,并测得它的热导率(152 W/m/K)接近硅的热导率。

更快的模拟:我们将 MatterSim-v1 模型推理速度提升了 3-5 倍,并将其集成到 LAMMPS 软件包中,从而能够在多个 GPU 上进行大规模模拟。

新模型发布:我们推出了 MatterSim-MT,这是一个用于计算材料表征的多任务基础模型,能够模拟超越势能面单独所能捕捉的复杂多属性现象。

材料设计支撑着从纳米电子学到半导体设计以及能源存储等广泛的技术进步。然而,新型材料的开发周期仍然缓慢且成本高昂。通用机器学习原子间势旨在通过为多种材料提供准确的稳定性和属性预测来加速材料设计过程。这些模型比传统的第一性原理模拟快数个数量级,将以前不切实际的问题变成了可在几小时内完成的常规计算。

自我们推出 MatterSim-v1 模型以来,它因其能够在包括有限温度和压力在内的真实条件下准确模拟材料的能力,而在材料科学界广受欢迎。今天,我们有几个令人兴奋的 MatterSim 更新要分享。这些更新包括对 MatterSim 关于导热体预测的实验验证、用于更快模拟的性能改进,以及推出一个用于材料表征的新型多任务基础模型。

实验验证

图 1:基于 MatterSim 的计算预测,我们合成了一种潜在的高导热材料。左图:MatterSim 预测的热导率与真实模拟和实验结果的对比(图中显示了 ±50% 的误差带作为参考)。右图:实验合成的四方相磷化钽(TaP)样品不同视角图,测得热导率为 152 W/m/K。

具有高导热性的材料在热管理中起着关键作用,可以防止过热并提高能源效率。例如,像金刚石、铜和硅这样的成熟高导热体被广泛应用于各种冷却场景。设计下一代导热体可能会推动计算、电力电子和航空航天技术的进步。然而,这需要对候选材料的热导率值进行准确预测。

在固体中,热量主要通过两种方式传递:原子振动(声子)和电子移动。声子贡献可以使用机器学习原子间势来估算,从而能够筛选数千种候选材料,在昂贵的实验验证之前将搜索空间缩小到最有希望的材料。

“MatterSim 生成了迄今为止最大的计算热导率数据库。这为探索比以往更广阔的材料空间打开了大门……”——德克萨斯大学达拉斯分校,Bing Lv 教授

我们与德克萨斯大学达拉斯分校(UT Dallas)、伊利诺伊大学厄巴纳-香槟分校以及加州大学戴维斯分校(UC Davis)合作,使用 MatterSim-v1 筛选了超过 240,000 种候选高导热材料。如图 1(左)所示,MatterSim 的预测与第一性原理模拟结果吻合良好。

加州大学戴维斯分校的 Davide Donadio 教授表示:“MatterSim 模型将准确性和计算效率结合起来,预测热导率这样敏感的属性,这让我感到惊讶。这是解锁如此大规模筛选(数十万种晶体)的关键,而使用传统方法这完全是遥不可及的。”

德克萨斯大学达拉斯分校的 Bing Lv 教授补充道:“MatterSim 生成了迄今为止最大的计算热导率数据库。这为探索比以往更广阔的材料空间打开了大门,即使在施加实际要求后,也能让学界发现更广泛的可行材料。”

“我们第一次能够在规模上检验关于什么控制热导率的传统理解……”——伊利诺伊大学厄巴纳-香槟分校,David Cahill 教授

基于这些预测,我们确定了四方相磷化钽(TaP)是一种潜在的高导热材料。我们在德克萨斯大学达拉斯分校实验合成了四方相磷化钽(TaP),并在伊利诺伊大学厄巴纳-香槟分校测量了其热导率(我们最佳样品为 152 W/m/K),接近硅的热导率。虽然我们不是第一个合成四方相 TaP 的团队,但这种材料此前从未被视为导热体。这些结果展示了 MatterSim 如何能够实现功能材料的识别:“我们第一次能够在规模上检验关于什么控制热导率的传统理解,同时能够发现新的功能材料,这些材料在质量密度、元素丰度和环境稳定性等其他重要约束条件下取得了平衡”,伊利诺伊大学厄巴纳-香槟分校的 David Cahill 教授说道。

视频系列:On Second Thought

一个与 Sinead Bovell 合作的视频系列,围绕每个人都在问的关于 AI 的问题展开。借助来自微软各领域的专家声音,我们剖析了这项快速变化的技术所带来的紧张与希望,探索正在演变的事物以及可能实现的事物。 探索该系列(在新标签页中打开)

性能改进

我们通过发布若干开源性能和可用性改进,使 MatterSim-v1 的速度显著提升。首先,我们通过结合更快的图构建、提前编译以及减少原子表示之间的转换,加速了模型推理,使得 MatterSim-v1.0.0-5M 的速度提升了 3 倍,MatterSim-v1.0.0-1M 的速度提升了 5 倍(见图 2)。为了使 MatterSim-v1 更易于使用,我们将其集成到了广泛使用的 LAMMPS 模拟软件中,使用户能够轻松地在现有工作流程中跨多个 GPU 扩展模型推理。

图 2:MatterSim-v1.0.0-5M 推理速度提升 3 倍,MatterSim-v1.0.0-1M 推理速度提升 5 倍(Python)。

新模型发布

在 MatterSim-v1 成功的基础上,今天我们通过宣布推出 MatterSim-MT 来扩展 MatterSim 模型家族:一个用于计算材料模拟和属性表征的多任务(MT)基础模型。该模型原生预测能量、力、应力以及若干重要的材料属性。MatterSim-MT 在超过 3500 万个带有第一性原理标签的结构上进行了预训练,这些结构涵盖了 89 种元素、高达 5000 K 的温度和高达 1000 GPa 的压力。它进一步针对各种属性进行了微调,包括 Bader 电荷、磁矩、Born 有效电荷和介电矩阵。

开箱即用,MatterSim-MT 可作为预测材料结构、动力学和热力学的基础模型。其多任务架构还使得能够进行一系列仅靠势能面无法捕捉的复杂模拟。准确模拟这些现象的能力对于催化和能源存储等应用至关重要。在这里,我们通过三个案例研究来说明这些多任务能力:振动光谱学、铁电开关和电化学氧化还原。每个示例都需要不同的属性预测组合。在完整手稿中,我们还展示了 MatterSim-MT 能够随着更多数据和参数良好扩展,可以高效地微调到更高理论水平,并且可以通过主动学习系统地扩展到新系统。

图 3:MatterSim-MT 的多任务预测能力使得能够模拟复杂的材料现象。(a) 展示了 MatterSim-MT 的多任务推理能力,包括从原子结构预测能量(E)、力(F)、应力(S)、磁矩(μ)、Born 有效电荷(Z∗)和介电矩阵(ε∞)。(b) 碳化硅(SiC)在高达 100 GPa 压力下的声子谱,插图中比较了 MatterSim 预测的纵向光学(LO)和横向光学(TO)分裂与实验测量结果。(c) 铁电四方相 BaTiO3 材料中极化密度随沿 z 方向电场变化的预测磁滞回线。(d) Li1.2–xMn0.8O2 在脱锂过程中氧 Bader 电荷分布的演变,箭头指示了 O2 分子的形成。

首先,我们关注振动光谱学,这是一种通过测量物质原子键自然振动方式来识别物质的技术。我们展示了 Born 有效电荷和介电属性的预测如何能够计算极性晶体中的声子谱。在这些材料中,带相反电荷的离子相互振动。根据振动方向,这可能导致电荷积累,从而产生宏观电场,将光学声子模式分裂为更高频率的纵向(LO)分支和更低频率的横向(TO)分支。作为一个案例研究,我们在极端压力下模拟了 3c-碳化硅(3c-SiC)中的这种行为,这是一种用于高功率电子学的材料。如图 3(b) 所示,MatterSim-MT 预测的 Born 有效电荷与理论和实验值都非常吻合。由此产生的 LO-TO 分裂为 5.26 THz,与从头计算仅偏差 0.06 THz,与实验测量仅偏差 0.03 THz。

预测的 Born 有效电荷还使我们能够模拟系统如何响应外部电场。在铁电材料中,离子采用不对称排列,使晶体具有净电极化,该极化可以通过施加电场翻转。在图 3(c) 中,我们通过模拟在外加电场下的钛酸钡(BaTiO3)来演示这一点,再现了其极化的开关。得到的磁滞回线正确地显示,300 K 下的有限温度效应使得极化更容易翻转,尽管预测的自发极化(38 μC/cm2)略高于实验值(26 μC/cm2)。这种差异很可能是由于底层第一性原理计算众所周知的欠束缚问题。

最后,我们预测原子电荷以研究化学键合和氧化还原过程中的电子自由度。我们研究了正极材料 Li1.2–xMn0.8O2 在模拟电池充电过程中的行为。这些富锂过渡金属氧化物因其高能量密度而成为有前途的下一代电池材料,但存在与阴离子氧氧化还原机制相关的不可逆容量损失。我们通过在 1000 K 下运行分子动力学模拟并逐步提取锂来模拟电池充电,重现了这一现象。我们观察到随时间推移的明显转变:起初,锰(Mn)原子提供充电所需的电子,但随着更多锂被移除,氧原子被迫提供电子(阳离子到阴离子氧化还原),如 Bader 电荷随时间推移向负值减小所示(图 3(d))。这使结构不稳定,氧原子配对形成 O2 二聚体(图 3(d),插图)。值得注意的是,这种关于阳离子到阴离子氧化还原转变和晶格退化的全面图景自然地从多任务预测中涌现出来,无需对电池材料进行任何特定任务的训练。

后续步骤

通过实验验证、显著的性能改进以及新的多任务能力,MatterSim 正朝着在材料设计中更实用、更贴近决策的方向发展。这些发展共同帮助材料科学家更快地从大规模计算筛选转向有针对性的实验跟进和与决策相关的科学工作流程。我们很高兴看到材料科学界如何在自己的领域应用这些进展。我们期待随着 MatterSim 被测试、扩展并集成到现实世界的材料发现流程中,继续开展合作。

MatterSim 更新

MatterSim-MT 预印本

致谢

这项工作是由微软研究院 AI for Science 领导的高度协作和跨学科努力的成果,合作伙伴包括微软研究院 Accelerator 以及德克萨斯大学达拉斯分校(由 MSR Accelerator 支持)、伊利诺伊大学厄巴纳-香槟分校和加州大学戴维斯分校的合作者。本工作的贡献者包括 Han Yang、Xixian Liu、Chenxi Hu、Yichi Zhou、Yu Shi、Chang Liu、Junfu Tan、Jielan Li、Guanzhi Li、Qian Wang、Yu Zhu、Zekun Chen、Shuizhou Chen、Fabian Thiemann、Claudio Zeni、Matthew Horton、Robert Pinsler、Andrew Fowler、Daniel Zügner、Tian Xie、Lixin Sun、Yicheng Chen、Lingyu Kong、Yeqi Bai、Deniz Gunceler、Frank Noé、Hongxia Hao、Ziheng Lu、Zixin Zhai、Mengfan Wu、Haoke Qiu、Mingfa Tang、Tie-Yan Liu、Haiguang Liu、Tao Qin、David G. Cahill、Bing Lv、Davide Donadio、Shoko Ueda 和 Kenji Takeda。(在新标签页中打开)

文章《用 MatterSim 推进材料领域的 AI:实验合成、更快的模拟和多任务模型》最初发表于微软研究院。

译自 Microsoft Research · 学术 · 录于 二〇二六年五月十二日