本帖最后由 Akkio 于 2026-6-16 12:10 编辑
针对晶体材料因缺乏长程有序结构导致逆向设计难度大的核心挑战,本文提出基于扩散模型的首个多元素非晶材料逆向设计框架AMDEN(Amorphous Material DEnoising Network),可实现目标性能驱动的低能原子结构精准生成。研究首先构建覆盖广泛组成范围的多元素锂硅磷氧氮玻璃数据集,采用等变图神经网络(EGNN)作为得分函数预测骨干,以原子间距离为边特征、元素嵌入/扩散时间步/目标性质为节点特征,通过求解反向时间随机微分方程将随机初始样本逐步转化为有效材料结构,并引入“幽灵原子”机制实现不同原子数目结构的密度可控生成。针对标准去噪程序无法复现低冷却速率淬火低能弛豫构型的根本瓶颈,开发基于能量的AMDEN变体,将哈密顿蒙特卡罗(HMC)精修融入扩散过程,利用势能面梯度引导采样优化,使生成样品的径向分布函数(RDF)与势能分布均与淬火/退火参考数据高度吻合。逆向设计验证表明,AMDEN生成结构的锂摩尔含量分布与训练数据一致,杨氏模量、剪切模量及平均环尺寸等目标性能与预设值呈强线性相关性,且在固定组成下可通过原子排列精细调控实现性能定制,具备超越训练数据范围的外推能力。本研究为非晶材料加速发现提供了系统性技术路径,所构建的多维度非晶数据集亦可为后续相关研究提供基准。

研究背景与问题提出
非晶态材料(如玻璃)因缺乏长程有序结构,其性质取决于化学组成以及热历史和压力历史,这赋予了其极为庞大的材料设计空间,但也对逆向设计方法提出了严峻挑战。当前基于扩散模型的逆向设计方法已在晶体材料和分子体系中取得显著进展,但在非晶材料领域仍存在明显不足。缺乏大规模多样化的非晶材料数据集用于训练生成模型,非晶材料需要更大的模拟盒子(通常包含数百原子)来准确捕捉中程有序结构,获取真实玻璃结构需要通过分子动力学模拟的熔体–淬火过程,计算成本高昂。此外,标准去噪程序难以生成经过充分弛豫的低能结构,这是非晶材料生成面临的根本性技术瓶颈。
AMDEN 模型框架
本文提出并验证了 AMDEN(Amorphous Material DEnoising Network)框架,这是一种基于扩散模型的非晶材料逆向设计方法,能够生成具有目标性能的多元素非晶材料结构。
AMDEN 的核心思想是建立一个材料扩散过程,用以估计在给定目标性质条件下非晶材料样本的概率分布。通过从学习到的分布中采样,可以生成符合特定性能需求的材料结构。
每个非晶材料样本由晶胞矩阵、原子位置和独热元素嵌入三部分表示。模型采用等变图神经网络(EGNN)作为骨干网络来预测得分函数,该网络以原子间距离作为边特征,以元素嵌入、扩散时间步和目标性质作为节点特征。通过求解反向时间随机微分方程,将完全随机的初始样本逐步转化为有效的材料结构。
模型在设计上保持了非晶材料的固有对称性,包括排列不变性、平移不变性和旋转/镜像不变性。此外,AMDEN 引入了"幽灵原子"机制来控制生成过程中的材料密度,使框架能够处理不同原子数目的结构生成问题。 ▲ Fig.1 | AMDEN模型流程图。(a) 材料样本𝑥由晶胞𝑪、原子位置𝑿和独热元素嵌入𝑬表示。(b) 得分函数𝑠𝜃(𝑥)由等变图神经网络(EGNN)预测,该网络以原子间距离作为边特征,以元素嵌入、扩散时间𝑡和目标性质𝒚作为节点特征。(c) 通过求解逆时间随机微分方程,将初始完全随机的样本转化为有效的材料样本。
哈密顿蒙特卡洛去噪方法
研究中发现,标准去噪程序虽然能生成合理的非晶结构拓扑,但无法复现低冷却速率淬火获得的低能弛豫构型。这是因为获取这些低能结构本质上依赖于热运动驱动的随机搜索过程,这一过程无法被标准去噪步骤所模拟。
为解决这一关键问题,作者开发了基于能量的 AMDEN 变体,将哈密顿蒙特卡罗(HMC)精修引入材料扩散过程。HMC 方法利用势能面的梯度信息引导采样,在每个去噪步骤中对结构进行能量优化。采用 HMC 去噪后,生成样品的径向分布函数与训练数据高度吻合,势能分布也准确匹配了参考数据的特征,证明 HMC 精修能够有效引导扩散模型生成物理上合理的低能弛豫结构,同时不损害模型的逆向设计能力。
▲ Fig.2 | AMDEN在有无HMC去噪条件下生成的非晶材料样本分析。(a) 径向分布函数(RDF)和(b) 三组非晶Si数据集(实线)及AMDEN采用标准去噪程序生成样本(虚线)经几何优化后的势能分布。生成的淬火和退火样本与参考数据存在明显差异。采用HMC去噪后,(c)中的RDF与训练数据高度吻合,且能量分布也与参考数据一致。
逆向设计验证
为验证 AMDEN 的逆向设计能力,研究者构建了一个覆盖广泛组成范围的多元素锂硅磷氧氮玻璃数据集,通过 MEG 势函数驱动的熔体–淬火工作流生成,包含不同 Li 含量和杨氏模量的样品。生成结构的 Li 摩尔含量分布与训练数据分布高度一致,表明模型准确学习了组成空间的分布特征。生成结构和重新淬火结构的杨氏模量与各自目标值比较,数据点沿对角线分布,证实 AMDEN 能有效地根据目标力学性能生成相应的材料结构。
在非晶硅数据集上,标准去噪生成样品的径向分布函数和势能分布与淬火、退火参考数据存在明显偏差,而 HMC 去噪后的生成样品与参考数据吻合良好。
为进一步验证 AMDEN 在固定组成条件下仅通过调控原子结构来改变材料性能的能力,研究者构建了非晶二氧化硅数据集,以剪切模量和平均环尺寸为目标性质。模型在小样本上训练以学习结构–性能关系,推理时生成结构的剪切模量、平均环尺寸与目标值均具有良好的线性相关性,且模型展现出超越训练数据范围的外推能力。这表明 AMDEN 不仅能通过组成调控实现目标性能,还能在固定组成下通过精细调节原子排列方式来实现性能定制。
▲ Fig.3 | 非晶二氧化硅数据集的推断结果。生成值与目标值的比较:(a) 剪切模量和(b) 平均环尺寸。两图中虚线均表示等值线。模型在小样本上进行训练,利用局部结构的自然变化学习结构-性能关系,而推断则在更大样本上执行,其原子结构甚至超出了训练数据中观察到的范围(第5和第95百分位数分别为23.2 GPa和32.5 GPa)。
总结
本文提出了首个面向多元素非晶材料逆向设计的扩散模型框架 AMDEN,揭示了标准去噪程序生成弛豫结构的本质困难,并通过引入 HMC 精修有效解决这一问题,同时构建了多个非晶材料数据集,涵盖不同组成和性能维度,为该领域后续研究提供基准。
当前验证主要基于经典力场和机器学习势函数生成的训练数据,向第一性原理精度数据的扩展仍需探索。未来方向包括将 AMDEN 扩展至更复杂的多组分体系、引入通用机器学习力场以提升数据生成效率,以及探索多目标优化下的逆向设计策略。
文章链接:https://doi.org/10.1002/adma.202522493
代码地址: https://github.com/Logan-Lin/AMDEN-code
|