本帖最后由 薛定谔了么 于 2026-6-2 19:06 编辑
传统无机晶体生成扩散模型多采用晶格、原子种类与坐标分步扩散架构,存在参数量庞大、采样效率偏低等问题。本文基于统一扩散范式的 DiffCrysGen 晶体生成模型,该模型将晶体全部信息一体化编码,依托单网络实现端到端扩散生成,参数量仅 130 万,晶体生成速率较主流模型提升 2~3 个数量级。多指标评测表明,模型可高效生成组分、结构多样化的稳定晶体。依托该框架开展无稀土永磁材料定向筛选,经第一性原理验证得到 Fe₂ZnO₃、Mn₂Rh₃Ti 等新型稳态磁性化合物。最后分析模型现存约束与优化方向,统一扩散思路为轻量化、高通量晶体智能设计提供新方案。

1 模型框架:统一表示与轻量化设计
1.1 统一数据表示与SDE框架
DiffCrysGen基于随机微分方程(SDE)框架,其关键在于将晶体结构表示为紧凑的二维点云,联合编码原子类型、分数坐标和晶格参数。
扩散过程包含前向扩散和逆向扩散两个阶段。如图所示,前向扩散通过逐步添加高斯噪声将复杂的数据分布转化为简单的高斯先验分布;逆向扩散则是生成阶段,从随机噪声出发逐步去噪以重建有效的晶体结构。去噪神经网络基于噪声条件UNet架构,以含噪数据及其噪声水平为输入,预测底层的干净数据。

1.2 极简网络架构
模型采用噪声条件UNet作为去噪网络,以含噪数据及噪声水平为输入,预测整体分数函数。其设计哲学是“概念简洁性”——单一网络处理整个材料表示。

如表1所示,DiffCrysGen仅包含130万参数,比同类模型小一个数量级以上。这种轻量化设计带来了惊人的效率:在单张NVIDIA H100 GPU上,它以 308.07样本/秒 的速率生成结构,生成10万个晶体仅需约5.41分钟。
2 性能基准测试:速度与质量的平衡
研究者采用了一套综合指标(Table 2)对模型进行严格评估,重点关注有效性(Validity)、稳定性(Stability) 和新颖性(Novelty)。


如图2所示,DiffCrysGen在保持高有效性率和合理稳定性率的同时,其有效生成率(EGR) 远超MatterGen和DiffCSP。这表明该模型在“生成有用新材料”的效率上实现了数量级突破。
3 生成能力:化学与结构多样性
DiffCrysGen展现出强大的化学空间覆盖能力。模型基于Alexandria数据库(15万余个优化结构)训练,能够生成从简单二元到复杂多元的无机晶体。

图3展示了随机生成的代表性结构(如Fe₂MnRh₃、CaMn₃O₆),涵盖了多种晶系和空间群。模型通过隐式学习数据中的对称性规律,而非显式施加约束,从而保持了生成的广泛适用性。
4 应用案例:无稀土磁性材料的逆向设计
为验证实用性,研究者构建了完整的生成-筛选-验证管线(Fig. 4),应用于无稀土(RE-free)磁性材料发现。

4.1 新型磁性材料的DFT验证
通过DiffCrysGen生成 → ML快速筛选(稳定性、磁化强度)→ DFT严格验证,发现了多个新型无稀土磁性材料。表3和表4列出了部分铁磁(FM)和反铁磁(AFM)候选材料。

4.2 典型候选材料深度分析
Fe₂ZnO₃(铁磁):
稳定性:声子谱无虚频,证实动力学稳定(Fig. 5)。

磁性:高饱和磁化强度(~1.47 T),显著的磁晶各向异性能(K₁)。
Mn₂Rh₃Ti(反铁磁):
特性:金属性反铁磁体,能量与动力学稳定,具有潜在可合成性(Fig. 6)。

5 技术细节:去噪网络架构

去噪网络基于UNet架构(Fig. 7),通过编码器-解码器结构及跳跃连接保留多尺度特征。噪声水平通过嵌入层注入各层,使模型能自适应不同扩散时间步的去噪策略。这种设计是实现高效统一生成的技术基础。
6 总结与展望
6.1 核心贡献
统一框架:首次将晶体结构组分纳入单一扩散过程,极大简化架构。极致效率:130万参数实现比SOTA快2–3个数量级的生成速度。
实用验证:通过DFT证实了新型无稀土磁性材料的可行性。
6.2 局限性与未来方向
局限性:当前未显式编码空间群对称性,高对称性控制场景存在不足
展望:引入条件生成机制(目标性质导向)、扩展训练数据规模(更大单胞)、结合合成性预测。DiffCrysGen为功能材料的高通量、低成本逆向设计提供了强有力的新范式。
参考文献:Mal, S., Ahmed, N., Jami, J. et al. DiffCrysGen: a generative diffusion model for accelerated design of inorganic crystalline materials. npj Comput Mater (2026). https://doi.org/10.1038/s41524-026-02147-1
原文地址:https://doi.org/10.1038/s41524-026-02147-1
代码地址:https://github.com/SouravMal/DiffCrysGen |