基于特征工程和机器学习的高熵合金相结构预测 —— 单相预测精度达 95%

Dorian
2026-02-12 00:39:06
其他
技术教程

长沙理工大学团队在《机械工程材料》2025 年第 8 期发表《基于特征工程和机器学习的高熵合金相结构预测》,基于 788 个高熵合金数据集,经特征工程筛选 9 个核心特征,采用标准差标准化预处理与随机森林算法,构建相结构预测模型。模型预测金属间化合物、无定形相、面心立方相、体心立方相的精度分别为 95%、89%、88%、90%,复合相预测精度约 76%,总体精度优异,为高熵合金精准设计提供高效工具。




高熵合金的相结构直接决定其强度、耐腐蚀性等核心性能,是材料研发的关键。但传统 “试错法” 探索相结构不仅耗时耗力,还难以应对其庞大的成分设计空间。长沙理工大学团队在《机械工程材料》发表研究,通过特征工程与机器学习结合,构建高效相结构预测模型,将高熵合金相结构预测从 “盲目实验” 推向 “精准设计”,大幅缩短研发周期。


一、高熵合金相结构预测的 “传统困境”


高熵合金由多种主元元素组成,相结构复杂多样,主要包括面心立方(FCC)、体心立方(BCC)、金属间化合物(IM)、无定形相(AM)及多种复合相,其预测面临多重挑战:


成分组合庞大:多种元素的比例变化形成海量成分空间,传统实验无法全面覆盖;


影响因素复杂:原子半径、混合焓、价电子浓度等多个物理化学参数共同决定相结构,相互作用规律难以通过经验公式量化;


复合相预测难:单相结构相对易表征,但 FCC+BCC、BCC+IM 等复合相因数据稀缺,传统方法预测精度极低。


二、机器学习 + 特征工程:精准预测的 “双引擎”


研究团队通过系统的特征工程与算法优化,构建高精度预测模型,核心流程如下:


2.1 数据与特征工程:筛选核心影响因子


数据集构建:从文献中收集 1152 个高熵合金数据,经筛选去除不合理及冗余数据,最终保留 788 个有效数据集,涵盖 7 类相结构(FCC、BCC、IM、AM 及 3 种复合相);


特征筛选:总结 13 个潜在特征参数(如平均原子半径、混合焓、价电子浓度等),通过皮尔逊相关系数法排除冗余,再用 “去除特征法” 确定特征重要性排序;



13个相结构预测特征的皮尔逊相关系数热力图



删除单个特征后模型的精度变化


核心特征集:综合精度与效率,最终选取 9 个关键特征,按重要性排序为:熔点标准差、价电子浓度标准差、原子半径差、混合熵、合金组成元素熔点平均值、价电子浓度、混合焓、电负性差、平均原子半径。



模型精度随输入特征数量的变化曲线


核心特征计算公式示例:


原子半径差:



其中,ci为元素摩尔分数,ri为元素原子半径,r为平均原子半径;


混合熵:



其中,R为气体常数;


价电子浓度:



其中,VECi为元素价电子浓度。


2.2 模型优化:确定最佳算法与预处理方法


预处理对比:测试正则化、稳健标准化、极差归一化、标准差标准化 4 种方法,发现标准差标准化对模型精度提升最显著;



标准差标准化 / 正则化等 4 种预处理方法下 RF/SVM/KNN 模型的精度对比


算法筛选:对比随机森林(RF)、支持向量机(SVM)、最近邻回归(KNN)3 种算法,通过 10 次 5 折交叉验证,确定随机森林算法表现最优,在标准差标准化预处理下精度超 85%;


模型构建:以 9 个核心特征为输入,经标准差标准化预处理,基于随机森林算法构建最终预测模型。


三、预测结果:单相精度超 88%,泛化能力优异



模型对 7 类相结构的预测精度柱状图


模型对不同相结构的预测精度表现亮眼:


单相结构预测:金属间化合物(IM)预测精度最高达 95%,体心立方相(BCC)90%,无定形相(AM)89%,面心立方相(FCC)88%,均展现出极高的预测可靠性;


复合相预测:面心立方 + 体心立方(FCC+BCC)、体心立方 + 金属间化合物(BCC+IM)复合相预测精度约 76%,虽略低于单相,但考虑到复合相数据集稀缺(仅 49 个、44 个样本),仍验证了模型的强泛化能力;


关键发现:数据集规模与特征质量共同影响预测精度,熔点相关特征对金属间化合物形成的预测尤为关键,这与金属间化合物的形成机理高度契合。


四、应用价值:加速高熵合金研发进程


该模型的落地将为高熵合金研发带来革命性改变:


缩短研发周期:无需大量实验,输入元素组成即可快速预测相结构,将研发周期从数年缩短至数天;


降低研发成本:减少无效实验投入,精准锁定具有目标相结构的成分范围,降低材料制备与测试成本;


拓展应用场景:可广泛应用于航空航天、生物医疗、工业制造等领域的高熵合金设计,助力开发具有特定性能的新型材料。


五、总结:AI 赋能材料研发的新范式


特征工程与随机森林结合的预测模型,核心优势在于 “精准筛选特征 + 高效算法建模”,实现了高熵合金相结构的快速精准预测。其 95% 的单相预测精度、76% 的复合相预测精度,不仅解决了传统方法的效率与精度痛点,更为材料科学领域的 “数据驱动设计” 提供了典范。未来,随着数据集的持续扩充与算法的迭代优化,有望实现更复杂相结构的精准预测,推动高熵合金在更多高端领域的应用。




原文链接:https://jxgccl.mat-test.com/article/doi/10.11973/jxgccl240261

38
0
0
0
关于作者
相关文章
  • 融入化学先验知识的分子基础模型:Ouroboros 在多靶点药物设计与 ...
    大规模化学预训练模型的出现,显著增强了模型捕捉分子结构与功能之间复杂关系的能力。近年来,分 ...
    了解详情 
  • AI赋能化学生物学 —— 五大核心领域应用、挑战与未来展望 ...
    伴随着算法、算力和数据的融合发展, 近年来人工智能(AI)取得了突破性的进展。得益于其在化学和生 ...
    了解详情 
  • 深度学习驱动从头抗生素设计:新型抗菌分子 NG1 与 DN1 的发现及 ...
    发表于 Cell 的《 A generative deep learning approach to de novo antibiotic design 》提出一 ...
    了解详情 
  • QDRL量子深度强化学习—— 量子计算与强化学习协同,攻克网络节 ...
    网络关键节点识别是网络科学基础问题。本研究提出量子深度强化学习(QDRL)框架,融合强化学习与 ...
    了解详情 
领取成功
本月5个550bit真机配额已发放给您,配额将在2个月后到期,请及时使用哦~
活动中心
联系我们
二维码
返回顶部
返回
活动中心

完成任务,轻松获取真机配额

×
每日必做
新手任务
长期任务
其他任务
快速回复 返回顶部 返回列表
玻色有奖小调研
填写问卷,将免费赠送您1个1000bit真机配额
(单选) 您是从哪个渠道得知我们的?*
您是从哪个社交媒体得知我们的?*
您是通过哪个学校的校园宣讲得知我们的呢?
取消

提交成功

真机配额已发放到您的账户,可前往【云平台】查看

量子AI开发者认证

考核目标

开发者能够成功搭建Kaiwu-PyTorch-Plugin项目基础环境,并成功运行示例代码,根据示例提示,输出指定的值并填写至相应的输入框中。

通过奖励

5个一年效期的1000量子比特真机配额

专属「量子AI开发者」社区认证标识

开发者权益

每月固定权益:5个550量子比特真机配额
前往考核

第一步

按照README提示成功安装Kaiwu-PyTorch-Plugin库环境依赖
前往GitHub

第二步

运行 community-assessment 分支下的 run_rbm.py 代码示例

第三步

理解示例代码,手动打印并填写如下数值:

正相采样的状态

负相采样的状态

正相的能量值

负相的能量值

*

提交答案

开发者权益

每月固定权益:5个550量子比特的真机配额

恭喜您完成考核

您将获得量子AI开发者认证标识及考核奖励

1000 bit*5

配额

Quantum AI Developer Certification

Assessment Objectives

Developers should successfully set up the basic environment for the Kaiwu-PyTorch-Plugin project, run the QBM-VAE sample code, and calculate the correct FID value based on the random seed value provided by the system.

Pass Rewards

10 quotas for 550-qubit real quantum machines with a one-year validity period

Exclusive "Quantum AI Developer" Community Certification Badge

Developer Benefits

Fixed Monthly Benefits: 5 quotas for 550-qubit real quantum machines
Proceed to Assessment

Step 1

Install the environment dependencies for the Kaiwu-PyTorch-Plugin library according to the README instructions
Go to GitHub

Step 2

Replace the Seed Value

Your seed value is

Step 3

Enter the FID Value You Calculated

*

Submit Answer

Developer Benefits

Fixed Monthly Benefits: 5 quotas of 550-qubit real machines

Congratulations on Completing the Assessment

You will receive the Quantum AI Developer Certification Badge and Assessment Rewards

550bit*10

Quotas