长沙理工大学团队在《机械工程材料》2025 年第 8 期发表《基于特征工程和机器学习的高熵合金相结构预测》,基于 788 个高熵合金数据集,经特征工程筛选 9 个核心特征,采用标准差标准化预处理与随机森林算法,构建相结构预测模型。模型预测金属间化合物、无定形相、面心立方相、体心立方相的精度分别为 95%、89%、88%、90%,复合相预测精度约 76%,总体精度优异,为高熵合金精准设计提供高效工具。

高熵合金的相结构直接决定其强度、耐腐蚀性等核心性能,是材料研发的关键。但传统 “试错法” 探索相结构不仅耗时耗力,还难以应对其庞大的成分设计空间。长沙理工大学团队在《机械工程材料》发表研究,通过特征工程与机器学习结合,构建高效相结构预测模型,将高熵合金相结构预测从 “盲目实验” 推向 “精准设计”,大幅缩短研发周期。
一、高熵合金相结构预测的 “传统困境”
高熵合金由多种主元元素组成,相结构复杂多样,主要包括面心立方(FCC)、体心立方(BCC)、金属间化合物(IM)、无定形相(AM)及多种复合相,其预测面临多重挑战:
成分组合庞大:多种元素的比例变化形成海量成分空间,传统实验无法全面覆盖;
影响因素复杂:原子半径、混合焓、价电子浓度等多个物理化学参数共同决定相结构,相互作用规律难以通过经验公式量化;
复合相预测难:单相结构相对易表征,但 FCC+BCC、BCC+IM 等复合相因数据稀缺,传统方法预测精度极低。
二、机器学习 + 特征工程:精准预测的 “双引擎”
研究团队通过系统的特征工程与算法优化,构建高精度预测模型,核心流程如下:
2.1 数据与特征工程:筛选核心影响因子
数据集构建:从文献中收集 1152 个高熵合金数据,经筛选去除不合理及冗余数据,最终保留 788 个有效数据集,涵盖 7 类相结构(FCC、BCC、IM、AM 及 3 种复合相);
特征筛选:总结 13 个潜在特征参数(如平均原子半径、混合焓、价电子浓度等),通过皮尔逊相关系数法排除冗余,再用 “去除特征法” 确定特征重要性排序;

13个相结构预测特征的皮尔逊相关系数热力图

删除单个特征后模型的精度变化
核心特征集:综合精度与效率,最终选取 9 个关键特征,按重要性排序为:熔点标准差、价电子浓度标准差、原子半径差、混合熵、合金组成元素熔点平均值、价电子浓度、混合焓、电负性差、平均原子半径。

模型精度随输入特征数量的变化曲线
核心特征计算公式示例:
原子半径差:

其中,ci为元素摩尔分数,ri为元素原子半径,r为平均原子半径;
混合熵:

其中,R为气体常数;
价电子浓度:

其中,VECi为元素价电子浓度。
2.2 模型优化:确定最佳算法与预处理方法
预处理对比:测试正则化、稳健标准化、极差归一化、标准差标准化 4 种方法,发现标准差标准化对模型精度提升最显著;

标准差标准化 / 正则化等 4 种预处理方法下 RF/SVM/KNN 模型的精度对比
算法筛选:对比随机森林(RF)、支持向量机(SVM)、最近邻回归(KNN)3 种算法,通过 10 次 5 折交叉验证,确定随机森林算法表现最优,在标准差标准化预处理下精度超 85%;
模型构建:以 9 个核心特征为输入,经标准差标准化预处理,基于随机森林算法构建最终预测模型。
三、预测结果:单相精度超 88%,泛化能力优异

模型对 7 类相结构的预测精度柱状图
模型对不同相结构的预测精度表现亮眼:
单相结构预测:金属间化合物(IM)预测精度最高达 95%,体心立方相(BCC)90%,无定形相(AM)89%,面心立方相(FCC)88%,均展现出极高的预测可靠性;
复合相预测:面心立方 + 体心立方(FCC+BCC)、体心立方 + 金属间化合物(BCC+IM)复合相预测精度约 76%,虽略低于单相,但考虑到复合相数据集稀缺(仅 49 个、44 个样本),仍验证了模型的强泛化能力;
关键发现:数据集规模与特征质量共同影响预测精度,熔点相关特征对金属间化合物形成的预测尤为关键,这与金属间化合物的形成机理高度契合。
四、应用价值:加速高熵合金研发进程
该模型的落地将为高熵合金研发带来革命性改变:
缩短研发周期:无需大量实验,输入元素组成即可快速预测相结构,将研发周期从数年缩短至数天;
降低研发成本:减少无效实验投入,精准锁定具有目标相结构的成分范围,降低材料制备与测试成本;
拓展应用场景:可广泛应用于航空航天、生物医疗、工业制造等领域的高熵合金设计,助力开发具有特定性能的新型材料。
五、总结:AI 赋能材料研发的新范式
特征工程与随机森林结合的预测模型,核心优势在于 “精准筛选特征 + 高效算法建模”,实现了高熵合金相结构的快速精准预测。其 95% 的单相预测精度、76% 的复合相预测精度,不仅解决了传统方法的效率与精度痛点,更为材料科学领域的 “数据驱动设计” 提供了典范。未来,随着数据集的持续扩充与算法的迭代优化,有望实现更复杂相结构的精准预测,推动高熵合金在更多高端领域的应用。
原文链接:https://jxgccl.mat-test.com/article/doi/10.11973/jxgccl240261 |