量子计算+AI!深入解读“2025五岳杯量子计算挑战赛”金奖成果

Akkio
2025-05-22 10:23:17

在由玻色量子协办的第二届APMCM“五岳杯”量子计算挑战赛上,来自中南大学的Ciallo团队摘取了金奖。该团队由中南大学电子信息学院石金晶教授指导,依托玻色量子550计算量子比特的相干光量子计算机,将注意力机制建模为QUBO问题并采用基于能量的反向传播方法,构建了一种基于量子计算的多头注意力(QAMA)算子,成功实现了与深度学习中多头注意力框架的无缝兼容。

实验结果证明,QAMA在将推理时间缩短至毫秒级并提高解质量的同时,实现了与经典算子相当的准确率。随着量子硬件和相关技术的不断发展,QAMA机制有望在人工智能基础计算领域发挥更大的作用,推动大语言模型、图像识别、自然语言处理等众多领域发展,为实现更高效、智能的计算提供有力支持。

 

深度学习在人工智能领域取得了显著成就,以ChatGPT和Deepseek为代表的模型,展现出了基于注意力机制的Transformer架构的强大能力。然而,随着模型参数数量呈指数级增长,传统注意力机制在训练和推理过程中也暴露出内存消耗大、能源成本高的问题,难以满足实际应用中对效率和成本的要求。

基于此,Ciallo团队提出了基于量子计算的多头注意力机制(QAMA),旨在通过量子计算算法优化传统多头注意力机制,实现与经典深度学习框架的无缝兼容。通过将注意力机制建模为QUBO问题,借助量子计算的全局优化能力和量子比特的相互作用特性,降低计算复杂度,提升模型性能;进而通过基于能量的反向传播方法,解决量子层与经典深度学习框架融合时的梯度计算问题,使量子计算能够有效融入深度学习的训练过程;同时结合相干光量子计算机的优势,在显著降低能耗的同时,保持了毫秒级的实时响应能力。

量子计算多头注意力模型(QAMA)是一种开创性的方法,将量子计算与深度学习在架构层面相结合,在Transformer模型中重新构建多头注意力机制,降低计算复杂性的同时保持模型性能,适用于任何基于注意力架构的模型,更是推动人工智能基础计算领域的范式创新。

以下为获奖论文的主要内容:

深度学习在人工智能领域发展迅速。伴随着模型参数数量的增长,训练和推理过程中的能源与资源消耗问题也日益严重,传统注意力机制在处理大规模数据时,面临着计算复杂度高、内存需求大等挑战。量子计算利用量子叠加和纠缠特性等实现并行计算,在处理复杂问题和大规模数据方面具有巨大优势,量子计算算法擅长解决优化问题,通过绝热演化和量子隧穿寻找全局最优解。相干光量子计算机作为先进的专用量子计算硬件产品,采用光参量振荡器网络模拟伊辛模型,能够高效处理组合优化问题,为量子计算在机器学习领域的应用奠定基础。

Ciallo团队提出的基于量子计算的多头注意力(QAMA)机制,创新性地利用了伊辛模型的量子比特相互作用特性,将传统的O(n^2)时空复杂度优化为线性资源消耗,同时结合相干光量子计算机的光计算优势,在显著降低能耗的同时,保持了毫秒级的实时响应能力。

QAMA工作流程

传统多注意力机制在许多任务中对表征学习和特征提取很有效,但也存在着只能捕捉线性关系,缺乏显式建模复杂交互能力的局限性,对于需要更高阶交互、复杂依赖关系或长期关系的任务,传统方法可能无法提供最佳解决方案。相比之下,将问题转化为QUBO模型,并在相干光量子计算机上执行计算,可为深度学习背景下的组合优化问题提供一种新的计算范式,快速找到全局最优解,并有效减少与深度学习相关的计算开销。

QUBO建模

在构建QUBO目标函数时,研究团队对二次项和一次项系数进行了优化设计。传统注意力机制一般基于直接点积,容易放大噪声和无关特征的影响。研究团队采用了Jensen-Shannon(JS)散度方法,将特征向量通过softmax函数归一化映射为概率分布,构建出能够有效区分关键特征和噪声特征的注意力权重,从而减轻对向量大小的敏感性,获得更稳定和可靠的注意力分数,提高了稳定性和可靠性。与此同时,为了使模型更聚焦于长距离依赖关系,并合理分配资源,研究团队在QUBO模型中引入了两个关键的约束项,通过调整约束项的参数动态控制模型对长距离依赖和关键特征的关注程度,提高了模型的性能和效率。

在计算过程中,由于最优解的离散性,传统的梯度计算方法难以直接应用,研究团队借鉴VQ-VAE(向量变分自动编码器)处理离散变量的思想来处理未分化问题与离散变量。通过直接计算最优解对应的子能量对参数的梯度,截断量子计算的反向传播过程,从而忽略其不可微性。

QAMA模型的反向传播机制解决了量子计算算法中固有的基本不可微性挑战,这是将量子层集成到基于梯度的学习框架中的关键障碍。因为QAMA模型在前向传播中使用了二值化的不可约离散运算,反向传播面临着梯度不可传递的情况,研究团队利用直通估计器(STE)的思想,在前向传播中保留离散操作,反向传播时直接传递梯度,绕过不可导点的计算问题,从而在保持离散性的同时实现参数更新,很好地解决了QAMA模型中的梯度不可导情况,保证了在高维离散空间中量化注意力权重时,梯度信息仍能有效传播,为模型的训练提供了可靠的支持。

更进一步地,为了克服传统二进制注意力的局限性,QAMA模型引入了软选择机制。软选择机制是一种注意力权重分配方法,与传统的硬选择不同,软选择方法近似于经典的连续实权重,软选择中的量子比特越多,可以使用的 “阶数” 就越多,模型中不同特征的重要性就可以更精细地体现。这种机制使每个注意力头能够以相对连续的方式关注不同特征的重要性,从而有助于更细粒度的特征学习。

模型结构与QUBO建模过程

数值实验

Ciallo团队选用MNIST、FashionMNIST和CIFAR10三个图像分类数据集进行实验,通过控制变量法,对嵌入维度、注意力头数量和软选择类别数量等超参数进行调整,逐步确定最优超参数配置;在此之后,QAMA模型使用最佳超参数进行训练以进行性能分析实验,以此评估模型效果并与经典模型进行比较;最后团队还借助相干光量子计算机完成真机推理实验,验证了QAMA模型在实际量子计算环境中的性能。

如图所示的结果显示,在20轮次训练(20-epoch training)的过程中,所有数据集的损失值持续下降,表明QAMA模型能够有效地学习和捕获数据中的模式;准确率曲线表明,QAMA模型对CIFAR10、FashionMNIST和MNIST数据集的分类准确率分别为36.00%、83.36%和92.37%,证实了其处理不同复杂程度数据的能力。此外,在与经典模型的比较中,QAMA的准确性(92.37%)达到了经典注意力模型的水平(92.41%),且在时间和空间复杂性方面表现出显著优势,有效地规避了复杂性爆炸,并利用量子计算的优势实现线性复杂性。

在接受者操作特性曲线(ROC)和ROC曲线下面积(AUC)指标上的性能结果显示,QAMA模型在二元分类任务中表现出超过99%的准确率和接近1.0的AUC,标志着QAMA模型在简化任务中的熟练表现。

QAMA模型性能结果

最后,研究团队还采用相干光量子计算机进行推理,以进一步验证QAMA的准确性和可行性。相干光量子计算机能够高效处理QAMA模型生成的QUBO矩阵,在1.3943毫秒内完成优化任务,并返回最优解和QUBO值曲线。

QUBO值曲线显示了量子计算系统的哈密顿量的演变,这种混合方法在保持解决方案质量的同时实现了高维优化效率。

QAMA模型与相干光量子计算机的集成

量子计算多头注意力(QAMA)模型代表了量子计算和深度学习的开创性集成,从量子计算的计算视角对多头注意力机制进行了重新设计。这种开创性的方法利用量子增强的全局优化能力和强大的特征选择功能克服了经典注意力机制的固有局限,如对线性关系的依赖、对噪声放大敏感和计算效率低下等,实现了量子计算与经典深度学习框架的无缝集成,是量子计算与深度学习融合领域的一项重要突破。

此次APMCM“五岳杯”量子计算挑战赛,众多优秀参赛团队依托玻色量子550量子比特相干光量子计算机,成功完成了AI、金融、生物制药等众多行业真实场景的技术突破与应用升级。未来,玻色量子将联合中国信息通信研究院、移动云、中国人工智能学会等举办更多的量子计算挑战赛,大力培养更多的量子实用化优秀人才。

 

关于第二届APMCM“五岳杯”量子计算挑战赛

第二届APMCM“五岳杯”量子计算挑战赛是由中国信息通信研究院、中国移动云能力中心、北京图象图形学学会主办,北京玻色量子科技有限公司协办,国内最具影响力的量子计算创新赛事。旨在让高校学生体验真实量子算力,探索创新项目,建立实用化量子计算基础研究,加强培养量子计算人才队伍,持续完善“量子计算+”产学研用生态建设。自第二届大赛启动以来,共有近2000支队伍,近5000人报名竞赛,玻色量子研发的Kaiwu SDK调用量达数百万次。通过本次竞赛,玻色量子联合移动云与中山大学、哈尔滨工业大学、中南大学、北京理工大学等众多国内知名高校达成深度合作,共同赋能量子应用创新,共同建设数字中国量子生态体系。

7
0
0
0
关于作者
相关文章
  • 机器学习笔记(1)——回归与分类问题中的损失函数、代价函数与KL ...
    本文系统梳理了机器学习中常用的损失函数及其在回归与分类任务中的应用与特点。在回归场景下,介 ...
    了解详情 
  • 量子计算+AI!深入解读“2025五岳杯量子计算挑战赛”银奖成果之 ...
    了解详情 
  • 增广拉格朗日法实现的关键注意事项
    增广拉格朗日乘子(Augmented Lagrangian multiplier)方法是一种用于求解带有等式和不等式约束 ...
    了解详情 
  • 【论文精读】基于量子计算的特征选择
    了解详情 
在本版发帖返回顶部
快速回复 返回顶部 返回列表
玻色有奖小调研
填写问卷,将免费赠送您5个100bit真机配额
(单选) 您是从哪个渠道得知我们的?*
您是从哪个社交媒体得知我们的?*
您是通过哪个学校的校园宣讲得知我们的呢?
取消

提交成功

真机配额已发放到您的账户,可前往【云平台】查看