量子计算突破AI社区发现场景!真机测试完整报告公开!

薛定谔了么
2024-08-23 18:26:18
人工智能
行业动态
本帖最后由 薛定谔了么 于 2025-1-23 16:56 编辑




 





引言:


互联网的一个重要特征是具有社区结构,在线上社交网络、物理和生命科学领域,识别社区结构是理解不同网络结构的关键一步,对解析行业内的结构化场景具有重要的实用化意义。同时,社区发现也是AI实用化领域的重要研究场景。尤其在大规模网络中,目前许多应用程序都是使用社区发现算法来揭示网络中的隐藏结构。例如,在社交网络中找到具有相似行为的用户,通过他们的购物习惯对这些客户进行聚类。在网购中,产品推荐系统是使用社区发现技术的一个重要应用,基于社区发现算法的计算结果,系统可以识别到对购买某些产品具有相同倾向的客户群体,这也是在AI的赋能下,手机能够对我们“投其所好”以诱导消费的重要手段。


基于模块度的最大化是网络中社区识别的主要方法之一。随着数据集愈加广泛而庞大,所需要的算力也越来越多,量子计算成为加速AI社区发现算法运行的重要工具。该方法可以通过将传统的社区发现算法模型转化为QUBO形式,并借助玻色量子自研的相干光量子计算机进行求解。然而在真实应用场景中,如在线网络用户数,或者生命科学领域的细胞数量都常常出现高于现有量子比特规模的情况,这时借助subQUBO等算法就可以进行问题拆分并求解。实验表明,量子计算在AI社区发现算法的准确性与可靠性方面优势突出,进一步印证了量子算法在处理复杂网络结构方面的强大实力。



AI社区发现等聚类算法的直观应用案例,体现在提升在线购物体验、优化产品推荐以及精准定位广告投放上。


在大型购物网络中,AI社区发现可以用于分类客户,并根据用户的购买历史提供未来购买的建议。在这方面,CSIC-UIB跨学科物理与复杂系统研究所的Zanin博士团队提出了一种产品推荐系统的算法,根据客户的兴趣推荐产品。基于社区检测的社交推荐系统,通过识别用户的地理位置、他们的社交关系和朋友的偏好,提供更好的推荐。


在经济学和金融数据分析中,根据公司的经济价值、净收入、当前销售额、股权和股价对公司进行分类也非常重要。布加勒斯特经济研究院Serban等人进行了一项研究,对106家公司的经济和财务指标使用社区发现算法进行聚类。


在股票市场中,每支股票都由一个顶点表示,边代表市场中股票价值的相关性,这种投资组合管理可以帮助投资者分散或集中他们的投资。兰州理工大学的学者提出了一种构建股票市场网络和在其中检测社区的方法,基于香港股票市场的实证数据,他们使用模块性度量Q来揭示社区结构。


此外,社区发现算法在现实生活中的网络欺诈检测问题上也展现出了巨大的应用潜力,如电信网络、社交网络和医疗保健领域。SAS软件研究所Pinheiro团队使用两步算法在电信网络中检测欺诈事件。第一,通过对电信网络的数据分析来检测社区;第二,使用一些基本的图属性,如度和介数,作为检测异常节点或异常值的衡量标准。


显然,AI社区发现已经渗透到了我们生活中的各行各业,并具有巨大的实用化价值。


下面我们将给出完整真机测试报告基于模块度的社区发现,构建QUBO模型问题,本次模拟测试了Zachary karate club network和Dolphins两个经典数据集,依托玻色量子团队自主研发的相干光量子计算机开展应用测试,验证了相干光量子计算机在解决AI社区发现问题方面具备了实用量子优越性。


基于模块度的AI社区发现


模块度可用来衡量社区划分的好坏,如果划分的社区内部有较多的边,社区之间有较少的边,则这个度量数值较高。可以将AI社区发现问题转换为最大化网络模块度问题。


首先定义邻接矩阵A用来表征图中点之间的连接,其中元素Avw=1表示点v和点w相连,否则Avw=0。定义m为图的总边数(去重),则m=∑vwAvw/2。则基于模块化的社区发现的基本思想是利用社区内部的边数相对较多的性质。


假设图被划分为不同社区,用cv表示点v被分到的社区,用δ(cv,cw)=1表示cv=cw,否则为0,则一条边落到一个社区内部的几率(即连接的两点都在同一社区内)可表示为:



对于这个度量,如果网络中的所有点都被分配到一个社区,则值最大,所以单独使用这个指标无法衡量社区划分的效果,需要结合其他的度量,这一度量反映一个随机网络的社区划分的期望连接数。为此,首先定义节点v的度kv为连接到这一节点的边数:



综上,可定义网络的模块度为



即,模块度可被定义为社区内边数减去社区内节点产生边数的期望,除以总边数2m可理解为边数的比例。根据文献,实际中这一取值在0.3以上为比较明显的社区划分。


QUBO模型


定义二值决策变量xvcxvc=1表示节点v分配到社区c,否则为0。社区c的模块度可表示为



由于一个节点只能被分配到一个社区,对于任意节点v需要约束



写成QUBO形式为



需要的量子比特数为节点的数量N乘以社区的数量k。注意到当节点被分成两个社区时,上述模型可以进一步简化为如下形式:



实验过程及结果


测试数据集介绍


本次模拟测试了Zachary karate club network和Dolphins两个经典数据集。Zachary karate club network是著名的社交网络数据集,以Zachary教授研究的一个空手道俱乐部为基础。该数据集描述了一个20世纪70年代初在美国一所大学的空手道俱乐部的成员之间的相互关系。这个数据集包含34个节点(俱乐部成员)和78条边(成员之间的相互联系)。每个节点代表一个俱乐部成员,而边表示两个成员之间的社交关系。这些社交关系可以是友谊、互动、合作等。其拓扑结构如下图所示。



Zachary数据集拓扑结构


Dolphins数据集来自于Lusseau等在新西兰对62只宽吻海豚的生活习性进行了长时间的观察,Lusseau等研究发现这些海豚的交往呈现出特定的模式,并构造了包含有62个结点,159条边的社会网络。如果某两只海豚经常一起频繁活动,那么网络中相应的两个结点之间就会有一条边存在,这些频繁活动可以是社交互动、游戏行为、共同出现在某个地理位置等等。Dolphin 网络也是复杂网络社区发现与划分的经典用例,其拓扑结构如下图所示,该网络记录了 62 只海豚之间的联系。



Dolphins数据集拓扑结构


真机实验结果


我们进一步对社区发现问题在Zachary和Dolphins数据集上用相干光量子计算机真机进行了求解。本次真机实验测试


(1)Zachary数据集在不同社区数(k=2,3,4)的社区发现问题


(2)Dolphins数据集,在k=5时的社区发现问题



Zachary数据集真机测试结果






Dolphins数据集真机测试结果



真机实验结果表明:


Zachary数据集在k=2和k=4时的真机结果与模拟器结果相一致,k=3时真机找到比相干光量子计算机模拟更好的结果,与[2]结果一致,优于论文[1]中的结果。同时在计算时间方面,相干光量子计算机真机具有显著优势。在对Dolphins数据集进行求解时,真机耗时0.021秒完成了对该62节点的网络分成5个社区的划分,模块度为0.5200,计算结果优秀。


总结


我们在两个领域内广泛使用的数据集(Zachary和Dolphins)上测试了基于相干光量子计算机的量子AI社区发现算法,以验证量子计算在AI社区发现算法的有效性。实验结果一致地支持量子AI社区发现算法的准确性与可靠性,这些结果与现有文献中通过经典和量子算法得出的结论相吻合。


进一步地,我们利用真机进行了实验验证。对于Zachary数据集,量子AI社区发现结果与公开研究成果中的最好结果一致。对于Dolphins数据集,我们在真机上实现了62个节点、K=5的社区发现计算,且真机计算的结果表现突出。这进一步印证了量子算法在处理复杂网络结构方面的强大实力。


随着量子计算技术的不断成熟,玻色量子将基于最新550计算量子比特相干光量子计算机🔗,联合各行业优秀的合作伙伴探索并验证更多量子计算+实用化场景,依托量子计算生态产业链,使它将在AI社区发现等更多领域发挥革命性的作用,推动社会进入一个更加智能和高效的新时代。



参考文献


[1]Negre, Christian FA, Hayato Ushijima-Mwesigwa, and Susan M. Mniszewski. "Detecting multiple communities using quantum annealing on the D-Wave system." Plos one 15.2 (2020): e0227538.


[2] Jason Zhu, Kyle Brubaker, Martin Schuetz(2021). Community Detection using Hybrid Quantum Annealing on Amazon Braket – Part 1.Community Detection using Hybrid Quantum Annealing on Amazon Braket – Part 1 | AWS Quantum Technologies Blog


[3] Fu Y H, Huang C Y, Sun C T. A community detection algorithm using network topologies and rule-based hierarchical arc-merging strategies[J]. Plos one, 2017, 12(11): e0187603.




1698
2
1
1

评论1

原来是这样
关于作者
相关文章
  • DNA 编码化学 + 图卷积神经网络:机器学习助力小分子药物高通量 ...
    蛋白质是许多生物活动的主要 “执行者”,人类疾病疗法的开发,大多围绕对蛋白质功能 ...
    了解详情 
  • 从七桥问题到 AI 时代——图学习的进化与跨界之路 ...
    从欧拉 “柯尼斯堡七桥问题” 奠定图论基础,到图算法在网络数据和社交媒体中崭露头角 ...
    了解详情 
  • 量子计算+AI:特征选择与神经网络优化创新应用 ——“五岳杯”银 ...
    在由玻色量子协办的第二届APMCM“五岳杯”量子计算挑战赛中,来自北京理工大学的Q-Mas ...
    了解详情 
  • FeNNix-Bio1:面向生物制药等分子模拟场景的量子 AI 基础模型 ...
    当前模拟复杂生物系统的量子分子动力学仍受限于计算资源和方法精度,传统的DFT方法存在精度不足 ...
    了解详情 
  • HAWI量子+经典混合算法:运用伊辛模型应对“容错学习”(LWE)问 ...
    HAWI是一种适用于噪声中等规模量子设备(NISQ)的量子-经典混合算法,用于求解容错学习问题(LWE ...
    了解详情 
在本版发帖返回顶部
快速回复 返回顶部 返回列表
玻色有奖小调研
填写问卷,将免费赠送您5个100bit真机配额
(单选) 您是从哪个渠道得知我们的?*
您是从哪个社交媒体得知我们的?*
您是通过哪个学校的校园宣讲得知我们的呢?
取消

提交成功

真机配额已发放到您的账户,可前往【云平台】查看