从七桥问题到 AI 时代——图学习的进化与跨界之路

薛定谔了么
2025-06-26 18:04:25
人工智能
量子科普
本帖最后由 薛定谔了么 于 2025-6-26 18:10 编辑


从欧拉 “柯尼斯堡七桥问题” 奠定图论基础,到图算法在网络数据和社交媒体中崭露头角,再到 DeepWalk、GCN、MPNN 等图学习模型相继出现,图学习在节点分类、链接预测等任务上发挥重要作用,如今已广泛应用于城市规划、医疗健康等多个领域,未来在与大型语言模型集成等方面潜力无限。本文将阐述自 1996 年 PageRank 诞生以来,图与图学习的演进历程,并重点介绍关键研究与成果。




引言


图——连接的数学表达


图能够以数学方式表示事物(人、地点、物体等)之间的联系,无论是在现实世界还是工程系统中,图都无处不在。图论的故事始于 1736 年,著名数学家莱昂哈德・欧拉(Leonhard Euler)曾思考:能否步行穿过普鲁士柯尼斯堡市(今俄罗斯加里宁格勒),跨越城中七座桥且每座桥不重复经过?在证明该约束条件下无解的过程中,欧拉奠定了现代图论的基础。他关于桥梁跨越的简单问题,如今被公认为经典数学难题之一 ——“柯尼斯堡七桥问题”。



柯尼斯堡七桥连接着普鲁士的柯尼斯堡市,这座城市被普雷格尔河(现称普列戈利亚河)分隔开来


基于图论数百年的理论基础,图算法在计算领域展现出独特潜力。事实上,它们已被广泛应用于疾病传播建模、物理模拟、交通预测、谣言与假新闻检测,甚至解释分子气味等跨领域场景。然而,尽管机器学习(ML)领域已存在数十年,图算法与机器学习的结合却姗姗来迟。


图基机器学习的近期演进


在本文中,我们将追溯图基机器学习的近代发展史,从早期网络分析到当下前沿应用,图基机器学习为解决现实问题提供了强大的工具集。


图算法——深度学习前时代


早期图分析研究主要聚焦于开发方法以深入理解图结构,旨在揭示图中隐藏的模式、属性及关系(例如网络中的社区结构或中心性),并关注于洞察图的整体组织与意义。与此同时,并行研究致力于设计基于图结构运行的算法 —— 这些算法以图为输入,对其执行特定计算或转换(例如计算最短路径、最大流等),旨在基于图的现有连接和节点解决定义明确的问题。


20 世纪 90 年代末网络数据兴起,21 世纪初社交媒体蓬勃发展,图算法由此崭露头角。它们不再仅是数学趣题,而是在快速发展的互联网中扮演关键角色。例如,1996 年,拉里・佩奇(Larry Page)和谢尔盖・布林(Sergey Brin)创造了 PageRank 算法,该算法最终成为全球最流行、应用最广泛的图算法之一。PageRank 将图论原理应用于网络,将互联网转化为一个由网页(节点)和超链接(边)构成的巨型互联图,这是最早且最具影响力的使用图基方法解决现实问题的案例之一。


图上的深度学习


图算法在组织和处理图数据方面取得了成功,但其局限性在于:难以将这些离散算法集成到神经网络领域。图嵌入(Graph Embedding)专门用于捕捉图中节点间的关系,并保留节点和边的结构(例如邻接关系或最短路径)。相比之下,常规神经网络嵌入通常基于特征表示单个数据点(如单词或图像),除非在数据中显式编码,否则不涉及关系结构建模。两者的核心差异在于:图嵌入关注图特有的关系,而常规嵌入关注基于特征的相似性。


图嵌入通过编码器将图数据转换为数值表示(即嵌入),以一种便于神经网络理解的方式捕捉图对象间的相似性。这一突破革新了图分析领域,并推动了近年来图学习研究的热潮。



基于随机游走的图嵌入类图学习模型学习一种对图信息进行编码的表示


图卷积网络(GCN)


2016 年,基普夫的研究引入了图卷积网络(GCNs),该模型能够高效学习图结构数据上的可微映射,从而生成更优的图数据表示。图数据上的可微映射通过应用可微操作实现节点和图表示的学习 —— 这些操作聚合邻居节点的信息,同时保留图结构。该方法支持端到端训练,可捕捉局部和全局关系,且能很好地扩展至大规模动态图。它无需手动特征工程,在节点分类、链接预测、图基推荐等任务上显著提升了性能,为图学习带来了重要优势。



图卷积网络会在若干层图结构上对数据进行变换


消息传递与图神经网络(MPNN)


2017 年,消息传递神经网络(MPNN)图学习模型能够对图数据计算更复杂的函数。该研究挑战了 “基于分子结构理解其性质” 的建模目标,通过图学习,其消息传递网络能够比此前最先进的方法更快地预测有机分子的量子性质。自此,一个全新的子领域应运而生 —— 将图学习应用于生物与化学领域。



消息传递神经网络利用原子连接构成的图来推断分子性质


GraphNet 模型与注意力机制


后续研究进一步扩展了图神经网络架构。例如,DeepMind 的模型能够实现更多功能,如在物理模拟中表示引力。2018 年,注意力(Attention)概念被引入 GNN,使模型能够聚焦于输入数据的最重要部分。


应用时代:现实世界中的图学习


图学习的整个演进历程,始终围绕着为图结构数据提供更好的集成能力,以优化图挖掘效果。如今,图学习正通过建模复杂关系的能力,迅速变革各个领域:




  • 在城市规划中,利用社交图和知识图优化个性化服务、预测实时交通;




  • 在医疗健康领域,用于分析移动模式、辅助药物发现与医学诊断;




  • 在金融领域,用于检测欺诈和洗钱行为;




  • 在推荐系统中,借助图结构提升推荐精度。




展望未来


随着近期人工智能的显著进展,一个值得探讨的问题是:如何将图结构数据与人工智能(尤其是大型语言模型,LLMs)更好地集成?若能实现,将在增强推理、知识表示和上下文理解等方面释放巨大潜力,但同时也面临挑战,例如以兼容 LLMs 的格式表示图,以及处理大规模图数据等。尽管 GNN 提供了强大的图处理能力,但其架构差异和输入模态不匹配问题,阻碍了其与 LLMs 的直接集成。最终,所有这些研究将推动我们更深入地理解对象间的关系,这对生物学、化学及各类技术平台的应用都将产生深远影响。


 



文章改编转载自:谷歌研究院

393
0
0
1
关于作者
相关文章
  • 基于扩散模型的DNA-Diffusion——用生成式AI框架设计合成调控元 ...
    合成调控元件(如启动子、增强子和顺式调控序列)是精确控制基因表达的核心组件,但其设计长期依 ...
    了解详情 
  • GCN-Transformer架构MoleculeFormer:多尺度特征融合的分子性质 ...
    2025年11月25日,复旦大学韩涟漪、夏晶晶团队在《Communications Biology》期刊上发表研究论文, ...
    了解详情 
  • 页岩孔隙“显微镜”升级:生成对抗网络让油气储层观测精度提升8 ...
    中国石油大学(华东)团队在《石油勘探与开发》2025年5期发表《 基于生成对抗网络的页岩孔隙结构 ...
    了解详情 
  • 稀疏去噪模型salad:高效灵活的超长链蛋白质结构生成新方法 ...
    2025年发表于《Nature Machine Intelligence》的研究,提出稀疏去噪模型salad(sparse all-atom ...
    了解详情 
  • LSTM+KNN的金融时间序列预测
     今天的案例是:STM-KNN融合模型在金融时间序列预测中的应用。当你在预测股票价格的变化。 ...
    了解详情 
联系我们
二维码
在本版发帖返回顶部
快速回复 返回顶部 返回列表
玻色有奖小调研
填写问卷,将免费赠送您5个100bit真机配额
(单选) 您是从哪个渠道得知我们的?*
您是从哪个社交媒体得知我们的?*
您是通过哪个学校的校园宣讲得知我们的呢?
取消

提交成功

真机配额已发放到您的账户,可前往【云平台】查看

量子AI开发者认证

考核目标

开发者能够成功搭建Kaiwu-PyTorch-Plugin项目基础环境,并成功运行示例代码,根据示例提示,输出指定的值并填写至相应的输入框中。

通过奖励

5个一年效期的1000量子比特真机配额

专属「量子AI开发者」社区认证标识

开发者权益

每月固定权益:5个550量子比特真机配额
前往考核

第一步

按照README提示成功安装Kaiwu-PyTorch-Plugin库环境依赖
前往GitHub

第二步

运行 community-assessment 分支下的 run_rbm.py 代码示例

第三步

理解示例代码,手动打印并填写如下数值:

正相采样的状态

负相采样的状态

正相的能量值

负相的能量值

*

提交答案

开发者权益

每月固定权益:5个550量子比特的真机配额

恭喜您完成考核

您将获得量子AI开发者认证标识及考核奖励

1000 bit*5

配额

Quantum AI Developer Certification

Assessment Objectives

Developers should successfully set up the basic environment for the Kaiwu-PyTorch-Plugin project, run the QBM-VAE sample code, and calculate the correct FID value based on the random seed value provided by the system.

Pass Rewards

10 quotas for 550-qubit real quantum machines with a one-year validity period

Exclusive "Quantum AI Developer" Community Certification Badge

Developer Benefits

Fixed Monthly Benefits: 5 quotas for 550-qubit real quantum machines
Proceed to Assessment

Step 1

Install the environment dependencies for the Kaiwu-PyTorch-Plugin library according to the README instructions
Go to GitHub

Step 2

Replace the Seed Value

Your seed value is

Step 3

Enter the FID Value You Calculated

*

Submit Answer

Developer Benefits

Fixed Monthly Benefits: 5 quotas of 550-qubit real machines

Congratulations on Completing the Assessment

You will receive the Quantum AI Developer Certification Badge and Assessment Rewards

550bit*10

Quotas