本帖最后由 薛定谔了么 于 2025-6-26 18:10 编辑
从欧拉 “柯尼斯堡七桥问题” 奠定图论基础,到图算法在网络数据和社交媒体中崭露头角,再到 DeepWalk、GCN、MPNN 等图学习模型相继出现,图学习在节点分类、链接预测等任务上发挥重要作用,如今已广泛应用于城市规划、医疗健康等多个领域,未来在与大型语言模型集成等方面潜力无限。本文将阐述自 1996 年 PageRank 诞生以来,图与图学习的演进历程,并重点介绍关键研究与成果。

引言
图——连接的数学表达
图能够以数学方式表示事物(人、地点、物体等)之间的联系,无论是在现实世界还是工程系统中,图都无处不在。图论的故事始于 1736 年,著名数学家莱昂哈德・欧拉(Leonhard Euler)曾思考:能否步行穿过普鲁士柯尼斯堡市(今俄罗斯加里宁格勒),跨越城中七座桥且每座桥不重复经过?在证明该约束条件下无解的过程中,欧拉奠定了现代图论的基础。他关于桥梁跨越的简单问题,如今被公认为经典数学难题之一 ——“柯尼斯堡七桥问题”。

柯尼斯堡七桥连接着普鲁士的柯尼斯堡市,这座城市被普雷格尔河(现称普列戈利亚河)分隔开来
基于图论数百年的理论基础,图算法在计算领域展现出独特潜力。事实上,它们已被广泛应用于疾病传播建模、物理模拟、交通预测、谣言与假新闻检测,甚至解释分子气味等跨领域场景。然而,尽管机器学习(ML)领域已存在数十年,图算法与机器学习的结合却姗姗来迟。
图基机器学习的近期演进
在本文中,我们将追溯图基机器学习的近代发展史,从早期网络分析到当下前沿应用,图基机器学习为解决现实问题提供了强大的工具集。
图算法——深度学习前时代
早期图分析研究主要聚焦于开发方法以深入理解图结构,旨在揭示图中隐藏的模式、属性及关系(例如网络中的社区结构或中心性),并关注于洞察图的整体组织与意义。与此同时,并行研究致力于设计基于图结构运行的算法 —— 这些算法以图为输入,对其执行特定计算或转换(例如计算最短路径、最大流等),旨在基于图的现有连接和节点解决定义明确的问题。
20 世纪 90 年代末网络数据兴起,21 世纪初社交媒体蓬勃发展,图算法由此崭露头角。它们不再仅是数学趣题,而是在快速发展的互联网中扮演关键角色。例如,1996 年,拉里・佩奇(Larry Page)和谢尔盖・布林(Sergey Brin)创造了 PageRank 算法,该算法最终成为全球最流行、应用最广泛的图算法之一。PageRank 将图论原理应用于网络,将互联网转化为一个由网页(节点)和超链接(边)构成的巨型互联图,这是最早且最具影响力的使用图基方法解决现实问题的案例之一。
图上的深度学习
图算法在组织和处理图数据方面取得了成功,但其局限性在于:难以将这些离散算法集成到神经网络领域。图嵌入(Graph Embedding)专门用于捕捉图中节点间的关系,并保留节点和边的结构(例如邻接关系或最短路径)。相比之下,常规神经网络嵌入通常基于特征表示单个数据点(如单词或图像),除非在数据中显式编码,否则不涉及关系结构建模。两者的核心差异在于:图嵌入关注图特有的关系,而常规嵌入关注基于特征的相似性。
图嵌入通过编码器将图数据转换为数值表示(即嵌入),以一种便于神经网络理解的方式捕捉图对象间的相似性。这一突破革新了图分析领域,并推动了近年来图学习研究的热潮。

基于随机游走的图嵌入类图学习模型学习一种对图信息进行编码的表示
图卷积网络(GCN)
2016 年,基普夫的研究引入了图卷积网络(GCNs),该模型能够高效学习图结构数据上的可微映射,从而生成更优的图数据表示。图数据上的可微映射通过应用可微操作实现节点和图表示的学习 —— 这些操作聚合邻居节点的信息,同时保留图结构。该方法支持端到端训练,可捕捉局部和全局关系,且能很好地扩展至大规模动态图。它无需手动特征工程,在节点分类、链接预测、图基推荐等任务上显著提升了性能,为图学习带来了重要优势。

图卷积网络会在若干层图结构上对数据进行变换
消息传递与图神经网络(MPNN)
2017 年,消息传递神经网络(MPNN)图学习模型能够对图数据计算更复杂的函数。该研究挑战了 “基于分子结构理解其性质” 的建模目标,通过图学习,其消息传递网络能够比此前最先进的方法更快地预测有机分子的量子性质。自此,一个全新的子领域应运而生 —— 将图学习应用于生物与化学领域。

消息传递神经网络利用原子连接构成的图来推断分子性质
GraphNet 模型与注意力机制
后续研究进一步扩展了图神经网络架构。例如,DeepMind 的模型能够实现更多功能,如在物理模拟中表示引力。2018 年,注意力(Attention)概念被引入 GNN,使模型能够聚焦于输入数据的最重要部分。
应用时代:现实世界中的图学习
图学习的整个演进历程,始终围绕着为图结构数据提供更好的集成能力,以优化图挖掘效果。如今,图学习正通过建模复杂关系的能力,迅速变革各个领域:
展望未来
随着近期人工智能的显著进展,一个值得探讨的问题是:如何将图结构数据与人工智能(尤其是大型语言模型,LLMs)更好地集成?若能实现,将在增强推理、知识表示和上下文理解等方面释放巨大潜力,但同时也面临挑战,例如以兼容 LLMs 的格式表示图,以及处理大规模图数据等。尽管 GNN 提供了强大的图处理能力,但其架构差异和输入模态不匹配问题,阻碍了其与 LLMs 的直接集成。最终,所有这些研究将推动我们更深入地理解对象间的关系,这对生物学、化学及各类技术平台的应用都将产生深远影响。
文章改编转载自:谷歌研究院
|