本文基于物理驱动的计算范式,系统梳理了统计物理、神经网络与发育生物学在能量景观框架下的深层统一性。文章指出,起源于1920年代的伊辛模型通过将粒子自旋相互作用抽象为能量函数,不仅解释了铁磁相变,更为复杂系统建模提供了通用语言。1982年,Hopfield将这一物理图景引入人工智能,利用自旋玻璃理论将神经元网络重构为动力学系统,其记忆机制对应于能量景观的局部极小值,这一变革直接启发了基于梯度下降的反向传播算法。文章进一步阐述了流形作为高维空间局部线性近似的数学基础,及其在表征AI损失函数与Waddington表观遗传景观中的核心地位。通过类比分析,研究发现细胞分化与神经网络推理在物理机制上高度同构:基因调控网络塑造了表观遗传势能面,细胞类型即为景观中的稳定吸引子,而山中伸弥重编程与癌症发生则可分别解释为景观中的能量注入与异常吸引子形成。最后,文章探讨了当前系统生物学利用单细胞测序与最优传输理论重建高维景观的前沿实践,揭示了从原子模拟到生命发育,势能面、梯度与采样等物理语言在跨越尺度上的普适性,并呼应了2025年诺贝尔物理学奖对“神经网络作为物理动力学系统”这一底层逻辑的高度认可。
一、从伊辛模型到Hopfield网络:神经网络的物理起源
诞生于二十世纪二十年代的伊辛模型,最初作为统计物理中解释铁磁相变的核心理论工具,展现了超越时代的生命力。该模型通过将磁性材料中粒子的自旋状态抽象为向上或向下的二元变量,并将粒子间复杂的相互作用编码为能量函数,成功揭示了物质在临界温度附近发生的相变行为。更为深刻的是,伊辛模型具备刻画复杂系统临界现象与长程关联的普适能力,这种通过局部相互作用涌现出全局有序性的机制,使其后续被广泛推广至社会科学领域,用于建模舆论形成、观点动力学等群体行为。
1982年,物理学家John Hopfield完成了极具开创性的跨界工作,他将伊辛模型与自旋玻璃理论系统地引入计算机科学。在这一框架下,生物神经元的激活与抑制状态被完美映射为物理自旋的向上或向下,而神经元之间的连接权重则对应于物理系统中的交换作用耦合常数。Hopfield定义了一个具有二次型形式的网络能量函数,这一举措彻底改变了神经网络的底层逻辑:它不再是工程师手中难以捉摸的逻辑电路,而是一个严谨的动力学系统。在该系统中,记忆内容被编码为能量景观中的局部极小值,当输入不完整或带有噪声的信息时,系统会依据能量最小化原理,自发地沿着势能梯度下滑,最终收敛到对应的稳态,从而实现内容的自动召回与纠错。
Kimi 画的 Ising model 的 energy landscape,并遍历了所有构型和能量分布. 不难看出是一个碗装的二次曲面
这一物理图景直接为反向传播算法奠定了理论基础,因为深度学习的训练过程本质上就是在高维损失函数构成的能量景观中搜寻全局最小值的过程。值得注意的是,文章特别强调了东京大学甘利俊一教授的前瞻性贡献:早在1967年,他便提出了随机梯度下降理论,这被视为反向传播算法的理论源头之一;1972年,他提出了世界上首个学习型循环神经网络;至1980年,他又开创性地将微分几何引入信息论,建立了信息几何学。这些工作与Hopfield的研究互为表里,共同构筑了现代神经网络的物理与数学基石。
二、核心数学概念:流形与能量景观
要深入理解上述动力学系统,必须掌握两个核心的数学概念:流形与能量景观。流形是微分几何的基石,其定义为“局部近似低维欧氏空间的高维拓扑空间”。这意味着尽管系统整体可能存在于极其高维甚至非欧的空间中,但在任意一个微小的局部范围内,其行为都可以用简单的线性坐标来描述。一个经典的例子是地球表面,作为一个三维空间中的二维封闭曲面,在小范围测绘时我们可以将其视为平坦的平面。流形概念的重要性在于,它提供了处理高维复杂数据的底层数学框架,是理解现代人工智能与理论物理不可或缺的语言。
一个流形示意图
基于流形概念衍生出的能量景观,则是描述系统演化的核心载体。能量景观本质上是嵌入在高维参数空间中的一张流形“曲面”,其形态特征决定了系统的命运:地势的低洼处即为吸引子,代表系统的稳定状态;而高耸的山峰则代表极不稳定的高能状态。对于深度学习而言,整个训练过程实际上就是通过对数以亿计的参数进行微调,来“塑造”这张景观图的地貌,迫使真实的样本数据恰好落在景观的谷底,而错误答案则被推向高峰。当模型部署进行推理时,用户的输入就如同在已建成的地形上释放了一颗小球,小球在重力和摩擦力的作用下滚动并最终停留在某个谷底,这个谷底所对应的输出即为模型的答案。由于实际应用的景观往往具有数百万甚至数十亿的维度,人类无法通过视觉直观观测,因此如何通过算法高效地找到这些隐藏在高维空间中的吸引子,并判断其是局部最优还是全局最优,始终是计算科学的核心挑战。
三、Waddington表观遗传景观:物理框架在生命科学中的复现
令人惊叹的是,这种源于物理学的能量景观框架,在生命科学中找到了完美的镜像。发育生物学家康拉德·沃丁顿早在1957年提出的表观遗传景观假说,与Hopfield能量景观在结构上呈现出惊人的同构性,两者仅存在语义上的差异,而底层逻辑完全一致。
在人工智能领域,滚动的“小球”是输入的Token或Prompt,景观是由损失函数定义的能量地形,景观中的吸引子对应着模型存储的记忆或输出的答案,而驱动小球运动的力来源于神经元之间的连接权重。而在发育生物学中,这颗“小球”则代表着单个细胞的基因表达状态,景观是表观遗传势能面,吸引子对应着稳定的细胞类型,如神经元、心肌细胞或上皮细胞,驱动这一切的作用力则来源于基因调控网络内部的相互作用。
细胞分化的过程,正是这颗小球在重力作用下顺着景观滑向特定谷底的自然结果。分子层面的热涨落作为一种随机噪声,有时足以让小球越过狭窄的山脊,发生细胞类型的转变。山中伸弥利用四个转录因子将成体细胞诱导为多能干细胞的技术,在物理视角下可被解释为外部能量注入导致小球克服势垒,从谷底重新回到了景观的顶端。更为深刻的是,癌症在理论上可以被理解为一种“错误的异常吸引子”:基因突变或表观遗传修饰改变了景观的地形,凭空制造出了不该存在的深谷,导致细胞命运错误地陷入恶性增殖的稳态。
这是一种 Lorentz attractor,像不动点一样. 我记得原系统应当是一个复杂系统,看过一篇关于复杂系统的 Lyapnov instability 的文章
四、当下交叉研究与系列收尾
基于这种统一性,当前的系统生物学正致力于从实验数据中重建这一高维表观遗传景观。研究者利用单细胞测序技术获取数万个细胞在数万个基因维度上的表达数据,这相当于对高维景观进行了大规模的点采样。通过引入RNA速率算法为每一个细胞标注状态变化的矢量方向,并结合最优传输理论来推测细胞从一种类型转化为另一种类型的最优路径,科学家们正在尝试反推出完整的景观地貌。这套方法论与分子动力学模拟中的构象采样和反应路径搜索逻辑高度一致,显示了物理算法在生命解析中的强大威力。
landscape 上出现三种 stable state attractor:正常 (normal), 胃炎 (Gastritis) 和胃癌 (Gastric cancer)
全文最终点题指出,从微观的原子振动模拟、中观的神经网络训练,到宏观的生命个体发育,这些过程在底层共享着同一套物理语言——势能面、吸引子、流形、梯度与采样。这种跨越尺度的统一性深刻体现了物理学的逻辑之美,它用最基础的几何与动力学原理,将看似毫不相关的学科焊接在一起。作者在后记中特别感谢了来自南开大学的相关研究者带来的启发,并表达了对复杂系统与生命科学深度融合的期待。文章最后强调,2025年诺贝尔物理学奖授予Hopfield与Hinton,正是对“神经网络本质是物理动力学系统”这一底层逻辑的最高认可,也预示着物理驱动的计算范式将在二十一世纪的生命科学革命中扮演核心角色。
原文链接:https://mp.weixin.qq.com/s/kP8Le3SvFBlV_sSbrrRDLA |