量子前沿英雄谱|“光量子探险家”McMahon:将任何物理系统变成神经网络 ...

241 0 2024-08-27 发布者: 社区官方

随着摩尔定律失效,有些研究人员们跳出提高当前计算机处理器性能这一思路,试图从更基础的数学和物理学角度来解决这个问题。 对于在量子计算领域已展露头角的青年科学家Peter McMahon(彼得 麦克马洪)博士来说,探 ...

随着摩尔定律失效,有些研究人员们跳出提高当前计算机处理器性能这一思路,试图从更基础的数学和物理学角度来解决这个问题。

 

对于在量子计算领域已展露头角的青年科学家Peter McMahon(彼得· 麦克马洪)博士来说,探索计算的未来,重新理解计算的本质,是寻找答案的关键。

 

康奈尔大学应用与工程物理学院教授、光量子计算科学家Peter McMahon(图片来源:网络

“(摩尔定律的失效)是无法避免的问题。那就要退一步问,如果不得不全部推倒重来时我们该怎么做?制造处理器的真正最有效的方法是什么?”

 

计算的万变不离其宗


科学家们总有那么点儿“与众不同”之处,McMahon也是。在南非德班长大的他,从小热爱数学和物理。高中时McMahon“沉迷”于计算机,不仅将大量的时间花费在程序编写上,甚至还运营了一家小型外包企业为大公司编写数据库软件。

 

2003年,McMahon进入南非最古老的大学——开普敦大学,攻读电气和计算机工程学士学位,并在这里开始了一系列的计算物理启发式学习。在大学一年级时通过阅读,他得到了一个影响科研生涯的理念:“物理定律——例如控制电子运动的定律等,对可计算内容和计算速度具有决定性影响”。由此激发了McMahon对非经典物理计算体系的兴趣。

 

大学四年级时,McMahon获得了一个机会,前往美国伊利诺伊大学国家超级计算应用中心,参与利用FPGA专用芯片加速科学计算应用的研究项目。随后,McMahon还被邀请进入到一个硕士研究项目中,并被派往加州大学伯克利分校开展射电天文学和生物信息学的仪器研究。后来,McMahon还曾为这一阶段的工作撰写了论文,并起了一个有趣的名字《Adventures in Radio Astronomy Instrumentation and Signal Processing 》(射电天文仪器和信号处理历险记)。

 

在论文中,McMahon详细介绍了天文学领域内的各种仪器及信号处理的方法。(图片来源:McMahon论文插图)

 

这些看似与量子计算毫无关联的经历,为他日后的研究奠定了重要基础。McMahon对这些工作如数家珍,“乍一看,这种体验似乎与我现在所做的完全无关,但很大情况下,用于控制和记录量子计算机输出的电子设备所使用的技术,就与这些非常相似。”

 

2008年,McMahon在获得开普敦大学的学士学位和硕士学位后,进入斯坦福大学攻读电气工程硕士学位和博士学位。在这里,他遇到了人生的重要导师——量子计算领域的著名科学家Yoshihisa Yamamoto教授。在Yamamoto教授带领下,McMahon开始对基于半导体进行光子自旋操控实现量子信息处理领域展开系统化地研究。

 

由此,McMahon正式开启了在量子计算世界的“探险”。

 

看好光量子计算


“我们能否找到一种计算方式,它可能无法解决所有的计算任务,但更有效地解决一些更重要的计算任务?”谈及量子计算的未来,McMahon更看中的是实际价值。

 

在众多实现量子计算的技术路线中,McMahon在超导电路和光量子两种技术路线上进行了深入探索。

 

在这两种技术中,我们尝试过很多种想法来实现物理系统的制备。我们发现,光量子计算机尽管在某些功能上受到限制,但(它能够表现出的性能)仍然是经典计算机所无法比拟的。在短期内它将让我们了解我们的光子架构在实践中的可行性。在更遥远的未来,我们有可能制造出光子通用量子计算机——能够运行任何算法的机器。

 

McMahon同时指出,超导电路量子计算存在着固有问题。从表面上看超导似乎是一种易于实现的技术,看起来与经典电子电路非常相似。但是主要问题是它们必须在接近绝对零的温度下运行。

 

McMahon说:“如果你不在非常低的温度下运行它们,它们的表现就不会像量子力学系统一样。换句话说,量子力学效应被冲淡了。” 所以,在保持超导电路的超低温的同时,增加它们的数量和它们执行的计算的复杂性是一项艰巨的任务。

 

对量子计算领域来说,2011年是个重要的时间节点,对McMahon来说也是。由Yamamoto教授领导的斯坦福大学的一个小组发起了一项开发用于优化组合问题的光学量子计算设备项目,相干伊辛机(Coherent Ising Machine,CIM)量子计算机的研制迎来了发展的新浪潮。作为Yamamoto教授的博士学生,McMahon是该团队的中坚力量成员之一。

 

 McMahon在Yamamoto教授的斯坦福大学研究小组中。(图片来源:斯坦福大学)

 

CIM是一种采用光量子的耗散式架构的量子计算机,由起源于美国斯坦福大学Yamamoto教授的研究团队首创。CIM采用光量子作为量子比特,与超导、离子阱等使用逻辑门计算架构的其他技术路线相比不需复杂而昂贵的稀释制冷机等设备,对环境噪声和错误有很强的抵抗力,更适用于大规模的优化组合问题求解,能在较短时间内投入实用化的场景中。目前也是日本量子计算机的主要研发路线。

 

面对光量子计算以及CIM的广阔发展前景,在斯坦福大学期间,McMahon在该领域完成了大量且关键的研究工作。2014年,获得斯坦福大学电气工程博士学位后,McMahon进入斯坦福大学Hideo Mabuchi教授的实验室开始为期五年的博士后研究员生涯。同时,McMahon继续参与Yamamoto教授团队的CIM研究项目,在利用光量子计算机解决优化问题方面做出了重要工作。这一时期,McMahon的重要研究成果有:

 

2010年,McMahon团队在期刊Nature Photonics(自然光子学)上发表了题为《Ultrafast Optical Spin Echo in a Single Quantum Dot》(单个量子点中的超快光学自旋回波)的研究成果。通过使用超快的全光自旋回波技术将单个量子点电子自旋的退相干时间从纳秒增加到几微秒,展现了未来光子量子信息处理器和中继网络的广阔前景。

 

2016年,McMahon团队建造了一台基于FPGA的测量-反馈式相干伊辛机。该量子计算系统可以构建100次自旋解决伊辛问题。与此同时,该团队还将其与其他专业系统(包括经典电子计算机上的模拟退火算法、NASA所使用的D-Wave量子退火机等)进一步基准测试比较,充分证明了CIM可以成为有效的量子优化求解设备。

 

同年 McMahon两篇关于相干伊辛机领域的重要研究成果相继发表在顶级学术期刊Science(科学)上:《A coherent Ising machine for 2000-node optimization questions》(用于解决2000节点优化问题的相干伊辛机)和《A fully-programmable 100-spin coherent Ising machine with all-to-all connections》(实现全连接的完全可编程100自旋规模的CIM)。

 

在这两篇论文中,McMahon的团队充分展示了光纤测量类CIM在当前解决小规模问题以及在解决更多使用NP完全问题上的有效性与高性能,从而向人们展现了CIM这种采用光量子的耗散式架构的量子计算机的实力与优势。McMahon也自此成为了量子计算研究领域的代表科学家之一。

 

面向未来的量子神经网络


2019年加入康奈尔大学担任应用和工程物理助理教授后,McMahon在量子神经网络领域进行了大量的工作。他指出,量子计算领域向来有一个关键而尚未完全解决的问题是,相比于经典神经网络(NN),量子神经网络(QNN)具有哪些优势以及如何显现出这些优势。在研究这个问题的过程中,McMahon找到了一个答案:

 

2019年,他与NTT Research博士后研究员Logan G. Wright合作在Conference on Lasers and Electro-Optics(激光和电光会议会刊)上发表了题为《Quantum neural network capacity》(量子神经网络的容量)的研究成果。他们通过模拟一个基于高斯玻色子采样的特定QNN,取得了量子神经网络容量与量子系统被测量册数之间的解析表达式,并证明了采用量子态参数化的QNN记忆容量将比NN具有指数级的总容量。

 

在康奈尔大学承担教学任务的同时,McMahon还带领实验室团队开展计算物理研究,以及如何设计物理系统以新方式来执行计算,从而提供优于当前基于CMOS的冯诺依曼处理器的优势。除了量子计算方向,该研究团队还探索其他经典计算技术,包括光子计算和神经形态计算等。

 

McMahon在康奈尔大学的实验室团队

(图片来源:康奈尔大学)

 

2019年,康奈尔大学与NTT Research PHI实验室建立了联合研究关系,McMahon领导实验室研究团队与NTT Research PHI实验室共同开展致力于解决“如何设计新式物理系统执行计算”问题的研究。

最近,该项目在期刊《Nature》(自然)上发表了一篇题为《Deep physical neural networks trained with backpropagation》(用反向传播训练的深度物理神经网络)的论文。论文中描述了该团队将经过训练的系统命名为物理神经网络(PNN),着重强调了该方法是直接训练物理系统,而不是像传统路线那样,先训练数学函数然后再设计物理过程来执行。同时他们还发明了一种新算法——物理感知训练(PAT)。该算法将深度神经网络训练应用于可控物理系统,从而不受现有能源控制和其他可扩展性条件限制。

具体来说,该团队将反向传播方法从数字训练转化为直接的物理训练,通过学习物理算法以在非常规但具有强大潜力的物理基底中更容易的提取计算性能,从而提高深度神经网络的计算效率和速度。

PNN实验示例(图片来源:https://opg.optica.org/)

 

为了证明这一算法的实用性,该团队还利用扬声器、电子器件、激光器三种物理系统,分别制造出了声学、电学、光学版的物理神经网络,经过PAT训练后执行任务。准确率分别达到了:97%、93%和87%,充分显现了有效性。

 

McMahon表示:“从不寻常的物理系统中制造神经网络的想法起初听起来很荒谬。但事实证明,我们几乎可以将任何物理系统变成神经网络。

 

下一步,他的实验室研究团队将探索出最适合机器学习计算的物理系统。

 

参考:

1.https://www.engineering.cornell.edu/spotlights/welcome-peter-mcmahon

2.https://research.cornell.edu/news-features/where-future-quantum-computing

3.https://www.engineering.cornell.edu/quantum-engineering-0?fbclid=IwAR0qydktuRyZumB1enVN7HHxlK429SBTU_4sCBTu4ZxpOj8z81yF_KR0DKY

4.https://news.cornell.edu/stories/2022/01/physical-systems-perform-machine-learning-computations

5.http://us.acrofan.com/detail.php?number=608389&UA=PC

 

返回顶部
返回顶部