在这种情况下,所得的正则化项与w的2范数成正比,而不是与先前示例中的0范数成正比,后者可能不是最优的。尽管如此,以上内容还是一个典型的例子,其中量子体系结构导致了ML设置,这在经典情况下是不会被探索的(损耗Lq在许多情况下不太可能自然出现),并且动机很好,因为:a)不是凸函数,因此有可能规避凸函数的所有不合格结果,并且b)优化过程可以在物理系统中实现。作者进行了许多数值实验,证明了在分析噪声数据时选择非凸损失函数的优势,这肯定是有希望的。在后来的工作中(Denchev等人,2015),还提出了在量子架构中可以实现的损耗正则化的组合也可以用于所谓的完全校正性的基数罚分增强,这被认为是经典难以处理的 。
其细节超出了本文的讨论范围,但我们至少可以解决这个问题。 在校正增强中,该算法每次基本上一次更新权重。在完全校正的提升中,在提升算法优化的第t步,同时更新w的t个条目。众所周知,这会导致更好的正则化解决方案,但优化难度更大。 基数惩罚涉及将0范数明确地用于正则化(前面讨论过),而不是更常见的1范数。同样,这也导致了更难的优化,可以使用退火架构对其进行处理。在(Babbush et al。,2014)中,作者观察到 任何多项式无约束二进制优化都可以以较小的开销映射到(略大的)QUBO上,从而显着概括了可以嵌入量子体系结构的损失函数的范围 问题。这尤其为实现非凸的奇数多项式提供了可能性,这些奇数多项式可以逼近0-1损失函数。 这种方法引入了新的异常但有希望的损失函数类。
b. 量子加速的应用(Applications of quantum boosting)
在(Pudenz和Lidar,2013)的上述“量子增强”架构的基础上,作者探索了(除了增强之外)实现 异常检测 的可能性,特别是在计算验证和验证的计算难题中预见到的。在建议的学习步骤中,作者使用量子优化(增强)功能来学习所测试程序的特性。在新颖的测试步骤中,作者 修改了目标哈密顿量,以降低对输入和输出进行编码的状态的能量,而真实和理想的软件则有所不同。然后可以在叠层绝热召回的背景下,像前面提到的建议一样,以叠加的方式准备这些叠加(即,它们可以准备在输入上叠加的状态,P将产生错误的输出)(Neigovzen等人, (2009年)。
c. 超越增强提升(Beyond boosting )
除了增强问题外,退火器还被证明对 训练贝叶斯网络结构学习问题 有用(O’Gorman等人,2015),因为他们的训练也可以简化为QUBO。此外,退火架构还可以仅依赖于采样而不是优化 用于深度神经网络的训练。对此的一种值得注意的方法是基于这样一个事实,即对深度网络的训练通常依赖于所谓的生成性深度可信网络,该网络 本质上是多层的受限BM。深度信念网络的训练反过来是计算的瓶颈,因为我需要采样难以生成的分布,这可以使用退火架构更有效地进行准备,请参见例如 (足立和亨德森,2015年)。进一步。 已经提出了引入完全量子BM类模型的新颖思想(Amin等人,2016)。此外,在最近的工作(Sieberer和Lechner,2017)(基于Lechner等人,2015)的灵活构造的基础上,作者展示了如何实现可编程绝热体系结构,该体系结构允许在权重自身重叠的情况下运行算法 。这种可能性也一定会激发出新颖的QML思想。 从BM出发,在最近的工作中(Wittek和Gogolin,2017),作者还展示了 合适的退火架构如何在所谓的马尔可夫逻辑网络中加速概率推理的执行。此任务涉及对统计模型(具体而言是包括伊辛模型)的统计模型(具体是马尔可夫随机场)产生的分区函数的估计。 量子退火可以加速该子任务。
更一般地讲,在退火算法之外的地方,人们开始探索限制,甚至简单的量子系统(可以用当前技术实现)的想法,这些想法可以实现对监督学习有用的信息处理元素。例如,在(Schuld等人,2017)中,一个 简单的干涉电路被用于有效评估数据向量之间的距离,这对于分类和聚类很有用。这些最新想法的更完整说明超出了本文的范围。
2. 加快电路架构(Speed-ups in circuit architectures)
ML最近最重要的应用之一是在 数据挖掘 和所谓的 大数据分析 方面。通过提出解决特定ML问题的专用量子算法,已经在此方面取得了最令人印象深刻的改进。这样的算法假定了成熟的量子计算机的可用性,并且自2000年代初以来就被初步地进行了探索。但是,在最近一段时间,我们目睹了大量的想法。 与我们在量子退火的情况下看到的情况不同,在量子退火的情况下,优化子例程仅在量子系统上运行,在本节的大多数方法中,整个算法甚至数据集都可以进行量化。
ML的量子增强思想大致可分为两类:a)依靠Grover的搜索和幅度放大来获得高达二次速度的方法,以及b)将相关信息编码为量子幅度的方法 ,并且有可能实现指数级的改进。第二组方法可能构成了量子ML中最发达的研究路线,并收集了用于量子ML提案的大量量子工具-最著名的是***量子线性代数***。
a.通过幅度放大来加速(Speed-ups by amplitude amplification )
在(Anguita 等人,2003)中,注意到支持向量机的训练可能是一项艰巨的优化任务,没有比蛮力搜索更好的方法了。反过来,对于没有结构的这种优化情况,QIP至少会以Grover(Grover,1996)搜索算法的变体或将其应用于最小查找的方式得到二次改进(Durr and Hoyer,1999)。这个想法早于并在本质上类似于上一小节中基于绝热的早期提议,但该方法实质上是不同的。在无监督的学习任务的背景下,更广泛地探索了类似Grover的搜索机制所带来的二次改进的潜力(Aèmeur等人,2013)。在这里,作者假设可以访问黑匣子Oracle,该Oracle可以计算任意两个数据点之间的距离度量。 使用这种方法,结合振幅放大技术(例如,最小发现(Durr和Hoyer,1999)),作者在聚类(无监督学习)任务中使用的关键子程序实现了二次改进。具体而言,在执行最小生成树聚类,除法聚类和k中值聚类的算法中获得了改进。此外,这组作者还表明,通过构建Grover搜索的分布式版本,量子效应可以更好地并行化聚类任务。由于经常可以使用大型数据库的分布,因此这种构造可能特别重要。
最近,在(Wiebe等人,2014a)中,作者考虑了训练深层(超过两层)BM的问题。正如我们前面提到的,精确训练BM的瓶颈之一是因为它需要估计某些均衡分布的概率。通常无法进行分析计算(这与计算分区函数一样困难),并且采样方法的成本很高,因为它需要获得平衡分布和多次迭代才能可靠地估计较小的值。通常通过使用代理解决方案(例如,依赖于对比发散)来规避大约训练,但是已知这些方法不如精确训练。在(Wiebe et al。,2014a)中,设计了一种量子算法,该算法***依靠量子幅度放大来准备目标分布的相干编码,从而经常使训练点的数量得到二次改进***,在某些情况下,甚至使神经元的数量呈指数增长。在纯数据挖掘环境中,特别是在关联规则挖掘中,也获得了二次改进(Yu等,2016),粗略地讲,它可以识别大型数据库中对象之间的相关性。作为依赖振幅放大的量子算法一类的最后例子,我们提到了用于训练感知器的算法(Wiebe等,2016)。在这里,量子幅度放大被用于二次加速训练,但是,有趣的是,也被二次减小误差概率。由于感知器构成了SVM的特殊情况,因此该结果在动机上与更老的提议相似(Anguita等,2003),但依赖于更现代且涉及更多的技术。
b. 幅度编码的前体 (Precursors of amplitude encoding)
在早期开创性工作中(经常被忽略)(舒茨德,2003年),舒茨德提出了将QC有趣地应用于模式识别问题的方法,该方法解决了许多仅由社区进行研究和重新发明相对较新的想法。 作者考虑了以N×M黑白位图指定的,以函数f为特征的图像中识别“图案”的问题:{1,…,N}×{1,…,M} →{{0,1}(在技术上与CLT中的概念相同,请参见II.B.1),指定坐标(x,y)处像素的颜色值f(x,y)∈{0,1} 。 函数f给出为量子oracle | x>| y> | b> Uf→| x> | y> |b⊕f(x,y)>。oracle在量子并行中使用(应用于所有坐标的叠加),并且以位值为1为条件(只要点的密度恒定,该过程以恒定的概率成功进行),导致状态|ψ>= NΣ_(x,y stf(x,y)= 1) | x>| y>,其中N是归一化因子。注意,以计算为基础时,此 状态与矢量化位图图像本身成比例。 接下来,作者指出,通常可以通过将离散傅立叶变换应用于具有经典复杂度O(NM log(NM))的图像矢量来检测“图案”(重复宏观特征)。然而,***量子傅里叶变换(QFT)可以利用指数更少的门应用于状态|ψ>***。作者继续表明,对QFT转换状态的测量可能会产生有用的信息,例如模式定位。 这项工作在某些方面是创新的。首先,作者使用量子存储器将数据点(此处为二进制值的字符串)编码为振幅,其方式与VI.B.1中讨论的内容可寻址存储器的应用有关。 然而,应该指出的是,在振幅编码的当前应用中,非二进制振幅具有明确的含义(在灰度图像中),尽管作者没有明确讨论。其次,与所有先前的建议相反,作者展示了一系列任务可量化的指数计算复杂性改进的潜力。但是,这完全取决于对预填充数据库(Uf)的访问,而预填充数据库的加载将使任何优势失效。除了可以认为是一个开销的事实外,舒茨德(Schutzhold)讨论了一种 以量子并行方式从光学图像加载数据的物理方法,这种方法可能是有效的。
c. 幅度编码:线性代数工具(Amplitude encoding: linear algebra tools )
幅度编码的最基本思想是 将N级量子系统的状态视为数据向量本身。更准确地说,给定数据向量x∈Rn,幅度编码将构成归一化量子态 |x> =Σi xi|i>/||x||, 通常还假设总是可以访问向量||x||的范数。
注意,将N维数据点编码为n∈O(log(N))个量子位的幅度。因此,应用于n比特寄存器对数据进行编码的任何多项式电路都仅构成相对于数据矢量大小的对数计算,这是所有指数改进的基础(同样在(Schutzhold,2003)的情况下) ,在上一节中讨论)。
这些想法导致了一个可以称为“量子线性代数”(QLA)的研究领域,即 通过直接将数值向量编码为状态向量来解决某些线性代数问题的算法的集合。这些量子子例程随后已用于加速众多ML算法,我们将在本节稍后部分介绍其中的一些算法。QLA包括用于矩阵求逆和主成分分析的算法(Harrow等,2009; Lloyd等,2014),还有许多其他算法。出于教学目的,我们将首先给出最简单的示例,该示例以 对数时间执行内积的估计。
工具1:内积评估: 如果可以访问准备量子态|ψ>和|φ>的盒子,则可以使用O(1 /∈)副本,通过所谓的交换测试,精确估计重叠(1+|<φ|ψ>²) ²。
交换测试(Buhrman等人,2001)将受控SWAP门应用到状态|ψ>|φ>,其中控制量子位设置为均匀叠加| + >。“成功”的概率,即 观察| +>给电路后的控制(1+|<φ|ψ>²) ²。并且可以通过迭代来估计(使用量子相位估计的更有效的选择也是可能的)。如果状态|ψ>和|φ> 编码单位长度数据矢量,则成功值会 将其内积编码为正负号。规范和相位也可以通过对该基本概念的细微调整来估算-特别是,幅度编码状态的实际规范将在单独的oracle中访问,并在算法中使用。此过程的样本复杂度仅取决于精度,而门的复杂度与O(log(N))成正比,因为需要控制交换和测量许多量子位。
如果将简化状态混合在一起,并且总体状态为乘积,则交换测试也可以按预期工作。相对于经典矢量乘法,这种计算内积的方法相对于N(如果对生成|ψ>和|φ>的设备的调用为O(1))具有相对于N的指数级改进,但代价是与 误差,因为经典算法具有典型的误差缩放比例,且误差为对数误差O(log(1 /))。 但是,在ML问题的情况下,这可以构成一个很好的折衷方案。
工具2:量子线性系统求解 ML量子增强算法中最有影响力的技术也许是基于线性代数的一个典型问题:求解方程组。在他们的开创性论文(Harrow等,2009)中,作者提出了用于“量子线性系统”(QLS)求解的第一算法,该算法执行以下操作。考虑一个N×N线性系统Ax = b,其中κ和d是条件数,并且厄米系统矩阵A的稀疏性。给定(量子)的甲骨文给出A的非零元素的位置和值(即给定的标准甲骨文在哈密顿模拟中遇到,请参阅(Berry 等人,2015))和一个准备量子的甲骨文 态| b>是b的幅度编码(直到范数),(Harrow等,2009)中的算法准备了量子态| x>,其近似于解矢量x的幅度编码。第一个算法的运行时间为〜O(κ2d2log(N)/)。 请注意,复杂度与系统大小的对数成正比。请注意,任何经典算法都必须至少以N缩放,这为指数改进提供了更大的空间。(Harrow et al。,2009)中的原始建议依赖于应用相位估计的汉密尔顿模拟(实现exp(iAt))。一旦估计了相位,就可以通过测量来添加反比例的振幅(即A的特征值的倒数)。还已经注意到,某些标准矩阵预处理技术也可以在QLS方案中应用(Clader等,2013)。这些建议中误差的线性缩放源于相位估计子程序。 在最近的工作中(Childs等人,2015年),作者还依赖于最佳的汉密尔顿模拟技术,但放弃了昂贵的相位估计。粗略地说,它们根据输入状态(概率)实现形式为Σkαkexp(ikAt)的单元的线性组合。这构成了aries的多项式,可以使多项式更有效地近似于逆算符A-1(在可访问测量的子空间中)。结合其他众多优化方法,得出了最终算法,其复杂度约为O(κdpolylog(N /)),基本上是最优的。 重要的是要注意,即使我们假定可以自由访问所有预言机,上述显然效率更高的方案也并不意味着可证明的计算改进。例如,问题之一是量子算法输出一个量子状态,经典值只能通过采样来访问。重建完整输出向量的此过程将扼杀任何改进。另一方面,可以有效地计算振幅的某些函数,其计算可能仍然经典地需要O(N)步,从而产生了所需的指数改进。因此,此算法作为子例程,是更大算法(例如用于量子机器学习的算法)的中间步骤,将是最有用的。
工具3:密度矩阵求幂: 密度矩阵幂运算(DME)是一个非常简单的想法,几乎没有什么微妙之处,而且可以说是深刻的后果。考虑N维密度矩阵ρ。现在,从数学的角度来看,ρ只是半正定矩阵,尽管它也常用于表示量子系统的量子状态–这两个是不同的概念。初次阅读,ρ是矩阵(为避免混淆,我们将其表示为[ρ]),[ρ]也是对物理哈密顿量的有效描述,具有时间积分演化exp(-i [ρ] t )。一个近似的exp(-i [ρ] t)可以访问状态为ρ的量子系统吗?给定足够多的副本(ρ⊗n),最明显的答案是肯定的-一个人可以使用全状态层析成像以任意精度重建[ρ],然后使用哈密尔顿模拟(尽管有效率)执行。在(劳埃德等人,2014年)中,作者展示了一种非常简单的方法:给定任何输入状态σ和ρ的一个副本,即量子状态

其中S是对应于量子SWAP门的Hermitian算子,将所需的时间演化近似为一阶

如果重复此过程,则通过使用ρ的新副本,我们可以通过将∆t设置为O(∈/ t)来获得目标状态σρ= exp(-iρt)σexp(iρt)可以近似为精确∈。 使用状态ρ的O(t2 /∈)副本。从某种意义上讲,DME是在两个量子态之间使用SWAP测试来模拟由一个量子态指定的测量方面的过程的概括。这一结果的直接结果是在哈密顿模拟的背景下, 只要能够以哈密顿矩阵表示的状态制备量子系统,就可以有效地实现哈密顿模拟(而不依赖于哈密顿稀疏性) 。 尤其是,只要哈密顿量本身是低阶的,就可以使用qRAM存储的哈密顿量描述来实现。 更一般地,这还意味着 当系统矩阵不是稀疏而是由很少的主成分(即接近低秩矩阵)控制时,也可以有效地执行QLS算法。
备注(Remark): 用于QLS,内积评估,量子PCA的算法,因此,本节其余部分中列出的几乎所有量子算法也都采用“预加载的数据库”,从而允许以并行方式访问信息和/或访问或有效访问数据库。 准备振幅编码状态。使用所谓的量子随机存取存储器(qRAM)架构已经解决了并行访问甚至是量子状态存储的问题,并已解决了大多数问题(Giovannetti等,2008)。相同的qRAM结构也可用于实现基于量子搜索的方法中使用的预言。但是,可以使用预先填充有经典数据的量子数据库确实 没有先验 地暗示着也可以有效地生成量子振幅编码状态,这在下面的大多数工作中至少是不正确的。对于一些类似假设的成本的单独讨论,我们请读者参考(Aaronson,2015年)。
d. 幅度编码:算法(Amplitude encoding: algorithms )
有了所有的量子工具,我们现在可以针对各种有监督和无监督的学习任务,提供按其解决的问题类别分组的量子算法。本节的大多数建议遵循一个清晰的范例:作者研究了已建立的ML方法,并确定了那些 可以将计算量大的部分简化为线性代数问题(最常见的是对角化和/或方程求解)的方法。 从这个意义上讲,量子线性代数方法的进一步改进很可能导致量子ML的新结果。
最后,以下所有算法均与 离散系统 实现有关。 最近,在(Lau等人,2017)中,作者还考虑了qRAM,QLS和DME的连续变量变体,这立即导致了下面列出的所有量子工具和大多数量子增强型ML算法的连续变量实现。
回归算法量子增强的第一个建议是解决线性回归问题,特别是基于QLS的最小二乘拟合。在最小二乘拟合中,我们给N个M维实数数据点与实数标签配对,因此(xi,yi)N i = 1,xi =(xj i)j∈RM,y =(yi)i∈RN。在回归中,y被称为响应变量(也称为回归变量或因变量),而数据点xi被称为预测变量(自变量或回归变量或解释变量),最小二乘线性回归的目标是建立最佳线性模型,即 β=(βj)j∈RM给出

其中,数据矩阵X的行表示每个数据点的特征属性。换句话说,线性回归假设预测变量(自变量)和响应变量(因变量)之间存在线性关系。众所周知,上述最小二乘问题的解由β= X + y给出,其中X +是数据矩阵的Moore-Penrose伪逆,即在X†X是可逆的情况下 ,由X + =(X†X)-1X†给出。(Wiebe et al。,2012)的基本思想是将X†应用于初始向量| y>,该向量对响应变量进行幅度编码,从而获得与X†| y>成比例的状态。 这可以完成 通过修改原始的QLS算法(Harrow等人,2009年),不仅可以输出特征值的倒数,还可以输出特征值本身。此后,将(X†X)-1(应用于与X†| yi成比例的生成状态)的任务解释为系统(X†X)β= X†y的方程求解问题。
最终结果是在时间O(κ4d3log(N)/)中与解矢量β成比例的量子状态β,其中κ,d和是条件数,即“对称”数据矩阵X†的稀疏性 X和偏差。同样,我们通常对κ的行为几乎没有任何保证,并且对数据矩阵的稀疏性d有明显的限制。 但是,只要两者均为O(polylog(N)),我们就有潜力进行指数改进。由于该算法以量子态编码,因此对于实际找到解矢量β显然没有用。尽管如此,它对于估计拟合量子位还是有用的:从本质上讲,通过将X应用于|β>,我们可以获得y的最终预测值,可以通过交换测试将其与实际响应变量矢量进行有效地比较。
此后,在一些著作中扩展了量子线性回归的这些基本思想。 在广泛而互补的工作中(Wang,2014),作者依靠强大的“量子化”技术(Low和Chuang,2016),并优化了实际生成最佳拟合参数β的目标。根据需要,其算法的复杂度与数据点的数量M成正比,但在数据维度N上是对数的,在其他相关参数上则非常有效。在(Schuld et al。,2016)中,作者更紧密地遵循(Wiebe et al。,2012)的思想,并且当数据矩阵不是稀疏的而是低维度的时,也可以达到与原始工作相同的结果。 此外,它们通过使用其他最新技术改善了复杂性。 后者的工作主要依靠DME技术。
聚类算法(Clustering algorithms ) 在(Lloyd et al。,2013)中,使用幅度编码和内积估计来估计给定数据向量u与数据点集合(质心)的平均值之间的距离ku- vk v = Σi vi / M 对于M个数据点{vi} i,时间在向量长度N和点数M上都是对数的。以此为基础,作者还展示了一种用于 k均值分类/聚类的算法(其中到质心的距离的计算是主要成本),从而实现了总体复杂度O(M log(MN)/) ,在某些情况下甚至可以进一步改善。在这里,假设幅度编码的状态向量及其归一化值可以通过oracle访问,或者可以通过存储所有值的qRAM有效地实现。类似的技术,结合相干量子相位估计和基于Grover的优化,也已用于解决有监督和无监督学习的k最近邻算法问题(Wiebe等人,2015)。
量子主成分分析(Quantum Principal Component Analysis ) DME的想法在同一篇论文中(Lloyd等,2014)立即应用于主成分分析(PCA)的量子版本。 PCA构成了最标准的无监督学习技术之一,对降低维度很有用,当然,除了ML之外,它还具有广泛的应用范围。在量子PCA中,对于一个量子态ρ,人们使用DME将一元exp(-i [ρ])的量子相位估计应用于状态ρ本身。在绝对精度的理想情况下,给定频谱分解ρ= Σiλi|λi><λi|,此过程将生成状态Piλi|λiihλi|⊗|〜λiih〜λi|,其中〜λi表示特征值λi的数值估计 到特征向量|λii。 从该状态采样将同时恢复(较大的)特征值和相应的量子状态,这些量子状态对特征向量进行幅度编码,可以在其他量子算法中使用。高值特征值和特征向量的恢复也构成了经典PCA的本质。
量子支持向量机(Quantum Support Vector Machines) 量子增强ML中最具影响力的论文之一是 依靠QLS和DME来量化支持向量机算法的任务。 有关SVM的基本概念,请参阅第II.A.2节。
我们将注意力集中在训练SVM的问题上,该问题由方程式(6)中的双重形式的优化任务给出。为方便起见在此重复:

然后可以通过
轻松计算所需SVM的解。
作为热身的结果,在(Rebentrost等人,2014)中,作者指出,使用内在产物的量子评估,出现在等式(30)中 ,就数据向量维数N而言,已经可以导致指数级加速。但是,量子算法的复杂度仍然是数据点M的多项式,并且误差相关性现在是线性的(因为内积估计的误差是线性的)。作者继续表明,对于最小二乘SVM的特殊情况,完全指数的改进是可能的(相对于N和M)。 考虑到我们已经针对DME和QLS进行的背景讨论,此处的基本思想很容易解释。回想一下,训练最小二乘SVM的问题简化为线性程序,特别是最小二乘最小化。 如我们先前所见,这种最小化简化为方程式求解,方程式由系统给出。在此重复:

在这里,1是“全1”向量,Y是标记yi的向量,α是拉格朗日乘子产生解的向量,b是偏差项,γ是取决于超参数C的参数,而Ω是收集训练向量的(映射的)内积的矩阵,因此Ωi,j = xi.xj。(Rebentrost et al。,2014)的关键技术方面展示了如何以适合QLS的方式实现上述系统。为了使这种方法更好,我们将简单指出系统子矩阵与追寻子系统2之后获得的量子态Σi | xi || i>1 | xi>2的缩减密度矩阵成比例。在某些约束下,可以通过访问对数据点进行编码的qRAM来有效地实现此状态。此后,DME启用了QLS的应用,其中系统矩阵具有与Ω成比例的块,为简洁起见,我们省略了详细的技术细节。总体量子算法生成与
成比例的量子态,并对偏移量和乘数进行编码。 不需要通过采样从该状态中提取乘数。 取而代之的是,可以通过(1)生成输入的幅度编码状态,以及(2)估计此状态与
之间的内积来对任何新点进行分类。 通过使用|ψouti调用量子数据预言。 该过程的整体复杂度为
其中κeff取决于数据矩阵的本征结构。 只要此术语在数据大小上是多对数的,我们就有可能实现指数级的改进。
高斯过程回归(Gaussian process regression) 在(Zhao 等人,2015)中,作者演示了如何使用QLS来显着改善高斯过程回归(GPR):一种强大的监督学习方法。GPR可以看作是标准回归的随机概括:给定训练集{xi,yi},它对潜函数建模(将标签y分配给数据点),假设标签上的高斯噪声f(x)= y +编码独立且均匀分布的位置更精确地说,GPR是一个过程,其中使用贝叶斯推理,通过考虑训练设定点来确定可能的潜在函数的初始分布。因此,从广义上讲,GPR的输出是模型f上的分布,该模型与观测数据(训练集)一致。 尽管这种分布的描述可能很大,以计算方式来预测新点x的值,但在GPR中,一个人需要计算两个数字:线性预测变量(也称为 预测均值,或者简称为 均值)和 预测变量的方差,具体针对x。 这些数字表征了GPR模型的预测值y ∗的分布,该分布与训练数据一致。而且,事实证明,两个值都可以使用改进的QLS算法来计算。最终输出大小独立于数据集大小,再加上QLS,这一事实为数据大小的指数加速提供了可能性。 只要数据在qRAM中可用,这自然就成立了,这与本节的大多数算法一样。 应当提到的是,作者在计算复杂度的最后统计中一丝不苟地列出了所有“隐性成本”(以及制定中间算法)。
几何和拓扑数据分析(Geometric and topological data analysis) 到目前为止,我们在本小节中介绍的所有算法都严重依赖于对“预加载”数据库的访问-加载本身会导致对数据库大小的线性依赖,而内积,QLS和DME算法则为对数依赖性。但是,在可以有效地单独计算量子数据库中数据点的情况下,可以避免这种情况。 这使人联想到Grover算法的大多数应用程序都具有有效计算Grover oracle的步骤。在ML应用程序中,如果经典算法要求(相对较小的)数据集进行组合探索(作为计算步骤),则会发生这种情况。然后,量子算法可以在量子并行中生成组合更大的空间,从而有效地计算有效的量子数据库。(Lloyd 等人,2016)在拓扑和几何数据分析的背景下提出了实现此目标的第一个示例。
这些技术在机器学习的背景下非常有前途,因为数据的拓扑特征不取决于选择的度量标准,因此可以捕获数据的真正鲁棒的特征。拓扑特征(在离散数据点的ML世界中)的概念是由在不同空间分辨率下观察数据时存在的那些属性给出的。因此,这样的持久性特征是鲁棒的,并且不太可能是噪声或参数选择的伪像,并且通过所谓的持久性同源性在数学上形式化。感兴趣的特定特征族是连接的组件,孔,空隙(或腔)的数量。这些数字定义为简单复数(大致是一组封闭的单纯形),称为Betti 数。为了从数据中提取此类特征,因此必须从数据构造嵌套的简单复数族,并计算由贝蒂数捕获的相应特征。但是,从组合上讲,应该考虑并应该分析多个简化,并且可以将每个可能的单纯形粗略地认为是需要进一步分析的数据点。但是,它们是从一小组有效地生成的-本质上是数据点之间成对距离的集合。作者展示了 如何生成以对数个量子位为单位对单纯形进行编码的量子态,并进一步表明,根据这种表示,可以有效地估计Betti数。在各种分辨率下进行迭代可以识别持久性特征。像往常一样,在数据的某些假设下会发生完全指数式的改进,在这里,它们表现为有效构造简单状态的能力–特别是,复杂系统中单纯形的总数将成倍增长,尽管尚不清楚这种情况,请参阅(Aaronson,2015)。该提议提供了证据,即即使没有将数据预先存储在qRAM或类似系统中,基于幅度编码的量子ML方法也可能至少在某些情况下产生指数级的加速。
如前所述,现代方法是量子增强ML的重要组成部分,它依赖于量子线性代数技术,并且该领域的任何进展都可能导致新的量子ML算法。关于量子梯度下降的算法(Rebentrost et al。,2016b; Kerenidis and Prakash,2017),给出了一个有前途的例子。 导致了用于训练神经网络的新型量子方法。
————————————————
本文转载自CSDN博主:Wendy_WHY_123
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
原文链接:https://blog.csdn.net/Wendy_WHY_123/article/details/104641209?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522be301152d3bd67735c99ba516e886460%2522%252C%2522scm%2522%253A%252220140713.130102334..%2522%257D&request_id=be301152d3bd67735c99ba516e886460&biz_id=0&utm_medium=distribute.pc_search_result.none-task-blog-2~all~sobaiduend~default-1-104641209-null-null.142^v100^pc_search_result_base7&utm_term=%E9%87%8F%E5%AD%90%E9%A2%86%E5%9F%9F%E7%9A%84%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0%26%E4%BA%BA%E5%B7%A5%E6%99%BA%E8%83%BD%EF%BC%88%E4%B8%89%EF%BC%89%28Machine%20learning%20%26%20arti%EF%AC%81cial%20intelligence%20in%20the%20quantum%20domain%29&spm=1018.2226.3001.4187