删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

基于自旋体系的量子机器学习实验进展

本站小编 Free考研考试/2021-12-29

摘要:机器学习因其在模式识别等问题上的优势已经被广泛应用到各个研究领域, 然而其运算能力在一定程度上受到经典计算机算力的制约. 近年来, 随着量子技术的高速发展, 量子计算加速的机器学习在诸多量子体系中进行了初步实验验证, 并在某些特定问题上展示出了超越经典算法的优势. 本文主要介绍两类典型的自旋体系—核磁共振体系和金刚石氮空位色心体系, 并回顾近年来量子机器学习在这两类体系上的一些代表性实验工作.
关键词: 量子机器学习/
自旋体系/
核磁共振/
氮空位色心

English Abstract


--> --> -->
机器学习是人工智能的重要研究方向之一, 该领域主要采用的方法是对大量数据进行分析, 以识别出数据中包含的信息, 进而提取出数据特征 [1]. 它起源于计算机科学, 在近十年间备受瞩目, 在科学技术等诸多领域产生了广泛的影响 [24]. 机器学习从基于学习方式上大致可以分为三大类: 监督学习, 无监督学习, 强化学习. 监督学习是通过已有的带标签的数据调整数学模型参数, 从而让模型能够解决分类或者回归问题, 监督学习算法包含支持向量机(SVM)、线性回归、决策树及神经网络. 无监督学习则用来对没有标签信息的数据进行聚类或者对未标准化的数据进行预处理, 常用的算法有主成分分析(PCA)、词嵌入及K最近邻(KNN). 强化学习则是通过决策行动得到的环境反馈的奖惩信息作为模型参数的训练依据, 最终使模型能够解决规划决策和模型优化问题, 属于强化学习的算法有Q-learning、策略梯度算法、SARSA(state-action-reward-state-action)算法. 上述算法尽管早在20世纪就已经被提出, 但是由于计算机算力的限制以及数据的缺乏, 该领域一直发展缓慢. 直到2012年Hinton教授和他的学生Krizhevsky[5]设计的AlexNet在ImageNet竞赛上表现优异, 让学界及工业界开始关注这种利用大数据和高性能图形处理器(GPU)训练的复杂神经网络模型的价值, 随后许多优秀的深度学习模型, 如VGGNet[6], ResNet[7], DenseNet[8]的出现标志着深度学习时代的来临.
尽管现在以深度学习为代表的机器学习算法在计算机视觉、自然语言处理、大数据分析等领域已经有了重大的成就, 但是随着模型的扩大, 计算机硬件的算力不足及经费开销已经成为该领域发展的瓶颈. 例如2020年OpenAI公布的目前参数最多的自然语言模型GPT-3[9], 其训练大致需要512块V100显卡训练4个月, 训练成本已经高达1200万美元. 现如今, 经典计算机再次无法满足机器学习对算力日益增长的需求, 人们迫切地需要发起一场“计算革命”. 量子计算机便是这场革命运动中的排头兵.
量子计算机中的量子态具备纠缠、叠加等特性, 这些特性是经典计算机所不具备的资源, 可以用来实现对于算法的加速, 称为量子加速(quantum speedup) [10]. 量子计算机的基础运算单元为量子比特, 其状态不似经典比特只有0和1, 而是处在0和1的叠加态上. 因此, 量子比特所包含的信息容量远远大于经典比特, 而且量子比特之间可以被纠缠起来, 这些特点使得量子计算机在实现对数据的并行运算处理上具有天然的优势. 换句话说, 在经典计算机上很难解决或无法解决的问题可能在量子计算机上很容易得到解决 [11]. 目前, 量子计算已经能够实现对某些特定问题的加速运算, 并在实验上实现了量子计算机发展规划的第二个里程碑—量子优越性(quantum supremacy). 2019年, Google团队基于超导体系构建的量子处理器“Sycamore”只用了200 s就完成了经典计算机需要10000年的采样任务 [12]. 2020年, 潘建伟等 [13]构建的光量子计算原型机“九章”在处理高斯玻色取样问题上的计算速率比经典计算机提高了100万亿倍.
量子加速实现的关键在于能否找到合适的量子算法 [14]. 1985年, Deutsch [15]提出了世界上第一个量子算法, 该算法充分地利用了量子态的叠加特性, 只需要通过一次测量就能够判断出目标函数的性质. 1994年, 用于大数分解的Shor算法实现了质因数分解的指数加速 [16]. 1995年, 无序搜索的Grover算法实现了对于目标态查找的平方加速 [17,18]. 这些重要算法的提出标志着量子计算的研究进入了一个全新的阶段. 2009年, Harrow等 [19]提出了著名的HHL算法, 该量子算法对于求解线性方程组具有指数加速的作用. 因为机器学习中的数据多以高维矩阵的形式存在, 学习的过程中常伴随着线性方程组的求解问题, 该算法的提出标志着量子机器学习作为一个重要研究领域的正式建立.
经历了十多年的发展, 量子机器学习已经在各种实验体系中得到广泛应用. 目前, 通用型量子计算机的实现存在着多种技术路线, 例如: 超导电路体系、囚禁离子体系、光学体系, 以及以核磁共振(nuclear magnetic resonance, NMR)和金刚石氮空位(nitrogen vacancy, NV)色心为代表的自旋体系. 自旋体系具有控制精度高、相干时间长等优势[20], 在量子计算初期阶段发展出了许多技术手段, 包括脉冲编译、最优化控制、动力学解耦等技术[20], 目前也是量子机器学习实验实现的重要平台.
本文将简要介绍核磁共振和金刚石NV色心两种自旋体系的基本原理, 并梳理近年来国内外各研究组在这两类平台上所实现的具有代表性的量子机器学习的工作.
核磁共振体系是人们研究最早的量子计算体系之一. 早在1938年, Rabi 等 [21]发现了著名的Rabi振荡现象: 位于磁场中的原子核会沿着磁场方向呈正向或反向平行排列, 在施加射频场之后, 这些原子核的自旋方向则会发生翻转. 之后, Bloch [22]于1946年发现处于外磁场中的特定核自旋会吸收特定频率的射频场能量, 这是人类对于核磁共振现象最早的认识. 经过五十多年的发展, 核磁共振已经在化学、医疗等领域有了诸多应用 [23-26], 并且成熟的操控技术使人们可以精确操控核磁共振中耦合起来的两能级量子系统. 在量子计算概念被提出后, 核磁共振也作为各个量子计算潜在方案中操控比特数最多、操控精度最高的方案而被广泛研究[20].
核磁共振系统可以用系统哈密顿量和控制哈密顿量联合进行的动力学演化来描述. 系统哈密顿量给出在静磁场中单个的, 或者耦合起来的核自旋的能量形式; 而控制哈密顿量来自核自旋共振的控制射频场.
在核磁共振谱仪中, 样品被放置在沿着$ \widehat{z} $方向的静磁场$ {B}_{0} $中. 对于单个自旋为1/2的粒子来说, 其在沿着$\hat{{{z}}}$方向的静磁场$ {B}_{0} $中的动力学演化被哈密顿量主导:
${{{H}}}_{0}=-\hslash \gamma {B}_{0}{{{I}}}_{z}=-\hslash {\mathrm{\omega }}_{0}{{{I}}}_{z}=\left(\begin{array}{cc}-\hslash {\mathrm{\omega }}_{0}/2& 0\\ 0& \hslash {\mathrm{\omega }}_{0}/2\end{array}\right) ,$
其中, $ \hslash $是约化普朗克常数, $ \gamma $是原子核的旋磁比, $ {\omega }_{0}/\left(2\mathrm{\pi }\right) $是拉莫尔频率, $ {{{I}}}_{z} $是沿着$\hat{{{z}}}$方向的核自旋算符. 在核磁共振领域中, $ {{{I}}}_{x} $, $ {{{I}}}_{y} $, $ {{{I}}}_{z} $和泡利算符有着如下对应:
${{{I}}}_{x}=\frac{1}{2}{{{\sigma }}}_{x},~~{{{I}}}_{y}=\frac{1}{2}{{{\sigma }}}_{y},~~ {{{I}}}_{z}=\frac{1}{2}{{{\sigma }}}_{z} ,$
并且
$\begin{split}&{{{\sigma }}}_{x}=\left(\begin{array}{cc}0& 1\\ 1& 0\end{array}\right),~~ {{{\sigma }}}_{y}=\left(\begin{array}{cc}0& -\mathrm{i}\\ \mathrm{i}& 0\end{array}\right),\\&{{{\sigma }}}_{z}=\left(\begin{array}{cc}1& 0\\ 0& -1\end{array}\right) .\end{split}$
这意味着自旋为1/2的粒子在外磁场中会发生所谓的塞曼效应, 从而产生两个能级差为$ \hslash {\mathrm{\omega }}_{0} $的本征态$ \left|0\right\rangle =\left(\genfrac{}{}{0 pt}{}{1}{0}\right) $, $ \left|1\right\rangle =\left(\genfrac{}{}{0 pt}{}{0}{1}\right) $. 核磁共振量子计算把这两个本征态作为量子比特的0和1. 当射频场的能量和能级差匹配时, 核自旋将在两个本征态之间进行跃迁. 不同种类的核自旋拥有不同的旋磁比$ \gamma $, 从而拥有不同的拉莫尔进动频率$ {\omega }_{0}/\left(2\mathrm{\pi }\right) $. 而相同种类的原子核一般因为周遭不同的电子云排布, 受到不同程度的磁场屏蔽作用(化学位移), 从而也有不同的拉莫尔频率. 不同的拉莫尔频率意味着不同的能级差, 于是这些核自旋构成的量子比特可以通过不同的共振频率来加以区分.
当样品的分子中有多个核自旋(多量子比特)时, 核自旋之间会产生相互作用. 相互作用的种类有两种: 直接相互作用(偶极-偶极耦合)和间接相互作用(标量耦合). 在常用的液体核磁共振样品中, 由核磁矩产生的直接相互作用会因为液体分子的快速滚动而被平均掉. 只剩下由化学键产生的间接相互作用, 在弱耦合的情况下($\big|{\omega }_{0}^{i}-{\omega }_{0}^{j}\big|\gg $$ 2\mathrm{\pi }{J}_{ij}$)其哈密顿量的形式为
${{{H}}}_{J}=2\pi \hslash \sum\limits_{i < j}{J}_{ij}{{{I}}}_{z}^{i}{{{I}}}_{z}^{j} , $
其中$ {J}_{ij} $为自旋$ i $和自旋$ j $之间的相互作用强度.
所以大多数核磁共振实验中的系统哈密顿量可表示为核自旋在静磁场中的哈密顿量和核自旋间两两相互作用的哈密顿量之和:
${{{H}}}_{\mathrm{s}\mathrm{y}\mathrm{s}}=-\hslash \sum\limits_{i}{\omega }_{0}^{i}{{{I}}}_{z}^{i}+2\pi \hslash \sum\limits_{i < j}{J}_{ij}{{{I}}}_{z}^{i}{{{I}}}_{z}^{j} .$
在核磁谱仪中, 控制核自旋跃迁的射频场在多旋转坐标系下的哈密顿量可以写成
$\begin{split}{{{H}}}_{\mathrm{c}\mathrm{o}\mathrm{n}\mathrm{t}\mathrm{r}\mathrm{o}\mathrm{l}}=\;&\sum\limits_{i,r}-\hslash {\omega }_{1}^{\mathrm{r}}(\mathrm{c}\mathrm{o}\mathrm{s}\left[\left({\mathrm{\omega }}_{\mathrm{r}\mathrm{f}}^{\mathrm{r}}-{\mathrm{\omega }}_{0}^{i}\right)t+{\phi }^{\mathrm{r}}\right]{{{I}}}_{x}^{i}\\&-\mathrm{s}\mathrm{i}\mathrm{n}\left[\left({\omega }_{\mathrm{r}\mathrm{f}}^{\mathrm{r}}-{\omega }_{0}^{i}\right)t+{\mathrm{\phi }}^{\mathrm{r}}\right]{{{I}}}_{y}^{i}) , \end{split}$
其中$ {\omega }_{\mathrm{r}\mathrm{f}}^{\mathrm{r}} $为旋转坐标系的频率(与射频场旋转频率一致), $ {\phi }^{\mathrm{r}} $为射频场的相位.
所以核磁共振体系的哈密顿量可以表示为
${{H}}={{{H}}}_{\mathrm{s}\mathrm{y}\mathrm{s}}+{{{H}}}_{\mathrm{c}\mathrm{o}\mathrm{n}\mathrm{t}\mathrm{r}\mathrm{o}\mathrm{l}} .$
基于对哈密顿量的控制, 核磁共振系统可以通过赝纯态[27,28]的制备实现系统的初始化; 通过调整射频场参数和核自旋间相互作用时间构建通用逻辑门; 从核磁样品系综的自由感应衰减信号中重构出量子态.
从目前的实验进展来看, 核磁共振量子计算已经非常成熟, 这为那些较为复杂的量子算法提供了一个很好的演示平台. 目前量子算法在解决线性代数计算问题上已经展现了初步的加速能力, 而例如“傅里叶变换”、“求本征值本征态”、“解线性方程”的问题都是经典机器学习算法中常见的子程序. 接下来, 本文将回顾国内外量子机器学习算法基于核磁共振体系的实验实现.
2
2.1.解线性方程组
-->解线性方程组几乎是所有科研、工程领域都会面临的问题, 而经典算法解线性方程组的复杂度限制着计算问题的尺度. 2009年, Harrow等 [19]提出了一个能够在解线性方程组上实现指数加速的HHL量子算法. 它不仅为解线性方程组提供了加速方案, 也是许多量子机器学习算法的基础. HHL算法的核心是用量子计算机进行矩阵求逆, 从而求解线性方程组. 一个线性方程组可以写成
${{A}}\left|{{x}}\right\rangle =\left|{{b}}\right\rangle ,$
其中$ N\times N $的参数矩阵可以用它自己的本征值$ {\lambda }_{j} $和本征态$ \left|{u}_{j}\right\rangle $展开${{A}}=\displaystyle\sum\nolimits_{j}{\lambda }_{j}\left|{{{u}}}_{j}\right\rangle \left\langle{{{u}}}_{j}\right|$, 向量也可以展开为$\left|{{b}}\right\rangle =\displaystyle\sum\nolimits_{j}{\beta }_{j}\left|{{{u}}}_{j}\right\rangle$. 参数矩阵的逆矩阵可以表示为${{{A}}}^{-1}=\displaystyle\sum\nolimits_{j}{\lambda }_{j}^{-1}\left|{{{u}}}_{j}\right\rangle \left\langle{{{u}}}_{j}\right|$, 于是线性方程组的解
$\left|{{x}}\right\rangle \propto {{{A}}}^{-1}\left|{{b}}\right\rangle \propto \sum\limits_{j}\left({\beta }_{j}/{\lambda }_{j}\right)\left|{{{u}}}_{j}\right\rangle.$
在量子线路中可以通过相位估计算法 [29]得到$ {{A}} $的本征值$ {\lambda }_{j} $, 然后对辅助比特旋转$ 2\text{arcsin}\left(C/{\lambda }_{j}\right) $角度, 再做一个相位估计的逆过程即可得到
$\sum\limits_{j}\left(\sqrt{1-\frac{{C}^{2}}{{\lambda }_{j}^{2}}}\left|0\right\rangle +\frac{C}{{\lambda }_{j}}\left|1\right\rangle \right){\beta }_{j}\left|{\mathrm{{{\lambda}} }}_{j}\right\rangle \left|{{{u}}}_{j}\right\rangle , $
其中$ C $是一个常数. 当辅助比特投影到$ \left|1\right\rangle $态上时, 量子态坍缩为$\displaystyle\sum\nolimits_{j}C\left({\beta }_{j}/{\lambda }_{j}\right)\left|{{{u}}}_{j}\right\rangle \propto \left|{{x}}\right\rangle$. 在已知最好的经典算法中需要$ O\left(N\mathrm{l}\mathrm{o}\mathrm{g}N\right) $的时间复杂度来求得解向量$ \left|{{x}}\right\rangle $. 上述量子算法只需要$O\big[{\left(\mathrm{l}\mathrm{o}\mathrm{g}N\right)}^{2}\big]$的时间复杂度就可以做到同样的事. 尽管在当前技术下, 量子态制备和量子态读出在时间复杂度上仍然存在需要解决的难题, HHL算法在解决特定问题上仍有指数加速的潜力.
实验方面, 光学、核磁共振、超导等量子计算平台都相继实现了HHL算法 [3032], 如图1所示. 其中由中国科学技术大学杜江峰团队完成的工作[31]是在4 bit的核磁共振系统实现了基于量子逻辑门的HHL算法. 算法完成了解$ 2\times 2 $线性方程组的任务, 并重复对3个不同的向量$ \left|{{b}}\right\rangle $进行验证(相同的矩阵$ {{A}} $). 实验用氘代氯仿作为样品, 其中的$ {}_{ }{}^{13}\mathrm{C} $和3个$ {}_{ }{}^{19}\text{F} $核自旋作为4个量子比特. 由2 bit组成的寄存器用来实现相位估计算法, 由单比特充当的寄存器用来储存向量$ \left|{{b}}\right\rangle $, 剩余的1 bit作为辅助比特进行读出前的投影测量. 对于不同输入的$ \left|{{b}}\right\rangle $, 4 bit的末态保真度均高于96%. 实验以优良的准确性验证了HHL算法的可行性.
图 1 实现HHL算法的量子线路图. 其中$ r=2, {t}_{0}=2 $. 单比特门$ {{S}}=\left(\begin{array}{cc}1& 0\\ 0& \mathrm{i}\end{array}\right),\; {{H}}=\dfrac{1}{\sqrt{2}}\left(\begin{array}{cc}1& 1\\ 1& -1\end{array}\right),\; {{{R}}}_{y}\left(\theta \right)= $$ \left(\begin{array}{cc}\cos\tfrac{\theta }{2}& -\sin\tfrac{\theta }{2}\\ \sin\frac{\theta }{2}& \cos\frac{\theta }{2}\end{array}\right) $. 与直线相连的$ \times $表示SWAP门[31]
Figure1. The quantum circuit of the HHL algorithm. Parameter $ r=2, ~~{t}_{0}=2 $. Quantum gate $ {{S}}=\left(\begin{array}{cc}1& 0\\ 0& \mathrm{i}\end{array}\right), \; {{H}}= $$ \dfrac{1}{\sqrt{2}}\left(\begin{array}{cc}1& 1\\ 1& -1\end{array}\right), \;{{{R}}}_{y}\left(\theta \right)=\left(\begin{array}{cc}\cos\frac{\theta }{2}& -\sin\tfrac{\theta }{2}\\ \sin\frac{\theta }{2}& \cos\tfrac{\theta }{2}\end{array}\right) $. The symbol $ \times $ connected with the straight line represents the SWAP gate[31].

HHL算法及其实验实现均基于逻辑门模型. 受限于当前技术下量子比特的数量, 基于逻辑门的复杂量子算法通常只能在一个很小的维度上进行演示. 而绝热量子计算(adiabatic quantum computing, AQC)为操控量子系统提供了一种有别于基于逻辑门的方法. 因为量子机器学习通常涉及的多元优化可以直接被AQC实现, 所以对于量子机器学习而言, AQC可能是最有希望取得实际应用的量子模型. AQC的核心是让系统初态处于一个实验上容易实现的简单哈密顿量${{{H}}}_{0}\left(t\right)$的基态, 这个哈密顿量会随着时间缓慢地朝着目标哈密顿量${{{H}}}_{\mathrm{p}}$变化, 这个变化过程可以由瞬时哈密顿量表示:
${{H}}\left(t\right)=\left[1-s\left(t\right)\right]{{{H}}}_{0}+s\left(t\right){{{H}}}_{\mathrm{p}} ,$
其中$ s\left(t\right) $随着时间从0变化到1, 导致${{H}}\left(t\right)$${{{H}}}_{0}$变化至${{{H}}}_{\mathrm{p}}$. 绝热理论告诉我们: 当变化的过程足够慢, 量子系统将始终待在瞬时哈密顿量${{H}}\left(t\right)$的基态上. 这样就通过设计目标哈密顿量来实现目标量子态的获取.
近年, 基于AQC求解线性方程组的量子算法被提出[33]. 清华大学龙桂鲁课题组 [34]也在2018年在核磁共振系统上实现了两种基于AQC解$ 8\times 8 $线性方程组的算法. 实验样品为$ {}^{13}\mathrm{C} $被标记的巴豆酸分子, 分子上的4个$ \text{C} $核自旋作为4个量子比特. 实验中第一种算法的绝热演化的瞬时哈密顿量为
${{H}}\left(s\right)={{{A}}}^{2}\left(s\right)-{{A}}\left(s\right)\left|\bar{{{b}}}\right\rangle \left\langle\bar{{{b}}}\right|{{A}}\left(s\right) ,$
其中$ {{A}}\left(s\right)=\left(1-s\right){{\sigma }}_{z}\otimes {{I}}+s{{\sigma }}_{x}\otimes {{A}} $, 是一个包含了线性方程组系数矩阵的变化参数. $ \left|\bar{{{b}}}\right\rangle =\left|+, {{b}}\right\rangle $, $ \left|\pm \right\rangle $$ {{{\sigma }}}_{x} $在计算基矢表示下的本征态, $ \left|{{b}}\right\rangle $则是待解线性方程组右侧的向量. 通过对$ s $的构建和缓慢改变, 最终系统的本征态将从$ \left|-, {{b}}\right\rangle $演化至$ \left|+, {{x}}\right\rangle $. 只要将辅助比特舍弃, 即可得到解向量$ \left|{{x}}\right\rangle $. 第二种算法的瞬时哈密顿量为
${{{H}}}'\left(s\right)={{\sigma }}^+\otimes {{A}}\left(s\right){{{P}}}_{\bar{{{b}}}}^{\perp }+{{\sigma }}^-{{{P}}}_{\bar{{{b}}}}^{\perp }{{A}}\left(s\right) ,$
其中$ {{\sigma }}^{\pm }=\left({{\sigma }}_{x}\pm \mathrm{i}{{\sigma }}_{z}\right)/2 $, $ {{{P}}}_{\bar{{{b}}}}^{\perp }={{I}}-\left|\bar{{{b}}}\right\rangle \left\langle\bar{{{b}}}\right| $是一个投影算符. 经过绝热演化, 系统从初态$ \left|0\right\rangle \otimes \left|-, {{b}}\right\rangle $变为末态$ \left|0\right\rangle \otimes \left|+, {{x}}\right\rangle $. 最终得到解向量$ \left|{{x}}\right\rangle $. 这个实验演示了在不使用相位估计算法的情况下, AQC算法同样可以在较低的时间复杂度下解线性方程组, 并且能够在相同的比特资源下实现更多维度的计算. 对于当下的量子计算发展, 如何拓展量子体系的维度是一个重大的挑战, 因此量子比特数对于任何实验系统而言都是稀缺资源. 该实验所展示的AQC算法对辅助比特数的要求并不依赖于量子系统的维度, 这对于量子机器学习算法实现应用具有重大意义.
2
2.2.解线性微分方程
-->在应用科学面临的许多动力学问题中, 线性微分方程组(LDEs)扮演了一个很重要的角色. LEDs问题可以概括为: 对于给出的$ N\times N $矩阵$ {{M}} $, $ N $维的向量$ \left|{{b}}\right\rangle $以及初始态向量$ \left|{{x}}\left(0\right)\right\rangle $, 希望从含时的微分方程组
$\text{d}{{x}}\left(t\right)/\text{d}t={{Mx}}\left(t\right)+\left|{{b}}\right\rangle$
求出解向量$ \left|{{x}}\right\rangle $.
和线性方程组问题类似, 经典计算机解线性微分方程要耗费大量计算资源. 当面临例如量子系统或者流体力学的问题时, 计算的维度大大增加, 这对于经典计算机来说难以解决. 随着量子计算的发展, 解线性方程组的量子算法已经被提出[19,33], 也相继在量子计算平台上进行验证. 而解线性微分方程组的量子算法虽然也被提出[3537], 但是这些算法对于目前的量子计算机很难实现. 清华大学龙桂鲁团队[38] 提出了一种容易在量子线路中实现的基于逻辑门的解LDEs算法, 并且在4 bit的核磁共振体系上实现了解$ 4\times 4 $的线性微分方程组, 如图2所示. 线性微分方程组的解向量通式${{x}}\left(t\right)\!\approx\! \displaystyle\sum\nolimits_{m=0}^{k}\!\!\frac{{\left(Mt\right)}^{m}}{m!}{{x}}\left(0\right)+ $$ \displaystyle\sum\nolimits_{n-1}^{k}\frac{{M}^{n-1}{t}^{n}}{n!}{{b}}$所描述是非幺正演化, 而传统的量子计算是基于封闭系统和幺正演化. 该算法利用辅助系统使含有非幺正演化子系统的大系统进行幺正演化, 最终得以用便于实验实现的逻辑门线路完成解微分方程组. 解向量通式可以由计算基矢$ \left| {{j}} \right\rangle $展开,
图 2 解线性微分方程的量子线路图. 线路中第一个辅助寄存器是单比特, 第二个辅助寄存器为$ T=\mathrm{l}\mathrm{o}{\mathrm{g}}_{2}\left(k+1\right) $比特, 然后是一个工作系统. 所有的辅助寄存器被初始化为$ \left|0\right\rangle {\left|0\right\rangle }^{\mathrm{T}} $, 控制操作$ {U}_{x} $$ {U}_{b} $分别被用来生成$ \left|{{x}}\left(0\right)\right\rangle $$ \left|{{b}}\right\rangle $. 在编码和解码期间的演化算子为$\displaystyle \sum\nolimits_{\tau =0}^{k}\left|\tau \right\rangle \left\langle\tau \right|\otimes {U}_{\tau }$. 在线路的结尾, 在所有辅助比特为$ \left| 0 \right\rangle $的子空间中测量工作系统的态矢[38]
Figure2. Quantum circuit for solving linear differential equations. The first auxiliary register in the circuit is a single bit, and the second auxiliary register is $ T=\mathrm{l}\mathrm{o}{\mathrm{g}}_{2}\left(k+1\right) $ bits, then is a working system $ \left|\phi \right\rangle $. All auxiliary registers are initialized to $ \left|0\right\rangle {\left|0\right\rangle }^{\mathrm{T}} $, and then the operation $ {U}_{x} $ and $ {U}_{b} $ are used to generate $ \left|{{x}}\left(0\right)\right\rangle $ and $ \left|{{b}}\right\rangle $. The evolution operator during encoding and decoding is $\displaystyle \sum\nolimits_{\tau =0}^{k}\left|\tau \right\rangle \left\langle\tau \right|\otimes {U}_{\tau }$. At the end of the circuit, the state vector of the working system is measured in the subspace where all auxiliary bits are $ \left| 0 \right\rangle $[38].

$ \begin{split}\left|{{x}}\left(t\right)\right\rangle =\;&\sum\limits_{m=0}^{k}\frac{||{{x}}\left(0\right)||{\left(||{{M}}||{{A}}t\right)}^{m}}{m!}\left|{{x}}\left(0\right)\right\rangle \\&+\sum\limits_{n=1}^{k}\frac{||{{b}}||{\left(||{{M}}||{{A}}\right)}^{n-1}{t}^{n}}{n!}\left|{{b}}\right\rangle , \end{split}$
其中$ {{x}}\left(0\right) $$ {{b}} $可以由量子态$\left|{{x}}\left(0\right)\right\rangle \!=\!\!\displaystyle\sum\nolimits_{j}\!\dfrac{{x}_{j}\left(0\right)}{||{{x}}\left(0\right)||}\left|{{j}}\right\rangle$, $\left|{{b}}\right\rangle =\displaystyle\sum\nolimits_{j}\dfrac{{b}_{j}}{||{{b}}||}\left|{{j}}\right\rangle$. $ {{M}} $可由算子${{A}}=\displaystyle\sum\nolimits_{i, j\frac{{M}_{ij}}{||{{M}}||}} \left|{{i}}\right\rangle \left\langle{{j}}\right|$来描述.
有别于其他以相位估计为核心的量子算法, 该算法的量子加速来自于通过辅助比特将非幺正演化变为幺正演化, 这种做法叫作LCU(linear combination of unitaries) [39]. 对于未来非幺正演化的量子算法研究, 这个工作具有很好的启发性.
2
2.3.量子支持向量机
-->支持向量机(support vector machine, SVM)是一类广泛使用的通过监督学习实现二元分类的广义线性分类器, 其在人脸识别、文本分类、手写字符识别等场景中有重要应用 [40]. SVM是通过构造一个线性映射将数据映射到高维特征空间, 在这个高维空间找到一个超平面能使两类数据的间隔最大, 并通过这个超平面对新的数据进行分类.
已知训练数据集共有$ M $个训练样本, 每个样本都是一个在$ N $维特征空间的特征向量:
$\begin{split}&{{X}}=\{{{{x}}}_{1},{{{x}}}_{2},\cdots ,{{{x}}}_{{{M}}}\}\\&{{{x}}}_{{i}}=\left[{d}_{1},{d}_{2},\cdots ,{d}_{N}\right] ,\end{split}$
且对应的标签集为
$\begin{split}&Y=\left\{{y}_{1},{y}_{2},\cdots ,{y}_{M}\right\},\\&y\in \left\{-1,1\right\} .\end{split}$
在训练样本所在的特征空间中, 通过训练超平面的法向量$ {{w}} $和截距$ b $寻找到一个超平面能够让任意数据到这个超平面的距离要大于等于1, 即能够让两类训练数据分离:
${y}_{i}\left({{w}}\cdot {{{x}}}_{{{i}}}+b\right)\geqslant 1 .$
因此判别新数据$ x $类别时, 当${{w}}\cdot {{x}}+b\geqslant 1$时, 认为该数据为+1类, 反之当${{w}}\cdot {{x}}+b\leqslant -1$, 则认为数据为–1类. 但通常很多数据是无法线性可分的, 因此需要通过一个非线性的函数将数据从低维特征空间映射到更高维度的空间, 同时需要定义该映射函数的内积, 称为核函数, 以回避复杂的高维显式内积计算.
SVM在识别阶段时间复杂度是 $O[\mathrm{p}\mathrm{o}\mathrm{l}\mathrm{y} \left(NM\right)]$, $ N $是特征空间的维度, $ M $是训练集的样本数. 而在训练阶段通常采用二次规划求解超平面, 而求解二次规划将涉及$ M $阶矩阵的求解, 时间复杂度约为$ {O(S}^{3}+SN+SNM) $$ O\left({NM}^{2}\right) $之间, $ S $为支持向量个数, 当$ M $数目很大时该矩阵的存储和计算将耗费大量的计算机内存和运算时间.
为了解决经典SVM无法使用大规模数据进行训练的难题, 2014年Rebentrost等 [41]提出了量子支持向量机(quantum support vector machine, QSVM). QSVM在训练阶段, 将法向量$ {{w}} $表示为训练样本$ {{{x}}}_{i} $的线性组合,
${{w}}=\sum\limits_{{{i}}=1}^{M}{\alpha }_{i}{{{x}}}_{i} ,$
通过最小二乘法, 权重参数$ \alpha $以及截距$ b $可以通过求解线性方程得出:
${\left(b,{\alpha }_{1},{\alpha }_{2},\cdots ,{\alpha }_{M}\right)}^{\mathrm{T}}={\tilde {{{F}}}}^{-1}{\left(0,{y}_{1},{y}_{2},\cdots ,{y}_{M}\right)}^{\mathrm{T}} , $
其中$ \tilde {{{F}}} $是包含核函数$ {{K}} $$ \left(M+1\right)\times \left(M+1\right) $的矩阵
$\begin{split}&\tilde {{{F}}}\equiv \left({{K}}+{\gamma }^{-1}{{{I}}}_{M}\right),~~ {K}_{i,j}={x}_{i}\cdot {x}_{j} .\end{split}$
$ {{{I}}}_{M} $$ M\times M $的单位矩阵, $ \gamma $是设定的训练误差与SVM目标的相对权重. 其将SVM训练转化为最小二乘法问题再通过HHL算法求解矩阵$ \tilde {{{F}}} $的逆, 能使QSVM的时间复杂度在训练和识别阶段都能达到$ O\left[\mathrm{l}\mathrm{o}\mathrm{g}\left(NM\right)\right] $. 文献 [42]中杜江峰团队在NMR系统实现QSVM在手写数字识别的实验, 采用碘三氟乙烯作为样品, 其中有一个$ {}_{ }{}^{13}\mathrm{C} $核自旋和三个$ {}^{19}\mathrm{F} $核自旋. 两个比特作为训练数据寄存器, 一个比特作为标签寄存器, 一个比特作为辅助比特. 实验巧妙地将字符“6”和“9”编码成二维线性可分的特征向量用于训练和测试, 实验保真度接近99%, 手写数字识别错误率低于4%, 如图3所示.
图 3 手写字符“6”和“9”的识别结果, 第1—4行分别代表手写字符, 实验指示符, 相干项的幅度和识别结果[42]
Figure3. Recognition results of handwritten characters of “6” and “9”. Lines 1 to 4 represent handwritten characters, experimental indicators, amplitude, and recognition results, respectively[42].

2
2.4.量子主成分分析
-->主成分分析(principal component analysis, PCA)是机器学习中一种常用且费时的无监督学习算法. 这一方法利用正交变换把由线性相关变量表示的观测数据转换为少数几个由线性无关变量表示的数据, 线性无关的变量称为主成分. 这个算法主要用于发现数据中的基本结构, 即数据中变量之间的关系[43].
已知数据集一共$ M $个样本, 每个样本都是一个在$ N $维特征空间的特征向量:
$\begin{split} &X=\{{{{x}}}_{1},{{{x}}}_{2},\cdots ,{{{x}}}_{M}\}\text{,} \\ &{{{x}}}_{i}=\left[{d}_{1},{d}_{2},\cdots ,{d}_{N}\right] .\end{split}$
将数据归一化为$ \tilde {X} $后构造协方差矩阵
${{C}}=\frac{1}{M}\tilde {{{X}}}{\tilde {{{X}}}}^{\mathrm{T}} ,$
对协方差矩阵$ {{C}} $进行特征值分解, 得到所有特征值和对应特征向量, 并对特征向量按其对应特征值大小降序排列, 取前$ K $个特征向量构成投影矩阵$ {{P}} $, 最终利用投影矩阵$ {{P}} $将数据集从N维特征空间投影到$ K $维特征空间. 由此可见特征值分解直接确定了PCA算法的时间复杂度为$ \mathrm{O}\left({N}^{2}\right) $.
2014年, Lloyd等 [44]提出了量子主成分分析(quantum principal component analysis, qPCA). qPCA用密度矩阵$ {{\rho }} $表示协方差矩阵$ {{C}} $, 通过相位估计法将密度矩阵$ {{\rho }} $编码在辅助比特从而解出特征值, 而相位估计法所需的控制门$ U={\mathrm{e}}^{-\mathrm{i}{{\rho }}t} $可以用目标比特和编码比特之间用时间非常短的$ \mathrm{S}\mathrm{W}\mathrm{A}\mathrm{P} $操作构建:
$\underset{\Delta t\to 0}{\mathrm{l}\mathrm{i}\mathrm{m}} {\mathrm{e}}^{-\mathrm{i}{{\rho }}\Delta t}{{\sigma}} {\mathrm{e}}^{\mathrm{i}{{\rho }}\Delta t}=\underset{\Delta t\to 0}{\mathrm{l}\mathrm{i}\mathrm{m}} {\mathrm{Tr}}_{P}\left({\mathrm{e}}^{-\mathrm{i}{{S}}\Delta t}{{\sigma}} \otimes {{\rho }}{\mathrm{e}}^{\mathrm{i}{{S}}\Delta t}\right) ,$
因此qPCA能够将时间复杂度降低到$ O\left(\log\left(N\right)\right) $.
然而上述方法需要的辅助比特数量随密度矩阵的大小指数增加, 大量的资源消耗以至于在实验平台上很难该算法进行验证, 所以文献 [45]中实验团队通过参数量子电路实现qPCA, 如图4所示, 该方法构建出一个厄密算符$ {\cal{U}} $, 能够将密度矩阵$ {{\rho }} $被对角化同时特征值按大小降序排列:
图 4 通过qPCA实现人脸识别的流程图. 通过混合经典量子控制方法对PQC $ {\cal{U}}\left({{\theta }}\right) $进行迭代优化, 其中在量子处理器上测量目标函数$ L\left({{\theta }}\right) $和梯度$ g\left({{\theta }}\right) $. 参数$ {{\theta }} $的存储和更新在经典计算机上实现. 用优化后的$ {U}_{g} $来计算特征脸矩阵D和协方差矩阵C的特征向量[45]
Figure4. Workflow for human face recognition via qPCA. The PQC $ {\cal{U}}\left({{\theta }}\right) $ is iteratively optimized via the hybrid classicalquantum control approach, where the objective function $ L\left({{\theta }}\right) $ and the gradient $ g\left({{\theta }}\right) $ are measured on the quantum processor. The storage and update of the parameters $ {{\theta }} $ are implemented on a classical computer. The optimized PQC with the operator $ {U}_{g} $ is applied to compute the eigenvectors of the eigenface matrix $ {{D}} $ and the covariance matrix $ {{C}}={{A}}{{{A}}}^{\mathrm{T}} $[45].

${{{\rho }}}_{\mathrm{f}}={\cal{U}}{{\rho }}{{\cal{U}}}^{\dagger}=\sum\limits_{j=0}^{N-1} {\lambda }_{j}\left|{{j}}\right\rangle \left\langle {{j}}\right| .$
这需要构建一个参数量子电路$ {\cal{U}}\left({{\theta }}\right) $以及一个算符$ {{P}} $:
${{P}}=\frac{1}{N\left(N-1\right)}\sum\limits_{j=1}^{n} {2}^{j-1}\left({{{\sigma}} }_{z}^{j}+1\right) , $
构建出损失函数$ L\left({{\theta }}\right) $:
$L\left({{\theta }}\right)={\rm{Tr}}\left({\cal{U}}\left({{\theta }}\right)\rho {{\cal{U}}}^{\dagger}\left({{\theta }}\right)\cdot {{P}}\right) .$
通过梯度下降优化参数$ {{\theta }} $最小化损失函数$ L\left({{\theta }}\right) $, 就能训练出目标厄密算符${\cal{{{U}}}}$, 从而实现qPCA算法. qPCA求解出人脸图片训练集协方差矩阵的特征值和对应的特征向量, 通过特征向量构造投影矩阵将高维的图片数据投影到低维空间, 再通过欧拉距离公式将测试集图片分类实现人脸识别. 实验使用四比特核磁共振量子系统, 将量子比特编码在核自旋, 通过选择跃迁法初始化量子系统, 并用梯度下降优化控制脉冲方法来载入经典数据, 最后利用量子计算机和经典计算机混合系统优化参数量子电路. 实验最终求出的特征值保真度达到99%, 测试集人脸识别正确率为100%.
金刚石中的NV色心由一个替代C原子的N原子以及相邻位置C原子的缺失产生的空位组成[46], 如图5(a)所示. NV色心是一种很重要的量子体系, 得益于其固态及室温下可操控等特点, 在量子计算、量子信息、量子精密测量等多个领域都有很好的应用前景[47-49]. 目前, 国内外都有科研团队在基于NV色心体系的量子技术上展开研究. 自然状态下, NV色心具有两种电荷态-电中性和带负电荷. 带负电的NV由于其便于初始化、操控、读出, 对其本身及其应用的研究也最为广泛和深入, 本章节中我们将要回顾的相关研究也均是基于NV.
图 5 (a)金刚石NV色心结构图; (b) NV色心电子能级跃迁过程示意图, $ {}_{ }{}^{3}{\mathrm{A}}_{2} $$ {}^{3}\mathrm{E} $分别代表基态和激发态, $ {}^{1}{\mathrm{A}}_{1} $$ {}^{1}\mathrm{E} $为中间亚稳态, 从激发态直接跃迁回基态会发出荧光, 而经中间态回基态不会发出荧光
Figure5. (a) NV color center structure; (b) schematic diagram of the transition process of NV color center electron energy level, $ {}^{3}{\mathrm{A}}_{2} $ and $ {}^{3}\mathrm{E} $ represent the ground state and excited state, respectively, $ {}^{1}{\mathrm{A}}_{1} $ and $ {}^{1}\mathrm{E} $ are the intermediate metastable states, which from the excited state directly transitions back to the ground state and emit fluorescence. But the path througt metastable state returns to the ground state without emitting fluorescence.

对于NV, 色心在俘获一个电子后带负电. N原子与相邻的C原子形成共价键, 与空位之间不成键, 所以贡献两个电子, 同样, 空位周围的3个C原子也分别贡献1个电子, 本身的5个电子, 加上俘获的电子, 共有6个电子. 在实验中可以认为其等价于1个自旋为1的电子自旋. NV的基态和激发态的电子态分别为 3A23E, 均为自旋三重态, 基态因自旋之间的相互作用分裂成$ |m_{\rm s} = 0\rangle $$ | m_{\rm s} = \pm 1\rangle $, 而$ | m_{\rm s} =\pm 1\rangle $是简并的 [50], 如图5(b)所示. 选取其中的两个能级, 就可以构建一个量子比特. 除电子自旋外, 形成色心的$ {}_{ }{}^{14}\mathrm{N} $($ {}_{ }{}^{15}\mathrm{N} $)原子也可以作为一个自旋为1(1/2)的核自旋量子比特, 若在色心周围存在$ {}^{13}\mathrm{C} $原子, 同样可以作为自旋为1/2的量子比特, 这是目前基于NV色心实验体系来扩展量子比特的主要手段.
在不外加静磁场的情况下, 由于自旋之间的相互作用, 劈裂成$ | m_{\rm s} =0 \rangle $$ | m_{\rm s} =\pm 1\rangle $, 其零场劈裂为2.87 GHz. 施加静磁场后, 简并的能级$ | m_{\rm s} =\pm 1\rangle $将会分开, 并且劈裂会随着轴向磁场的增强而增大.
在外场下NV色心的系统哈密顿量(以电子自旋与$ {}_{ }{}^{14}\mathrm{N} $核自旋的两比特系统为例):
${{{H}}}_{\mathrm{N}\mathrm{V}} \!=\! {D}_{\mathrm{g}\mathrm{s}}{{{S}}}_{z}^{2} \!+\! {P}_{\mathrm{N}}{({{{I}}}_{z}^{\mathrm{N}})}^{2}-{B}_{0}({\gamma }_{\mathrm{e}}{{S}} \!+\! {\gamma }_{\mathrm{N}}{{{I}}}^{\mathrm{N}}) \!+\! {{S}}\cdot {{{A}}}^{\mathrm{N}}\cdot {{{I}}}^{\mathrm{N}} ,$
其中, ${{{S}}}_{z}^{2}$${{{I}}}_{z}^{\mathrm{N}}$分别为NV电子自旋与$ {}^{14}\mathrm{N} $核自旋算符, $ {D}_{\mathrm{g}\mathrm{s}} $ = 2.87 GHz, 为NV的电子自旋零场劈裂, $ {P}_{\mathrm{N}} $ = –4.95 MHz [51]为NV中心$ {}^{14}\mathrm{N} $核自旋的四偶极矩劈裂. (28)式中的第三项为NV在外磁场下的塞曼劈裂, 其中$ {\gamma }_{\mathrm{e}} $ = 2.082 MHz/G与$ {\gamma }_{\mathrm{N}} $ = –0.308 kHz/G分别为NV电子自旋与$ {}^{14}\mathrm{N} $核自旋的旋磁比. 最后一项是NV电子自旋与$ {}^{14}\mathrm{N} $核自旋的超精细相互作用(hyperfine interaction), $ {{{A}}}^{\mathrm{N}} $为超精细结构张量.
要进行量子计算, 量子体系不仅要具备可操控的量子比特, 还要能够初始化以及读出其状态. 对于NV色心, 其电子自旋是通过激光实现初始化和读出的. NV的零声子线位于637 nm, 在室温下, 由于声子的参与, 一般使用532 nm的激光激发其至激发态. 当处于激发态时, 有两种路径可以回到基态. 第一种是辐射637—750 nm的荧光由激发态直接跃迁回基态, 第二种则是经过中间态回到基态. 对于第二种情况, 自旋是不守恒的, 且不会辐射637—750 nm的荧光[52]. 值得注意的是, 如果NV色心的电子在激发前处于$ | m_{\rm s} =\pm 1\rangle $自旋态, 被激发到第一激发态之后, 其将更倾向于通过中间态回到基态, 这就意味着将会有更大的概率得到$ | m_{\rm s} = 0 \rangle $的自旋态. 同时, 如果NV色心的电子在基态时处于$ | m_{\rm s} = 0\rangle $的自旋态, 它会有更大的概率沿着辐射跃迁的路径, 释放荧光后直接回到基态[53]. 所以我们还是有更大的概率得到$ | m_{\rm s} = 0 \rangle $的自旋态. 经过这个过程, 电子在$ | m_{\rm s} =\pm 1\rangle $上的布居度将不断减少, $ | m_{\rm s} = 0 \rangle $上的布居度将不断的增大[46]. 由此, 可以实现对色心电子自旋的初始化. 同样读出时也会用到上面的性质. 经过中间态回到基态的跃迁过程并不会辐射637—750 nm的荧光, 所以通过荧光强度可以判断出电子自旋跃迁回基态时经历的路径. 同时结合所知的, 处于不同自旋态的电子自旋跃迁时选择路径的倾向也不同, 可以得出结论: NV色心在不同自旋态时, 对应的辐射荧光强度的不同, 以此区分色心的自旋态.
NV色心体系由于其比较成熟的操控技术、较长的退相干时间(NV基态自旋具有固体中任何电子自旋中最长的室温单自旋退相干时间(T2), 在某些样品中大于1.8 ms), 成为了很多科研组在实验体系下实现量子算法的选择. 将NV色心体系作为量子模拟器进行模拟以帮助解决物理问题也是近年来的一个重要研究方向.
2
3.1.卷积神经网络
-->拓扑相的发现改变了人们对量子相的理解. 不像传统的相位, 拓扑相位不满足对称破裂的范式. 相反, 每个对称类中都存在不同的拓扑相. 在实验中, 拓扑相的识别通常依赖于测量具有拓扑起源的某些属性, 而在实验上实现一个明确可以辨别拓扑相的方法, 是十分具有挑战性的. 机器学习很有希望帮助解决这一问题. 在邓东灵与段路明课题组合作的工作[54]中, 利用机器学习对三维手性拓扑绝缘体的外来拓扑相进行了识别.
卷积神经网络(convolutional neural networks, CNN)作为如今发展最迅速的一种神经网络模型, 在计算机视觉、医学影像处理、自然语言处理等领域广泛使用[55,56], 该模型的共享权值的特点, 大大减少了模型训练的复杂度, 同时能够进行表征学习, 并且提取出数据的全局特征和局部特征.
考虑一种三维手性拓扑绝缘体的最小的3带哈密顿量${\cal{H}}= \displaystyle\sum\nolimits_{{{k}}\in BZ} {{{\varPsi}} }_{{{k}}}^{\dagger}{{{H}}}_{{{k}}}{{{\varPsi}} }_{{{k}}}$, 单粒子的动量分辨哈密顿为:

${{\cal{H}}}_{{{k}}}=\left(\begin{array}{ccc}0& {q}_{1}\left({{k}}\right)-\mathrm{i}{q}_{2}\left({{k}}\right)& 0\\ {q}_{1}\left({{k}}\right)+\mathrm{i}{q}_{2}\left({{k}}\right)& 0& {q}_{3}\left({{k}}\right)+\mathrm{i}{q}_{0}\left({{k}}\right)\\ 0& {q}_{3}\left({{k}}\right)-\mathrm{i}{q}_{0}\left({{k}}\right)& 0\end{array}\right) ,$

其中${q}_{1}({{k}})=t\mathrm{s}\mathrm{i}\mathrm{n}{k}_{x}$, ${q}_{2}({{k}})=t\mathrm{s}\mathrm{i}\mathrm{n}{k}_{y}$, ${q}_{3}({{k}})=t\mathrm{s}\mathrm{i}\mathrm{n}{k}_{z}$, $ {q}_{0}\left({{k}}\right)=t\left(\cos{k}_{x}+\cos{k}_{y}+\cos{k}_{z}+h\right.) $. t被设定为1, 而h是一个与维度无关的可调参量. 通过调控NV色心电子自旋基态的三个能级, 在实验上成功模拟出了所需的哈密顿量, 如图6(a)所示. 通过将NV色心基态的三个能级编码为$|1\rangle, |0\rangle, |–1\rangle$态, 观察$ {H}_{{{k}}} $可以发现其并没有对角项, 并且$ |1\rangle $$ |–1\rangle $之间并没有直接的耦合. 因此实验中可以施加能级之间的共振微波, 通过绝热过程, 可以实现对应不同k值点的哈密顿量.
图 6 (a)利用共振微波操控NV色心基态能级; (b)可对拓扑相进行分类的3D卷积神经网络的体系结构, 输入是在10 × 10 × 10规则网格上的密度矩阵的实验数据. 每个密度矩阵由八个实数表示. 输出是每个可能相的分类概率[54]
Figure6. (a) Using resonance microwave to control the ground state energy level of NV color center; (b) architecture of the 3D CNN to classify the topological phases. The input is experimental data of density matrices on a 10 × 10 × 10 regular grid. Each density matrix is represented by eight real numbers[54].

利用NV色心中的电子自旋模拟的三维手性拓扑绝缘体哈密顿量生成的原始数据, 训练卷积神经网络以识别拓扑相, 这样的监督学习类似于处理经典的图像识别. 如图6(b)所示,将在10 × 10 × 10规则网格的密度矩阵的实验数据作为输入, 通过一个用来预测拓扑不变量的预训练卷积神经网络迁移到分类不同拓扑相的问题中, 输出各个可能的拓扑相得经典概率. 实验发现即使只用输入10%实验数据, 模型也能够达到90%的识别率, 表明了即使使用最少数量的数据样本, 也可以训练CNN来成功识别拓扑阶段, 如图7所示.
图 7 迭代次数增加时的训练和验证准确性. 训练和验证准确性在训练过程开始时迅速增加, 然后达到了很高的饱和值(≈ 98%)[54]
Figure7. The training and verification accuracy when the number of iterations increases. The training and validation accuracy increased rapidly at the beginning of the training process, and then reached a high saturation value (≈ 98%)[54].

训练卷积神经网络的方式将比传统的方法更加有效. 首先, 对于未知序参量和拓扑不变量的拓扑相, 由于不需要知道各个拓扑不变量的精确解而只需要必要的训练数据, 所以可以被更广泛地应用在未知拓扑相之中. 再者, 没有在常规网格上提供数据的情况下, 离散积分的常规方法无法使用. CNN在这方面具有更好的应用范围. 因此在实验中所需要的样本也就更少. 并且, 机器学习是直接从混态之中提取数据, 而不需要依赖于纯态定义的拓扑不变量. 这在量子实验体系中是具有极大优势的.
2
3.2.量子主成分分析
-->由于主成分分析(PCA)在对数据降维的同时能够尽可能保留有效信息的特性, 其在机器学习领域有着十分广泛的应用前景. 量子主成分分析(qPCA)由于量子算法的量子加速特性, 可以比经典算法更加高效地解决问题. 对未知的低秩密度矩阵的量子主成分分析以量子形式快速揭示了与大特征值相对应的特征值, 并为机器学习和数据分析提供了潜在的量子加速器. 对于qPCA, 如何萃取出其主成分一直是一个问题. 前文提到, qPCA算法解决了时间复杂度的问题, 但实验上仍然需要大量的运算资源, 对量子比特数和操控的精确度都有着很高的要求, 所以完成实验一直都是一件很困难的事情.
杜江峰课题组[57]基于金刚石NV色心体系利用量子机器学习完成了主成分分析算法(PCA), 如图8所示. 在实验中使用了基于共振的量子主成分分析(RqPCA), 通过引入一个辅助比特, 实现了算法的量子指数加速.
图 8 共振量子主成分分析算法原理图 (a)探针-寄存器耦合系统的能级结构, $ \left|{\lambda }_{i}\right\rangle $$ {{\rho }} $的第$ i $个本征态, 而$ {\lambda }_{i}\in [0, 1] $是对应的本征值, 如果扫描频率$ \omega \approx {\lambda }_{i} $, 就会引起探针量子位的拉比振荡; (b)使用Suzuki-Trotter分解的RqPCA的量子电路, 对探针量子位进行投影测量得到$ \left|1\right\rangle $表明该算法成功[57]
Figure8. Algorithm schematic of RqPCA: (a) The energy structure of the coupled probe-register system. $ \left|{\lambda }_{i}\right\rangle $ is the i-th eigenstate of $ {{\rho }} $ and $ {\lambda }_{i}\in [0, 1] $ is the corresponding eigenvalue. Once the scanning frequency $ \omega \approx {\lambda }_{i} $, the Rabi oscillations of the probe qubit is induced; (b) the quantum circuit of RqPCA. The projective measurement of the probe qubit in the state $ \left|1\right\rangle $ indicates success of the algorithm, with principal component being distilled in the register[57].

实验体系的哈密顿量为 ${{ H}} = \left| 1 \right\rangle \left\langle 1 \right| \otimes {{\rho }}\; + $$ \dfrac{\omega }{2}{{{\sigma }}_z} \otimes {{{I}}_n}$, 其中第一项为辅助比特与量子寄存器的耦合项, 第二项为所添加的可调能量偏执. ${{{{I}}}_n}$为与${{\rho }}$维度相同的单位阵. 当施加一个以强度c驱动辅助比特的外场, 若$\omega \approx {\lambda _i}$, 则会发生从$\left| 0 \right\rangle \left| {{{{\lambda}} _i}} \right\rangle$$\left| 1 \right\rangle \left| {{{{\lambda}} _i}} \right\rangle$的跃迁. 当初态制备到${{{\rho }}_{{\rm{ini}}}} = \left| 0 \right\rangle \left\langle 0 \right| \otimes {{\rho }}$时, 系统将在下面的哈密顿量下演化:
$\begin{split}{{\cal{H}}}_{\mathrm{R}\mathrm{q}}\left(\omega \right)=\;&\frac{\omega }{2}{{{\sigma }}}_{z}\otimes {{{I}}}_{n}+c{{{\sigma }}}_{x}\otimes {{{I}}}_{n}+\left| 1 \right\rangle \left\langle 1 \right|\otimes {{\rho}} \\=\;&\sum\limits_{i} \frac{\omega -{\lambda }_{i}}{2}{{{\sigma}} }_{z}\otimes \left|{\lambda }_{i}\right\rangle \left\langle{\lambda }_{i}\right|+c{{{\sigma}} }_{x}\otimes {{{I}}}_{n}\\&+{{{I}}}_{2}\otimes \sum\limits_{i} \frac{{\lambda }_{i}}{2}\left|{\lambda }_{i}\right\rangle \left\langle{\lambda }_{i}\right|.\\[-15pt]\end{split} $
通过对$\omega $进行扫频, 当满足某个特定$ {\lambda }_{i} $, 探测比特会以
${P}_{i}\left(\omega \right)={\lambda }_{i}{D}_{i}^{2}{\mathrm{sin}}^{2}\left(\frac{c\tau }{{D}_{i}}\right),~~ i=\mathrm{1,2}, \cdots ,n$
的概率跃迁, 其中${D}_{i}=\sqrt{\dfrac{(2 c{)}^{2}}{(2 c{)}^{2}+{\left(\omega -{\lambda }_{i}\right)}^{2}}}\mathrm{}$. 在实验中, 通过测量探测比特在$ \left| 1 \right\rangle $上的布居度, 可以得到相应的谱线, 而每一个峰就对应一个相应的特征值. 对一个4 × 4的矩阵进行主成分分析, 其效率可达86%, 保真度可达0.90.
2
3.3.量子自编码器
-->自动编码器的想法在神经网络领域已经流行了数十年, 通常是为了降低数据的维度. 它以一种无监督的方式学习有效的数据编码, 包括一个编码器, 用于学习一组数据的表示形式; 以及一个解码器, 用于从简化的编码中生成尽可能接近其原始输入的表示形式. 自编码器通过简单地学习将输入复制到输出来工作. 这一任务(就是输入训练数据, 再输出训练数据的任务)听起来似乎微不足道, 然而这过程有一个很大的难点, 那就是总要根据自己的需求去找到合适的方式来约束训练的过程. 我们最常用的降维其实就是一个很好的例子, 限制数据的维度并不是一个简单的过程. 我们所加的这些限制条件, 一方面要能够满足我们的要求(比如对噪声的处理或者还原), 另一方面还需要能够有效地防止程序机械的将数据复制输出, 使其具有高效表达的能力.
受到经典自编码器的启发, 其在量子领域也可以用来解决一些传统方法难以轻松解决的问题. 接下来我们介绍其中一种很有效的应用. 文献[58]基于NV体系构建了量子自编码器, 如图9所示, 并通过提高量子纠缠的寿命进行了验证. 量子纠缠作为极为重要的量子资源, 却又非常脆弱, 容易受到环境的干扰而发生退相干, 因此保护纠缠, 抑制退相干是量子领域里的核心话题. 有一种方法是将纠缠的有效信息通过机器学习的方式编码到相干时间长的子空间, 而在需要取出信息时再进行反向解码操作, 还原为原有信息, 这样就变相的提高了量子纠缠的寿命.
图 9 (a)量子自编码器线路图, 通过编码操作$ {{\cal{U}}}_{\cal{E}} $$ \left|{\varPsi }_{i}\right\rangle $中的信息压缩到$ {\left|\phi \right\rangle }_{\mathrm{c}\mathrm{o}\mathrm{d}\mathrm{e}} $中, 在需要时通过解码操作$ {{\cal{U}}}_{\cal{D}} $$ {\left|\phi \right\rangle }_{\mathrm{c}\mathrm{o}\mathrm{d}\mathrm{e}} $还原为$ \left|{\varPsi }_{f}\right\rangle $; (b)优化编码器的基于梯度算法的HQCA的训练过程, $ {\rho }_{\mathrm{i}\mathrm{n}} $是编码器的输入状态, $ {\rho }_{\mathrm{o}\mathrm{u}\mathrm{t}} $是辅助量子位的输出状态, $ f\left({{\cal{U}}}_{\cal{E}}^{\left(q\right)}\right) $是成本函数, q是迭代次数[58]
Figure9. (a) Quantum autoencoder circuit. The target information of $ \left|{\varPsi }_{i}\right\rangle $ can be encoded to the code state $ {\left|\phi \right\rangle }_{\mathrm{c}\mathrm{o}\mathrm{d}\mathrm{e}} $ via the encoder $ {{\cal{U}}}_{\cal{E}} $. $ {\left|\phi \right\rangle }_{\mathrm{c}\mathrm{o}\mathrm{d}\mathrm{e}} $ can be reconstructed to $ \left|{\varPsi }_{f}\right\rangle $ when needed by the decoder $ {{\cal{U}}}_{\cal{D}} $. (b) Training process of the gradient-based HQCA to optimize encoder. Here, $ {\rho }_{\mathrm{i}\mathrm{n}} $ is the input state of the encoder, and $ {\rho }_{\mathrm{o}\mathrm{u}\mathrm{t}} $ is the output state on the ancilla qubits. $ f\left({{\cal{U}}}_{\cal{E}}^{\left(q\right)}\right) $ is the cost function, where q is the current iterative number[58].

文中基于参数化量子线路的思想构建编码器, 编码器设定为共包含四个参数的操控算符, 四个参数分别对应两束选择性微波脉冲MW1和MW2的振幅和相位. 之后采用混合量子经典方法(HQCA)进行训练, 由量子系统和经典系统共同组成训练体系, 基于梯度算法对参数进行迭代, 成本函数和梯度的计算在量子系统中执行, 其余部分则由经典系统完成. 每次迭代都根据由量子系统测量得到的成本函数的值以及设定的步长来进行梯度运算, 以合适的学习率对参数进行调整更新, 直至其满足实验需求而完成迭代. 这种方式能够缓解量子资源不足的问题, 同时经过机器学习过程也能抑制量子系统本身造成的实验误差. 本文基于金刚石NV色心体系对这种方法进行了验证, 把电子自旋和核自旋的贝尔态中的纠缠信息编码到相干时间较长的核自旋上进行保护, 使得纠缠的寿命由2 μs提升到3 ms, 提升超过了1000倍.
值得注意的是, 本文主要介绍了量子机器学习基于NMR和NV色心这两种自旋量子体系在近年来的实验进展, 并不是关于量子机器学习的全面综述, 只介绍了这两种实验体系涉及到的部分量子机器学习算法. 除了这两种体系, 量子机器学习在诸如超导[32,59]、光学[30,60]等体系中都有着良好的发展.
量子机器学习是近几年新兴的交叉研究领域, 有着巨大的发展潜力. 虽然已经取得了一定的成果, 但是在未来的发展中依然存在着很多问题[14]. 首先, 在解决实际问题时, 需要将经典的信息导入到量子体系当中, 这个经典到量子的信息转换过程本身就很复杂, 会耗费大量的资源, 目前仍没有行之有效的方法. 其次, 常见的各类量子体系还都不够成熟, 量子机器学习的发展在今后相当长的一段时期内仍将受限于量子比特的数目、相干性、可纠错性等问题, 构建通用量子计算机或专用量子处理器仍十分困难. 最后, 对于已有的量子算法, 难以断言其处理问题的过程中, 是否存在着超越经典算法的优势, 同时也缺少评估量子算法有效性的系统性方法.
虽然还存在种种问题, 现阶段量子机器学习在解决各学科领域的问题已经显示出巨大优势潜力, 尤其是为一些常见的量子物理问题的分析和处理提供了一种有效的手段, 例如量子拓扑相的鉴定等[54,61-66], 未来必将能够继续助力各领域的突破和发展.
相关话题/实验 数据 系统 计算 电子

  • 领限时大额优惠券,享本站正版考研考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是考研复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19
  • 基于波动与扩散物理系统的机器学习
    摘要:物理学在机器学习中的应用以及两者的交叉融合正引起广泛关注,尤其是在波动系统和扩散系统中.本文重点关注波动与扩散物理系统和机器学习之间的内在联系以及对机器学习算法和物理实现的推进作用,综述了波动系统和扩散系统中的机器学习研究,介绍了部分最新研究成果.文中首先讨论了监督学习的波动系统实现,包括神经 ...
    本站小编 Free考研考试 2021-12-29
  • 基于深度学习的相位截断傅里叶变换非对称加密系统攻击方法
    摘要:大多数光学加密系统都是对称加密系统,在光学图像加密中明文和密文之间具有线性关系,其系统的安全性有待加强.而基于相位截断傅里叶变换(phase-truncatedFouriertransform,PTFT)的非对称加密系统,其非线性的相位截断操作使加密系统的安全性得到了极大提升.本文提出使用深度 ...
    本站小编 Free考研考试 2021-12-29
  • 一种计算非平衡等离子体中粒子能级布居的简化方法
    摘要:获得粒子能级布居是研究非平衡等离子体辐射性质的一个重要方面.对于复杂三维等离子体,采用细致碰撞辐射模型虽然精确,但计算耗费大.本文提出了一种束缚态特征温度法,能够快速计算得到非平衡等离子体中的粒子能级布居.对非平衡氖等离子体算例的研究表明,本文方法是有效的,在等离子体非平衡程度不太高时与碰撞辐 ...
    本站小编 Free考研考试 2021-12-29
  • 基于剪切模量和热分析数据研究Zr<sub>50–</sub><i><sub>x</sub></i>Cu<sub>34
    摘要:非晶合金具有独特物理和力学性能,如何建立非晶合金微观结构非均匀性与物理/力学性能之间的关联是非晶固体的重要研究课题之一.微合金化是调控非晶合金微观结构有效手段之一.本研究以玻璃形成能力优异的Zr50–xCu34Ag8Al8Pdx(x=0,2)非晶合金为模型合金,借助差示扫描量热仪和电磁声转换设 ...
    本站小编 Free考研考试 2021-12-29
  • L型步行通道内行人转弯行为的实验分析与仿真
    摘要:以L型步行通道内的单向行人流为研究对象,基于可控实验与微观仿真研究行人转弯行为.首先,构建转弯区无障碍物、障碍物沿转弯区对角线布局、以及障碍物垂直转弯区对角线布局三种实验场景,通过行人可控实验分析行人移动轨迹、速度分布等行为特征;然后,基于L型通道内的行人微观行为,改进基于Voronoi图的速 ...
    本站小编 Free考研考试 2021-12-29
  • 甚低频台站信号对地球内辐射带和槽区能量电子的散射效应分析
    摘要:人工地面甚低频台站发射的10—30kHz信号主要在地球—低电离层波导传播,部分能量会泄露进入内磁层,进而会影响近地空间中高能电子的动态变化过程.本文详细研究了NWC,NAA和DHO38三个人工甚低频台站信号对内辐射带和槽区高能电子的散射作用.基于准线性理论,分别计算了三个甚低频台站信号单独和共 ...
    本站小编 Free考研考试 2021-12-29
  • 二维冰相I的电子和光学性质
    摘要:二维冰是典型的原子制造技术获得的新型原子级材料,其结构和成核生长在材料科学、摩擦学、生物学、大气科学和行星科学等众多领域具有至关重要的作用.虽然二维冰的结构性质已被广泛研究,但对其电学和光学性质知之甚少.本文通过密度泛函理论和线性响应理论计算了二维冰相I在零温时的主要电学、光学、介电性质和红外 ...
    本站小编 Free考研考试 2021-12-29
  • 二维原子晶体的转移堆叠方法及其高质量电子器件的研究进展
    摘要:可剥离至原子层厚度的层状材料被称为二维原子晶体,是凝聚态物理研究的前沿材料体系之一.与体材料相比,二维原子晶体的原子完全暴露,对外界环境极为敏感,因此剥离、转移、旋转、堆叠、封装和器件加工技术对于其电子器件质量和电学输运性质研究尤为关键.本文介绍了二维原子晶体转移工艺的重要发展,尤其是对其二维 ...
    本站小编 Free考研考试 2021-12-29
  • 基于微波-电子康普顿背散射的环形正负电子对撞机束流能量测量方案
    摘要:环形正负电子对撞机(CEPC)束流能量的精确标定是希格斯粒子质量宽度、W/Z玻色子质量的精确测量,从而精确检验标准模型的基本实验依据.基于此,束流能量的误差控制要求在10–5水平.康普顿背散射方法是适用于百GeV高能电子对撞机束流能量高精度标定的测量方法.本文拟采用微波电子康普顿背散射后对散射 ...
    本站小编 Free考研考试 2021-12-29
  • 高超声速三角翼上横流不稳定性的实验研究
    摘要:本文研究了三角翼迎风面边界层中的非定常横流不稳定性.实验在马赫6低噪声风洞中进行,模型为平板构型,攻角为5°和10°.通过温敏漆技术,观察到在远离头部的区域,边界层转捩阵面光滑且平行于前缘,通过Kulite高频脉动压力传感器得到的功率谱密度曲线中有明显的f≈10kHz的扰动波信号峰值.利用基于 ...
    本站小编 Free考研考试 2021-12-29