1.Shanghai Key Laboratory of Special Artificial Microstructure Materials and Technology, Center for Phononics and Thermal Energy Science, School of Physics Science and Engineering, Tongji University, Shanghai 200092, China 2.Shanghai Research Institute for Intelligent Autonomous Systems, Tongji University, Shanghai 200092, China
Fund Project:Project supported by the National Natural Science Foundation of China (Grant Nos. 11935010, 11775159), the Natural Science Foundation of Shanghai Science and Technology Committee, China (Grant No. 18JC1410900), the Opening Project of Shanghai Key Laboratory of Special Artificial Microstructure Materials and Technology, China, and the Fundamental Research Funds for the Central Universities, China
Received Date:10 May 2021
Accepted Date:01 July 2021
Available Online:16 July 2021
Published Online:20 July 2021
Abstract:Recently, the application of physics to machine learning and the interdisciplinary convergence of the two have attracted wide attention. This paper focuses on exploring the internal relationship between physical systems and machine learning, and also on promoting machine learning algorithm and physical implementation. We summarize the researches of machine learning in wave systems and diffusion systems, and introduce some of the latest research results. We first discuss the realization of supervised learning for wave systems, including the wave optics realization of neural networks, the wave realization of quantum search, the recurrent neural networks based on wave systems, and the nonlinear wave computation of neural morphology. Then, we discuss the machine learning algorithms inspired by diffusion systems, such as the classification algorithm based on diffusion dynamics, data mining and information filtering based on thermal diffusion, searching for optimization based on population diffusion, etc. The physical mechanism of diffusion system can inspire the construction of efficient machine learning algorithms for the classification and optimization of complex systems and physics research, which may create a new vision for the development of physics inspired algorithms and hardware implementation, and even the integration of software and hardware. Keywords:wave systems/ diffusion systems/ machine learning/ artificial neural network
全文HTML
--> --> --> -->
3.1.神经网络的波动光学实现
对于最常见的全连接神经网络, 输出层中的每个元素都可以视作输入层中所有元素的加权和. 这种矢量-矩阵乘法的运算, 可以通过马赫-曾德干涉仪在光学领域实现[24]. 随着近年来光子集成电路的迅速发展, 科学家用一个可编程纳米光子处理器来实现基于相干光和全光学矩阵乘法的硅光子神经形态电路(图3(a))[25]. 光子神经形态计算的另一个重要方法是基于相变材料和器件的整合. 最近一项研究中, 科学家利用微米级环型谐振器将输入信息调制成不同波长, 并通过相变材料实现权重调节(图3(b)). 这种方式通过相变材料和环型谐振器的耦合来实现非线性激活, 最终在光子集成系统中构建出了脉冲神经网络[12,26], 有效地减小了光子芯片的体积. 图 3 (a) 基于相干光和全光学矩阵乘法的硅光子神经形态电路可用于实现元音分类[25]; (b) 基于波分复用(WDM)的分层结构构成的全光脉冲神经网络, 能够实现图像和语言识别[12]; (c) 改进的光学4f系统实现卷积神经网络, 提高图像分类性能[27]; (d) 全光衍射深度神经网络实现数字分类[29]; (e) 光学衍射元件与图像处理算法端对端协同设计[32] Figure3. (a) Nanophotonic circuits based on coherent light and all-optical matrix multiplication is capable for vowel recognition[25]; (b) image and language recognition are achieved by an all-optical spiking neural networking with wavelength division multiplexing (WDM)[12]; (c) a design for an optical convolutional layer using a modified optical 4f system[27]; (d) an all-optical diffractive deep neural network that implements the digit classification[29]; (e) end-to-end learning paradigms of diffractive optics and processing algorithms[32].
波的动力学与递归神经网络(recurrent neural network, RNN)之间具有强烈的映射关系(图5)[41]. 包括声学和光学在内的波动物理可以自然地为时变信号构建模拟处理器. 如图5(a)所示, 递归神经网络中的更新过程可以描述为 图 5 标准RNN和波物理的对比 (a)具有离散的输入、输出序列的RNN的更新过程; (b) 具有连续输入、输出序列的波动系统系统的更新过程[41] Figure5. Comparison of a standard RNN and a wave system: (a) The update process of an standard RNN with discrete input and output sequence; (b) the update process of a wave-based physical system with continuous input and output sequence[41].
通过扩散, 原空间中的高维数据被映射到k个特征向量上, 扩散距离的大小代表着数据之间的相似度大小(图7(a)). 经过长时间的演化, 数据自然地进行聚类, 并在数据分布图和势能绘景图上显示出分类信息(图7(b)). 图 7 利用扩散映射实现典型声子系统中的流形聚类 (a) 流形空间降维; (b) 流形空间的样本数据分布与势能绘景; (c) 流形空间的扩散与凝聚, 稳态显示出天然的聚类; (d)随机耦合的无序Su-Schrieffer-Heeger(SSH)声子链; (e) 无序非晶态声子的拓扑分类; (f) 一维非厄米声子链; (g) 高阶拓扑声子[21] Figure7. Diffusion mapping in typical phononic systems to realize manifold clustering: (a) Dimension reduction in manifold space; (b) the probability distribution of samples and the effective landscape; (c) along with evolution, the samples diffuse and finally concentrate on positions with minimum local potentials, which indicates the clustering; (d)–(g) applications in disordered photonic SSH chain, amorphous topological phononics, 1D non-Hermitian phononic chain, high-order topological phononics[21].
最近, 同济大学声子学课题组通过扩散映射, 实现了基于实空间动力学性质相似性的拓扑声子无监督流形聚类(图7)[21]. 用一个$ L\times L $阶的对角矩阵$ \widehat{{P}} $描述声子系统谐振子之间的相互作用, 对应的核矩阵为${A}_{\varepsilon }\left(i, j\right)={\rm{exp}}\bigg(-\dfrac{{||{\widehat{P}}_{i}-{\widehat{P}}_{j}||}^{2}}{2\varepsilon {L}^{2}}\bigg)$. 拓扑不变量v是关于几何参数构型$ \widehat{{P}} $的函数, 所以可以根据构型$ \widehat{{P}} $的差异对拓扑性质$v\big(\widehat{{P}}\big)$进行分类. 这种聚类方法只需要定义矩阵$ \widehat{{P}} $和核矩阵$ {{{A}}}_{\varepsilon }\left(i, j\right) $, 不需要针对具体系统定义特定的拓扑不变量, 因此可用于不同的拓扑声子系统, 包括随机耦合的一维Su-Schrieffer-Heeger声子链(图7(d))、不规则声子拓扑绝缘体(图7(e))、随机耗散的非厄米声子链(图7(f))和具有高阶声子拓扑态(图7(g)). 基于扩散动力学的分类算法有很强的可适应性, 通过定义式(8)式中的核矩阵$ {A}_{i, j}={A}_{\varepsilon }\left({x}_{i}, {x}_{j}\right) $的具体形式, 能够快速转变成适合不同物理情境的分类算法. Rodriguez-Nieva和Scheurer[52]提出了基于扩散映射的无监督机器学习算法, 能够对二维XY模型的样品进行卷绕数分类, 并捕获Berezinskii-Kosterlitz-Thouless跃迁(图8(a)). 这种方法也可以应用于伊辛规范理论, 从而通过扩散图进行拓扑分类, 实现了对物质奇异相的完全无监督研究. 继我们的工作之后[21], Scheurer 和Slager[53]将扩散映射算法用于搜索哈密顿量之间的绝热路径, 从而根据它们的拓扑性质对它们进行聚类. Lustig等[54]将类似的方法应用于从实验数据中识别拓扑相变, 分析了经历拓扑相变的光学系统的实验数据, 证明了即使数据来源于系统的一小部分甚至不包括边缘态, 扩散映射也能识别拓扑相变(图8(b)). Lidiak和Gong[55]提出了适用于量子系统中的扩散映射算法, 作为学习各种量子相位和相变的通用工具(图8(c)). 这种方法可以在单一基础上测量局部可观测值, 例如测量单个方向上的所有自旋, 因此很容易应用于许多实验量子模拟器. 另外, Che等[56]提出了适用于动量空间的扩散映射方法, 成功识别拓扑特征, 并且在动量空间中的典型Su-Schrieffer-Heeger模型、Qi-Wu-Zhang模型和淬火Su-Schrieffer-Heeger模型上证明了这种方法. 图 8 基于扩散映射的无监督学习方法适用于解决不同物理系统中的拓扑分类问题 (a) 一维XY模型拓扑序的检测[52]; (b) 扩散映射能够不借助边缘态, 识别Haldane模型描述的拓扑相变点[54]; (c) 量子系统中的扩散映射算法, 能够无监督地识别$ {\mathbb{Z}}_{3} $横场伊辛模型的量子相[55] Figure8. The unsupervised learning with diffusion map is applied to solve topology identification in different physical systems: (a) Identifying the topological order in 1-dimensional XY model[52]; (b) detection of the phase transition for the Haldane model without the edge states[54]; (c) diffusion maps in learning quantum phases with a $ {\mathbb{Z}}_{3} $ transverse field Ising model[55].
扩散搜索算法能够在庞大的数据集中, 通过随机且分布均匀的搜索方式实现信息的最优化处理, 被广泛的应用于结构搜索[59-61]. Pickard和Needs[62]将随机扩散与第一性原理相结合, 提出了从头算随机结构搜索算法(ab initio random structure searching, AIRSS). 该算法以最随机的方式生成初始结构, 为了提高效率可以考虑引入基于化学、实验或对称性的偏置条件, 然后在保持实验和对称约束的同时演化起始结构. AIRSS的计算量集中在演化大量不同的初始结构, 直到多次获得相同的最低能量结构, 以确保该结构的势能面位于全局最小值. 粒子群优化算法(particle swarm optimization, PSO)[63]模拟自然界中鸟群的捕食行为, 它不同于普通的单一粒子扩散行为, 群体中每个粒子的扩散搜索不仅受到自身个体极值影响, 还受到整个粒子群的当前全局最优解影响, 最终实现全局或局部扩散搜索最优解(图10(a)). 利用PSO进行晶体结构搜索, 吉林大学马琰铭教授团队[64,65]开发了CALYPSO, 全称为基于粒子群优化算法的晶体结构分析(crystal structure analysis by particle swarm optimization). 该方法只需要给定材料的化学成分和外部条件, 如压力, 就能预测材料稳定或亚稳结构, 大大减少了第一性原理密度泛函计算的计算量 (图10(b)). CALYPSO算法的开发启发了很多原创性工作, 在设计各种材料方面具有广泛应用, 为功能驱动的材料设计打开了大门, 具体内容可以参考《Journal of Physics: Condensed Matter》, 《Computational Materials Science》以及《Chinese Physics B》上的相关综述文章[66-68]. 图 10 (a) 全局及局部粒子群优化算法示意图; (b) 粒子群优化算法中速度及位置更新示意图[68]; (c) 多目标优化的二维SnSe材料定向设计工作流程图; (d) 室温下(300 K), 二维SnSe材料单层结构的自由能; (e) 图(d) 中第一Pareto前沿(红线)上的四种新型单层结构的三视图, 深灰色和绿色的球分别表示Sn原子和Se原子[70] Figure10. (a) The diagram of PSO; (b) The schematic diagram of the velocity and position updates in PSO[68]; (c) workflow of the multi-objective optimization for 2D SnSe materials design; (d) thermopower landscape at room temperature (300 K) versus the free energy of 2D SnSe materials; (e) four 2D SnSe structures on the first Pareto front, where the dark gray and green balls denote Sn and Se atoms, respectively[70].