基于机器学习J1-J2反铁磁海森 - 中科院物理研究所

全文HTML

--> --> -->

1.引　言

机器学习算法的改进和更快更强的硬件能够让研究者从庞大的数据中提取出有用的信息, 现在已广泛应用于许多研究领域, 这些发展对物理科学也产生了广泛的影响, 特别是在分类量子相变上^[1-10]. 量子相变是系统在绝对零度下发生的一种相变, 它仅仅由系统的哈密顿量变化带来的量子扰动引起^[11,12]. 在量子力学中, 系统的物理状态可以表示为希尔伯特空间的一个矢量, 由于量子态通常已经归一化, 研究者经常使用保真度(两个量子态的内积)来研究量子相变, 它能反映两个态之间的相似程度, 保真率反映的是这种变化的速率, 这是一个纯粹几何学上的概念, 分析认为机器学习方法应该也能从态矢量中提取信息来反映系统相变, 其与保真度不同的是, 输出结果是该态矢量与模型训练数据中的所有同类态矢量的相似程度. 研究量子相变, 除了能进一步丰富人们对低温磁性材料、铁电材料、超导体的认识外, 对其他学科和量子计算技术早期的实践都具有重要意义. 在一个很大的晶格中, 计算序参量来判断相变需要很大的计算量, 也需要有先验知识来构造一个合适的序参量. 机器学习为我们提供了一种新的识别相变点的方法.
Walker等^[13]使用无监督机器学习有效识别了材料结构变化的转变温度, Jadrich等^[14]研究表明不需要有任何先验知识来构造一个合适的序参量, 使用主成分分析法就能自动发现序参量来分类相, 从而简化了对相的常规分析. Canabarro等^[15]使用无监督机器学习识别了轴向次近邻伊辛模型的3个主要相. Carrasquilla等^[16]研究表明神经网络能够被用来编码物质相和识别强关联多体系统的相变. Ahmadreza等^[17]使用卷积神经网络高精度的定位了二维伊辛模型的相变点.
大量研究表明机器学习能够有效识别相变点, 然而当面对一个全新的系统时, 使用无监督学习得到的分类点是否是相变点仍需要计算序参量加以佐证, 当不知道相变点时, 也无法选择合适的分类点, 给训练数据集贴上标签, 训练神经网络模型. 这时就需要将非监督学习和监督学习结合起来, 可以先使用无监督学习算法找到分类点, 再使用稍微远离分类点的两侧数据集进行训练. 发现如果无监督学习得到的分类点为相变点, 通过增加分类点一侧的训练数据或者调整训练集的分布区域, 该点位置一般不会发生变化, 若其不是相变点, 其位置必发生变化, 由此, 就可以不需要任何先验知识, 不需要计算任何序参量, 直接通过机器学习的方法找到相变点. 本文采用上述机器学习方法可以从基态精确找到海森伯J₁-J₂模型的一阶相变点、无法找到无穷阶相变点, 从第一激发态不仅能找到一阶相变点, 还能找到无穷阶相变点.

4.结果与讨论

4.1.从基态寻找相变点

-->

4.1.从基态寻找相变点

使用J₂/J₁$\in $

[0, 1)(链长N = 16的取J₂/J₁$\in $

[0, 0.53), 因为取J₂/J₁$\in $

[0, 1)会优先识别随系统尺寸变化而改变的相变点J₂/J₁ = 0.534)的海森伯J₁-J₂模型基态态矢量作为训练集, 生成n为2的GMM, 再用该模型对海森伯J₁-J₂模型基态态矢量分类, 得到如图2(a)所示的分类结果, 可以看出J₂/J₁ = 0.5是它的一个分类点, 其不随系统尺寸变化而改变.

图 2 (a) 训练数据为J₂/J₁$\in $

[0, 1)的海森伯J₁-J₂模型基态矢量生成的GMM对基态矢量的分类结果; (b)采用标记为0的J₂/J₁$\in $

[0.35, 0.45)和为1的J₂/J₁$\in $

[0.55, 0.65); (c)标记为0的J₂/J₁$\in $

[0.3, 0.4)和为1的J₂/J₁$\in $

[0.55, 0.65); (d)标记为0的J₂/J₁$\in $

[0.2, 0.3)和为1的J₂/J₁$\in $

[0.55, 0.65)的基态态矢量作为训练数据, 训练所得的CNN模型对基态态矢量的预测结果
Figure2. (a) Ground state vector classification results of the GMM generated by the Heisenberg J₁-J₂ model ground state vector with the training data of J₂/J₁$\in $

[0, 1); (b) using the ground state vector of J₂/J₁$\in $

[0.35, 0.45) marked as 0 and J₂/J₁$\in $

[0.55, 0.65) marked as 1; (c) J₂/J₁$\in $

[0.3, 0.4) marked as 0 and J₂/J₁$\in $

[0.55, 0.65) marked as 1; (d) J₂/J₁$\in $

[0.2, 0.3) marked as 0 and J₂/J₁$\in $

[0.55, 0.65) marked as 1 as training data, the prediction results of the ground state vector by the trained convolutional neural network model.

接下来采用稍微远离J₂/J₁ = 0.5的数据集作为训练集和验证集, 对该点是否是相变点进一步验证. 我们采用标记分别为0(采用one-hot编码)的J₂/J₁$\in $

[0.35, 0.45)和为1的J₂/J₁$\in $

[0.55, 0.65)的基态态矢量作为训练数据和验证数据(链长N = 16的取J₂/J₁$\in $

[0.51, 0.61), 因为取J₂/J₁$\in $

[0.55, 0.65)会识别随系统尺寸变化而改变的J₂/J₁ = 0.534相变点), 训练CNN模型. 之后使用该模型对海森伯J₁-J₂模型基态态矢量进行预测, 预测结果如图2(b)所示, 发现神经元输出在J₂/J₁ = 0.5 处发生跳变, 接下来采用标记分别为0的J₂/J₁$\in $

[0.3, 0.4)和为1的J₂/J₁$\in $

[0.55, 0.65)的基态态矢量和标记分别为0的J₂/J₁$\in $

[0.2, 0.3)和为1的J₂/J₁$\in $

[0.55, 0.65)的基态态矢量作为训练数据, 分别训练两个CNN模型, 再用模型对基态态矢量进行预测, 预测结果如图2(c)和图2(d)所示, 发现前后使用不同训练数据集训练的CNN对测试数据集的预测结果几乎没有发生变化, 因此, 基本就能确定J₂/J₁ = 0.5为该系统相变点. 这样就在没有任何先验知识, 不知道系统哈密顿量, 能量的条件下从基态态矢量中直接找到了J₁-J₂海森伯自旋链系统的一阶相变点.
同样使用J₂/J₁$\in $

[0, 0.5)的海森伯J₁-J₂模型基态态矢量作为训练集(GMM模型给出的不同链长的分类点不尽相同, 但其结果基本一样, 所以仅以链长N = 10的态矢量的分类结果为例进行讨论), 生成n = 2的GMM, 再用该模型对海森伯J₁-J₂模型基态态矢量分类, 得到如图3(a)所示的分类结果, 其在J₂/J₁ = 0.305处出现分类点. 然后, 分别采用标记分别为0的J₂/J₁$\in $

[0.25, 0.3)和为1的J₂/J₁$\in $

[0.35, 0.4)的基态态矢量作为训练数据, 采用标记分别为0的J₂/J₁$\in $

[0.2, 0.25)和为1的J₂/J₁$\in $

[0.35, 0.4)的基态态矢量作为训练数据, 和采用标记分别为0的J₂/J₁$\in $

[0.2, 0.25)和为1的J₂/J₁$\in $

[0.35, 0.4)的基态态矢量作为训练数据(标记为1的数据是标记为0数据的5倍), 分别训练3个CNN模型, 之后使用模型对系统基态的态矢量进行预测, 预测结果如图3(b)—(d)所示. 可以看出, CNN给出的分类点随训练数据集数据的变化而发生改变, 不能给出确定的相变点, 因此不能通过该方法从基态态矢量中找到无穷阶相变点, 但能够有效排除无监督学习给出的假的相变点.

图 3 (a) 训练数据为J₂/J₁$\in $

[0, 0.5)的海森伯J₁-J₂模型基态态矢量生成的GMM对基态态矢量的分类结果; (b) 分别为采用标记为0的J₂/J₁$\in $

[0.25, 0.3)和为1的J₂/J₁$\in $

[0.35, 0.4); (c)标记为0的J₂/J₁$\in $

[0.2, 0.25)和为1的J₂/J₁$\in $

[0.35, 0.4); (d)标记为0的J₂/J₁$\in $

[0.2, 0.25)和为1的J₂/J₁$\in $

[0.35, 0.4)(标记为1的数据是标记为0的5倍)的基态态矢量作为训练数据, 训练所得的CNN模型对基态态矢量的预测结果
Figure3. (a) Ground state vector classification results of the GMM generated by the Heisenberg J₁-J₂ model ground state vector with the training data of J₂/J₁$\in $

[0, 0.5); (b) respectively usingthe ground state vector of J₂/J₁$\in $

[0.25, 0.3) marked as 0 and J₂/J₁$\in $

[0.35, 0.4) marked as 1; (c) J₂/J₁$\in $

[0.2, 0.25) marked as 0 and J₂/J₁$\in $

[0.35, 0.4) marked as 1; (d) J₂/J₁$\in $

[0.2, 0.25) marked as 0 and J₂/J₁$\in $

[0.35, 0.4) marked as 1 (the data marked as 1 is 5 times as much as the data marked as 0)as training data, the prediction results of the ground state vector by the trained convolutional neural network model.

2

4.2.从第一激发态寻找相变点

-->

4.2.从第一激发态寻找相变点

同样, 使用J₂/J₁$\in $

[0, 1)的海森伯J₁-J₂模型第一激发态态矢量作为训练集, 生成n为2的GMM, 再用该模型对海森伯J₁-J₂模型第一激发态态矢量分类, 得到如图4(a)所示的分类结果, 可以观察到J₂/J₁ = 0.24和J₂/J₁ = 0.5可能是它的相变点. 接下来, 采用稍微远离J₂/J₁ = 0.5数据集作为训练集和验证集, 对该点是否是相变点进一步验证. 采用标记分别为0的J₂/J₁$\in $

[0.35, 0.45)和为1的J₂/J₁$\in $

[0.55, 0.65)的第一激发态态矢量作为训练数据, 采用标记分别为0的J₂/J₁$\in $

[0.3, 0.4)和为1的J₂/J₁$\in $

[0.55, 0.65)的第一激发态态矢量作为训练数据, 和采用标记分别为0的J₂/J₁$\in $

[0.35, 0.45)和为1的J₂/J₁$\in $

[0.55, 0.65)的第一激发态态矢量作为训练数据(标记为0的数据是标记为1数据的5倍), 分别训练CNN模型, 训练得到的3个CNN模型预测结果如图4(b)—(d)所示, 发现训练好的CNN可以从测试数据中精确找到一阶相变点, 且其对测试数据集的预测结果几乎没有发生变化, 由此, 也可以通过第一激发态态矢量数据, 在没有任何先验知识, 不知道系统哈密顿量, 能量的条件下, 确定J₂/J₁ = 0.5为J₁-J₂海森伯自旋链系统相变点.

图 4 (a) 训练数据为J₂/J₁$\in $

[0, 1)的海森伯J₁-J₂模型第一激发态态矢量生成的GMM对第一激发态态矢量的分类结果; (b)分别为采用标记为0的J₂/J₁$\in $

[0.35, 0.45)和为1的J₂/J₁$\in $

[0.55, 0.65); (c)标记为0的J₂/J₁$\in $

[0.3, 0.4)和为1的J₂/J₁$\in $

[0.55, 0.65); (d)标记为0的J₂/J₁$\in $

[0.35, 0.45)和为1的J₂/J₁$\in $

[0.55, 0.65) (标记为1的数据是标记为0的5倍)的第一激发态态矢量作为训练数据, 训练所得的CNN模型对第一激发态态矢量的预测结果
Figure4. (a) The first excited state vector classification results of the GMM generated by the Heisenberg J₁-J₂ model first excited state vector with the training data of J₂/J₁ $\in $

[0, 1); (b) using the first excited state vector of J₂/J₁$\in $

[0.35, 0.45) marked as 0 and J₂/J₁$\in $

[0.55, 0.65) marked as 1; (c) J₂/J₁$\in $

[0.3, 0.4) marked as 0 and J₂/J₁$\in $

[0.55, 0.65) marked as 1; (d) J₂/J₁$\in $

[0.35, 0.45) marked as 0 and J₂/J₁$\in $

[0.55, 0.65) marked as 1 (the data marked as 1 is 5 times as much as the data marked as 0)as training data, the prediction results of the first excited state vector by the trained convolutional neural network model.

同样, 采用稍微远离J₂/J₁ = 0.24数据集作为训练集和验证集, 对该点是否是相变点进一步验证. 采用标记分别为0的J₂/J₁$\in $

[0.1, 0.2)和为1的J₂/J₁$\in $

[0.3, 0.4)的第一激发态态矢量作为训练数据, 训练CNN模型, 再用训练好的CNN模型对海森伯J₁-J₂模型第一激发态态矢量的类别进行预测, 预测结果如图5(a)所示, 我们发现训练好的CNN可以从测试数据中精确找到无穷阶相变点, 接着我们又采用标记分别为0(的J₂/J₁$\in $

[0, 0.1)和为1的J₂/J₁$\in $

[0.3, 0.4)的第一激发态态矢量作为训练数据, 训练CNN模型. 再用训练好的CNN模型对海森伯J₁-J₂模型第一激发态态矢量的类别进行预测, 预测结果如图5(b)所示, 发现训练好的CNN对测试数据集的预测结果几乎没有发生任何变化. 由此基本就能确定J₂/J₁ = 0.24为J₁-J₂海森伯自旋链系统相变点. 这样就在没有任何先验知识, 不知道系统哈密顿量, 能量的条件下从第一激发态态矢量中找到了该系统无穷阶相变点.

图 5 (a)采用标记为0的J₂/J₁$\in $

[0.1, 0.2), 标记为1的J₂/J₁$\in $

[0.3, 0.4); (b)标记为0的J₂/J₁$\in $

[0, 0.1), 标记为1的J₂/J₁$\in $

[0.3, 0.4)的第一激发态态矢量作为训练数据, 训练所得的CNN模型对第一激发态态矢量的预测结果
Figure5. (a) Using the first excited state vector of J₂/J₁$\in $

[0.1, 0.2) marked as 0 and J₂/J₁$\in $

[0.3, 0.4) marked as 1; (b)J₂/J₁$\in $

[0, 0.1) marked as 0 and J₂/J₁$\in $

[0.3, 0.4) marked as 1 as training data, the prediction results of the first excited state vector by the trained convolutional neural network model.

使用J₂/J₁$\in $

[0, 0.24)的海森伯J₁-J₂模型第一激发态态矢量作为训练集(GMM模型给出的不同链长的分类点不尽相同, 但其结果基本一样, 所以仅讨论链长N = 10的态矢量的分类结果), 生成n为2的GMM, 再用该模型对海森伯J₁-J₂模型第一激发态态矢量分类, 得到如图6(a)所示的分类结果, 可以观察到J₂/J₁ = 0.125可能是该模型的相变点. 采用标记分别为0的J₂/J₁$\in $

[0.05, 0.1)和1的J₂/J₁$\in $

[0.15, 0.2)的第一激发态态矢量作为训练数据, 采用标记分别为0的J₂/J₁$\in $

[0, 0.05)和1的J₂/J₁$\in $

[0.15, 0.2)的第一激发态态矢量作为训练数据, 分别训练CNN模型, 训练得到的两个CNN模型对测试集的预测结果如图6(b), 图6(c)所示, 我们观察得到CNN模型的预测结果在J₂/J₁$\in $

[0, 0.24)区域内未出现明显的间断点, 且预测结果随训练数据集的变化发生改变, 因此J₂/J₁ = 0.125不是该模型的相变点. 说明监督学习能够有效排除无监督学习模型提供的假相变点, 有效提高仅通过机器学习找系统相变点的准确率.

图 6 (a) 训练数据为J₂/J₁$\in $

[0, 0.24)的海森伯J₁-J₂模型第一激发态态矢量生成的GMM对第一激发态态矢量的分类结果; (b), (c)分别为采用标记为0的J₂/J₁$\in $

[0.05, 0.1)和为1的J₂/J₁$\in $

[0.15, 0.2); 标记为0的J₂/J₁$\in $

[0, 0.05)和为1的J₂/J₁$\in $

[0.15, 0.2)的第一激发态态矢量作为训练数据, 训练所得的CNN模型对第一激发态态矢量的预测结果; (d) 训练数据为J₂/J₁$\in $

[0.25, 0.5)的海森伯J₁-J₂模型第一激发态态矢量生成的GMM对第一激发态态矢量的分类结果
Figure6. (a) The first excited state vector classification results of the GMM generated by the Heisenberg J₁-J₂ model first excited state vector with the training data of J₂/J₁ $\in $

[0, 0.24); (b) (c) respectively using the first excited state vector of J₂/J₁$\in $

[0.05, 0.1) marked as 0 and J₂/J₁$\in $

[0.15, 0.2) marked as 1; J₂/J₁$\in $

[0, 0.05) marked as 0 and J₂/J₁$\in $

[0.15, 0.2) marked as 1 as training data, the prediction results of the first excited state vector by the trained convolutional neural network model; (d) he first excited state vector classification results of the GMM generated by the Heisenberg J₁-J₂ model first excited state vector with the training data of J₂/J₁$\in $

[0.25, 0.5).

使用J₂/J₁$\in $

[0.25, 0.5)的海森伯J₁-J₂模型第一激发态态矢量作为训练集, 生成n为2的GMM, 再用该模型对海森伯J₁-J₂模型第一激发态态矢量分类, 得到如图6(d)所示的分类结果, 可以观察到J₂/J₁ = 0.385可能是该模型的相变点. 仍采用上述方法, 使用不同训练数据分别训练CNN模型, 用训练所得的CNN模型对测试集进行预测, 同样可观察得到CNN模型的预测结果在J₂/J₁$\in $

[0.25, 0.5)区域内未出现明显的间断点, 且预测结果随训练数据集的变化发生改变, 因此J₂/J₁ = 0.385不是该模型的相变点.
2

4.3.可视化态矢量

-->

4.3.可视化态矢量

采用线性函数归一化方法将态矢量里的值都转换到[0, 255]的范围, 公式为

$ X=\frac{X-{X}_{\rm{min}}}{{X}_{\rm{max}}-{X}_{\rm{min}}} \cdot 255 .$

将得到的每一个数据转换为2^N/2 × 2^N/2(N为链长, 本文N = 10)的灰度图(全黑为0, 全白为255).
J₂/J₁ = 0.44, 0.49, 0.51, 0.58的基态态矢量灰度图如图7所示, 观察发现基态矢量灰度图在相变点前和相变点后都变化缓慢, 但在相变点前后发生了突变. 第一激发态态矢量灰度图如图8所示, 观察得到第一激发态态矢量灰度图在无穷极相变点和一阶相变点前后也都发生了突变. 由此能通过态矢量灰度图直接观测到一维次近邻海森伯J₁-J₂模型的相变点. 机器学习方法也正是因为能提取出态矢量这些特征信息的变化, 才能够有效找到相变点.

图 7 海森伯 J₁-J₂模型基态态矢量变换而来的灰度图　(a) J₂/J₁ = 0.44; (b) J₂/J₁ = 0.49; (c) J₂/J₁ = 0.51; (d) J₂/J₁ = 0.58
Figure7. Gray scale images transformed from the ground state vector of the Heisenberg J₁-J₂ model: (a) J₂/J₁ = 0.44; (b) J₂/J₁ = 0.49; (c) J₂/J₁ = 0.51; (d) J₂/J₁ = 0.58.

图 8 海森伯J₁-J₂模型第一激发态态矢量变换而来的灰度图　(a) J₂/J₁ = 0.24; (b) J₂/J₁ = 0.25; (c) J₂/J₁ = 0.49; (d) J₂/J₁ = 0.51
Figure8. Gray scale images transformed from the first excited state vector of the Heisenberg J₁-J₂ model: (a) J₂/J₁ = 0.24; (b) J₂/J₁ = 0.25; (c) J₂/J₁ = 0.49; (d) J₂/J₁ = 0.51.

5.结　论

本文将无监督学习与监督学习结合起来, 从一维次近邻海森伯J₁-J₂模型的基态中找到了该模型的一阶相变点, 从第一激发态不仅找到了一阶相变点, 还找到了无穷阶相变点, 间接说明了第一激发态可能比基态蕴含更多信息, 将态矢量可视化说明了机器学习算法的可靠性.
研究结果表明, 机器学习能够在没有任何先验知识、不知道系统哈密顿量、能量的条件下, 直接从庞大的态矢量样本集合中找出一些可能存在的相变点, 这可能为研究未知系统时提供一些帮助; 监督学习能够对无监督学习给出的相变点加以验证, 去除假的相变点.
由于本文仅研究了一维海森伯J₁-J₂模型, 此方法的鲁棒性和推广能力还未知, 需要进一步研究.

基于机器学习<i>J</i><sub>1</sub>-<i>J</i><sub>2</sub>反铁磁海森

本站小编 Free考研考试/2021-12-29

English Abstract

Identifying phase transition point of J₁-J₂ antiferromagnetic Heisenberg spin chain by machine learning

School of Physics and Technology, Wuhan University, Wuhan 430000, China

Corresponding author:Jie Quan-Lin, qljie@whu.edu.cn

全文HTML

4.1.从基态寻找相变点

4.2.从第一激发态寻找相变点

4.3.可视化态矢量

相关话题/数据 系统 计算 知识 概率

领限时大额优惠券,享本站正版考研考试资料!

电子束对ZnO和TiO<sub>2</sub>辐照损伤的模拟计算

高阶耦合相振子系统的同步动力学

高阶效应下对称三量子点系统中光孤子稳定性研究

基于测量的量子计算研究进展

硅和锗量子计算材料研究进展

深海原位激光多普勒测速系统

基于辐射制冷-温室效应的热电系统性能分析

基于MXene涂层保护Cs<sub>3</sub>Sb异质结光阴极材料的计算筛选

光声光谱仪用三维扩展光源光场整形系统设计与实验

一种200 kV的多功能脉冲辐射系统研制

基于机器学习<i>J</i><sub>1</sub>-<i>J</i><sub>2</sub>反铁磁海森

本站小编 Free考研考试/2021-12-29

English Abstract

Identifying phase transition point of J1-J2 antiferromagnetic Heisenberg spin chain by machine learning

School of Physics and Technology, Wuhan University, Wuhan 430000, China

Corresponding author:Jie Quan-Lin, qljie@whu.edu.cn

全文HTML

4.1.从基态寻找相变点

4.2.从第一激发态寻找相变点

4.3.可视化态矢量

相关话题/数据 系统 计算 知识 概率

Identifying phase transition point of J₁-J₂ antiferromagnetic Heisenberg spin chain by machine learning

相关话题/数据系统计算知识概率