基于YOLOv3框架的高分辨电镜图像原子峰位置检测

全文HTML

--> --> -->

1.引　言

球差校正透射电子显微镜能够实现对材料微观结构在亚埃级别分辨率的直接成像, 使得对物质中原子的占位和化学成分等的精确分析成为可能^[1,2]. 例如, 利用球差校正扫描透射电镜环形暗场像(ADF-STEM)模式, 实现了对硅(Si)[112]方向78 pm间距原子对的直接成像^[3]; 利用负球差成像条件得到的钛酸钡(BaTiO₃)高分辨原子像, 通过精确定量对应于每列原子柱的像素强度, 计算得到了氧原子空位分布情况^[4]; 利用ADF-STEM模式, 实现了氮化铝(AlN)量子阱结构的直接原子分辨成像, 通过对高分辨像中氮-铝对衬度分布的形貌分析, 确定了其局部电极化矢量的分布情况^[5]. 此外, 球差校正扫描透射电镜电子能量损失谱(EELS)技术可以在原子尺度对物质的电子结构、化学成份进行分析^[6,7], 例如对镧锶锰氧/钛酸锶(La_0.7Sr_0.3MnO₃/SrTiO₃)界面化学键状态的确定^[8]. 球差校正透射电镜皮米级别的分辨率也使得对氧化物界面的精确分析成为可能^[9,10], 例如利用球差校正高角环形暗场像(HAADF-STEM)和EELS技术对钙钛矿结构氧化物镧铝氧(LaAlO₃)和钛酸锶(SrTiO₃)界面超导结构原子尺度的表征和分析^[11], 高分辨电子显微术正在极大推动氧化物电子材料的发展.
高分辨电镜图像中原子峰位置的精确定量具有十分重要的现实意义. 例如在负球差成像条件下, 通过精确测量锆钛酸铅(PbZr_0.2Ti_0.8O₃)薄膜中每个单胞内锆/钛(Ti/Zr)原子柱与相邻氧原子(O)柱的相对位移, 首次在皮米精度精确表征了锆钛酸铅(PbZr_0.2Ti_0.8O₃)薄膜中电极化矢量的连续涡旋状翻转分布^[12]. 在钛酸铅/钛酸锶(PbTiO₃/SrTiO₃)外延多层薄膜中, 通过精确确定每个原子柱的位置, 揭示了PbTiO₃/SrTiO₃多层膜中纳米拓扑缺陷的新颖结构, 包括电偶极子波、偶极子向错和其他电偶极子拓扑缺陷^[13]. 而对利用球差校正扫描透射电镜得到的钛酸铅(PbTiO₃)薄膜高角环形暗场像(HAADF-STEM), 通过精确测量每个单胞中钛离子(Ti⁴⁺)相对于相邻4个铅离子(Pb²⁺)几何中心的皮米精度的位移, 观察到了钛酸铅(PbTiO₃)薄膜中的通量全闭合畴结构^[14]. 利用球差校正扫描透射电镜高角环形暗场像模式(HAADF-STEM), 对钪酸铽(TbScO₃)衬底上铁酸铋(BiFeO₃)薄膜进行原子尺度的成像, 通过精确定量计算每个单胞中铁(Fe)离子相对于相邻4个铋(Bi)离子几何中心的位移, 确定了铁酸铋(BiFeO₃)薄膜中109°畴壁在界面处的极化矢量的涡旋状分布情况^[15]. 利用钛酸铅(PbTiO₃)薄膜的(HAADF-STEM)像, 通过精确测量每个单胞中钛/氧(Ti/O)原子峰相对于相邻4个铅(Pb)原子峰几何中心的位移, 确定了钛酸铅(PbTiO₃)薄膜中的应力分布情况^[16]. 在钛酸锶/钛酸铅(SrTiO₃/PbTiO₃)外延多层薄膜中, 通过精确测量每个原子峰的实际位置, 确定了钛酸铅(PbTiO₃)薄膜中每个单胞内钛离子(Ti⁴⁺)的相对位移, 进而确定了薄膜中存在的通量闭合畴结构, 并且利用这些实空间的原子峰坐标信息, 通过逐个单胞计算的方式确定了薄膜面内及法线方向的应力分布状况以及面内的晶格旋转信息^[17]. 在球差校正扫描透射环形明场像(ABF-STEM)成像模式下, 利用二维高斯函数拟合分别确定模拟像和实验像中原子峰的精确坐标位置, 通过测量不同离子原子峰之间的相对位置, 分离了样品倾转和扫描畸变两种因素的影响, 精确量化研究了样品倾转、样品厚度、离焦量、会聚角等因素对原子成像位置的影响^[18]. 使用原子分辨的积分差分相位衬度(iDPC)技术, 在扫描透射成像模式(STEM)下成功实现了对钛酸铅(PbTiO₃)薄膜中氧元素的成像, 利用二维高斯函数逐个拟合原子峰得到精确坐标, 确定了单个铁电涡旋中的极化分布情况^[19]. 利用扫描透射成像模式下的原位实验技术, 通过精确定量原子位置, 确定了外力调控下钛酸铅(PbTiO₃)薄膜中铁电畴拓扑结构的变化情况^[20].
上述的定量研究工作都是基于高分辨电镜图像中单个原子像的像素分布具有二维高斯分布的情况, 通过最小二乘法拟合将二维高斯分布的光斑中心，实现精确定位, 是精确测量原子位置的基础^[21]. 这一工作如果由人工处理将是一个非常耗时耗力的过程, 因此考虑到处理高分辨电镜图像所需要的巨大工作量, 特别是随着实时高分辨电镜图像的逐渐增多, 利用计算机自动处理电镜图像就显得尤为重要.
在已经发表的相关算法中, 可以通过设定两个线性无关的基矢实现对原子峰位置的搜索, 并在实空间实现对晶格形变的直接可视化。这个算法的优点在于计算效率十分高, 不需要人为干预, 可以处理大尺寸高分辨图像, 缺点在于其对噪声十分敏感, 且很难处理多元素复合晶格的情形, 需要提前对图像进行滤波和降噪处理, 鲁棒性有待提升^[22]. 另一种是自动构建布拉维格子的算法, 可获得和前一算法类似的效果, 这种算法同样具有计算效率很高的特点, 而且初始参数设定的灵活性很大, 但是该算法只适用于单元素周期性晶格, 对于存在多元素复合晶格、晶体缺陷、大幅形变以及图像局部衬度过低等情况的图像很难适用^[23]. 通过设定单胞的周期性数值分布形式, 迭代计算每个原子峰质心位置直至收敛的方法来实现对原子峰位置的提取, 其计算效率很高, 但是这种计算方法和上述两种算法一样, 提前预设了周期性的结构, 依然难以适用于晶体缺陷以及多元素复合晶格的情况, 且极易受到图像噪声的影响, 鲁棒性不强^[24].
上述几种代表性的寻峰算法均可以达到亚像素级别的精度, 计算效率也很高, 但是受限于周期性的算法设定, 往往需要针对特定图像做出人为干预以及参数调节措施, 在处理界面、位错、材料局部厚度变化引起的图像衬度差异过大等情形时会出现困难. 另一方面, 近年来以深度学习为代表的机器学习技术在计算机视觉领域取得了令人瞩目的进展^[25]. 这一方法在图像像素层面对目标的特征展开学习, 能够从低阶像素特征上升到高阶抽象特征, 不依赖于预设模型或者具体算法限制, 具有强大的自适应性以及对噪声、形变等的鲁棒性^[26].
高分辨电镜图像中原子峰位置的精确测量可以等效为单原子目标检测问题, 如果能够使用深度学习技术对图像中的原子峰进行识别和检测, 然后对检测到的目标进行二维高斯拟合, 就能实现原子峰位置的精确测量. 目前, YOLOv3网络是性能领先的实时端到端目标检测框架, 其架构特点为全卷积连接和多尺度检测, 具有精度高、速度快等优势, 尤其在小目标检测任务中表现十分优异^[27]. 而电镜图像的分析是计算密集型的, 且当下电镜图像的产出数量十分巨大, 为了兼顾准确性和高效率, 需要选定实时性和准确性都较好的网络, YOLOv3网络在相同的检测精度下, 检测速度明显优于其他几种主流的目标检测网络^[27]. 根据这一思路, 本文利用YOLOv3框架训练了一套能够识别和检测原子图像的网络, 并且对训练效果进行了测试. 应用这一网络结合二维高斯拟合能够完整地处理电镜图像中原子峰位置的定量化问题, 为动态大规模电镜图像的处理提供了一个新方法, 突破了自动化、快速处理大量高分辨电镜图像的瓶颈.

5.检测结果的精确定量

将YOLOv3检测到的原子目标框的中心坐标以及宽和高输出出来, 使用二维高斯函数对目标框内的像素数据进行最小二乘法拟合, 就可以得到所有强原子峰的精确坐标位置. 更进一步, 利用这些拟合得到的强原子峰逐个构建单胞, 以标定较弱的B位原子峰. 这一过程本质上是对已有的数据进行重新整理的过程, 可以由不同的算法完成, 目前采用的算法具体过程如下, 对任意一个强原子峰p₀, 设它为单胞的左上顶点, 在所有其他强原子峰中搜索离它最近且两者连线近似平行于水平方向的右侧最近邻原子p₁, 搜索离它最近且两者连线近似平行于竖直方向的下侧最近邻原子p₂, 搜索离p₂最近且两者连线近似平行于水平方向的右侧最近邻原子p₃, 则p₀, p₁, p₂, p₃构成了一个单胞, 紧接着在单胞的几何中心区域使用二维高斯函数进行最小二乘法拟合, 得到B位原子峰的精确坐标位置, 如果需要可以在单胞内的区域进行搜索以确定较弱的B位原子的位置. 对YOLOv3网络检测到的所有强原子峰遍历上述过程, 即可得到所有原子的精确坐标位置.
上述简单的计算过程中, 设定当拟合成功时返回高斯峰的精确坐标位置, 并标记为红色, 拟合失败时返回取样框的几何中心位置并标记为绿色. 此外, 将每个单胞中的p₀和p₁连线, p₀和p₂连线, 即将每个单胞的上侧和左侧框线可视化出来, 以这两条框线代表一个完整单胞, 并随机赋予每个单胞不同的颜色, 通过这种方式可以显示单胞的构建效果. 使用此方法, 对图5(a)—图5(c)三张图像进行处理, 结果如图5(d)—图5(f)所示. 可以看到, 所有目标检测框中的强原子峰都能很好地拟合出来, 相应的单胞构建效果和B位原子峰检测结果也都很好. 图5(f)中由于晶格缺陷区域的若干强原子峰未被YOLOv3网络检测出来, 同时由于晶格缺陷导致的晶格畸变, 造成单胞构建的失败, 相应的这些区域的B位原子峰也未能被检测出来. 这说明对于复杂图像, 在YOLOv3识别出重要原子峰之后, 对原子峰坐标位置数据进行组织的程序需要在未来进一步开发.

6.结　论

本文对403张高分辨电子显微镜图像进行了高质量标记, 形成了一个训练集, 并使用其中367张图像对YOLOv3网络进行了训练. 分析训练结果发现, 迭代次数为500批次左右即可使网络达到收敛. 使用训练完成的网络对不同类型与尺寸的图像进行测试, 发现当把置信度阈值设为0.1的情况下网络可有效检测出各种尺度的高分辨电镜图像中的原子峰目标.
值得注意的是, 367张图像的训练集属于典型的小规模样本集, 而YOLOv3网络在如此小规模量级的训练集上表现优异, 其在训练批次为500左右时就已经达到收敛, 并且给出十分优异的检测效果. 这一现象的原因在于原子峰目标图像较为简单, 主要表现为一个近似为圆形图像的目标, 神经网络能够比较快速和准确地学习并检测到这些结构特征. 通过这一工作, 发现完全可以使用YOLOv3网络对高分辨电镜图像中的原子峰进行识别或检测, 而这一网络的训练甚至可以通过小规模样本完成. 将这一技术与对原子峰的拟合^[23]的程序进行结合可以全面地实现对高分辨电镜图像的定量化.
在规则的周期性点阵图像检测任务中, 将YOLOv3网络同数据处理方法相结合, 能够实现和文献[23]中的工作相似的精度和速度, 两者差距不大, 如图5(d)和图5(e)所示. YOLOv3的优势在于对缺陷非周期性图像的检测能力上, 得益于神经网络基于像素特征进行检测的原理, 其不依赖于原子点阵的周期性限定. 在对如图5(f)所示缺陷图像的检测任务中, YOLOv3网络要显著优于文献[23]等基于周期性假定算法的检测能力, 即使YOLOv3网络不能检测出缺陷区域比较弥散的原子峰, 也不影响它对周围原子峰的检测. 事实上, 基于原子点阵规则周期性排列的算法在有大范围缺陷的图像中很难有效工作, 这些缺陷区域可能会造成算法搜索过程失败, 导致算法中断, 往往需要人为干预才能继续进行后续原子点阵的搜索^[22].
值得注意的是, 测试发现对图像的检测时间大约在7 s左右, 显示出利用深度神经网络进行图像处理的速度优势. 检测的速度优势使YOLOv3框架有望应用于后续大规模、动态高分辨电镜图像处理领域, 例如实现对原位图像数据的实时处理. 本文的工作充分展示了机器学习方法在高分辨电镜图像处理领域的广阔应用前景.

本站小编 Free考研考试/2021-12-29

English Abstract

Detection of intensity peaks in high-resolution transmission electron microscopy image based on YOLOv3

Corresponding author:Wang Da-Wei, dawei.wang@xjtu.edu.cn

全文HTML

相关话题/图像 网络 结构 计算 过程

领限时大额优惠券,享本站正版考研考试资料!

垂直各向异性Ho<sub>3</sub>Fe<sub>5</sub>O<sub>12</sub>薄膜的外延生长与其异质结构的自旋

基于通信序列熵的复杂网络传输容量

基于格兰杰因果网络的中美贸易战对上证行业冲击的研究

原子尺度材料三维结构、磁性及动态演变的透射电子显微学表征

DNA折纸结构介导的多尺度纳米结构精准制造

有机分子吸附和衬底调控锗烯的电子结构

识别Z玻色子喷注的卷积神经网络方法

基于氧化镁晶体中级联四波混频过程的紫外飞秒光脉冲产生

短脉冲强激光驱动磁重联过程的靶后电势分布特征

周期调制结构平面薄膜电爆炸实验研究