全文HTML
--> --> --> -->2.1.忆阻器分类: 数字型与模拟型
忆阻器, 按工作模式, 可分为数字型忆阻器和模拟型忆阻器. 数字型忆阻器的阻态随着电压的扫描呈离散型的变化, 具有能够相互转换的两个电阻态: 高阻态和低阻态. 若以二者分别对应计算机中的“0”和“1”两个状态, 可以将该类型忆阻器应用于非易失性存储[17,18]. 如图1(a)所示为一个典型的Pt/TiO2/Pt结构的阻变式存储器的I-V特性, 器件能够在正向(负向)扫描电压下, 实现高(低)阻态向低(高)阻态的转变[2]. 阻变存储器其结构简单, 可集成度高, 被认为是下一代非易失存储器的重要候选之一.图 1 (a) 基于Pt/TiO2/Pt结构的数字型忆阻变行为, 插图为器件结构示意图[2]; (b) 基于Pd/WOx/W结构的模拟型忆阻器忆阻行为, 插图为器件结构示意图[19]
Figure1. (a) The digital memristive hebavior obtained in Pt/TiO2/Pt memristor. The insert is the corresponding structure diagram of the device.[2] (b) the analog memristive habevior obtained in Pd/WOx/W memristor. The insert is the corresponding structure diagram of the device[19]
模拟型忆阻器的阻态能够随着电压扫描呈连续型变化, 器件阻值可以随施加电压而发生变化, 并能够记住改变后的状态. 如图1(b)为Pd/WOx/W结构的模拟型忆阻器I-V特性[19]. 其独特的电学性质和神经突触的传输特性相似, 即两者传递信息的能力被外界刺激动态调制. 在结构上, 两端型忆阻器和突触相似: 忆阻器的顶电极、中间绝缘层和底电极与生物突触的突触前膜、突触间隙和突触后膜相对应. 具有纳米尺度的忆阻器, 其高的集成度有望达到生物神经系统中突触的密度. 因此, 基于模拟型忆阻器能够模拟人工神经突触, 进而应用在新型神经网络以及人工智能等领域.
2
2.2.数字型忆阻器模型
导电细丝机制是大多数氧化物薄膜忆阻器发生阻变行为的原因. 该模型认为在SET过程中, 氧化物绝缘层内部形成能够连接顶底电极的导电细丝并且这种细丝具有金属特性, 使得器件由高阻态转变为低阻态; 当RESET时低阻态向高阻态转变则归因于这种导电细丝的断裂. 而根据导电细丝的组成成分可以将该模型进一步分类为金属离子迁移模型和氧离子迁移模型.金属离子迁移: 在该模型中, 忆阻器以活性金属(Ag、Cu等)为顶电极, 以惰性金属(Pt、Au等)为底电极. 如图2所示, 中科院微电子所Liu研究组在Ag/ZnO:Mn/Pt忆阻器中原位观测到了金属导电通道[20]. 在Ag一侧施加正电压时, 活性金属被氧化成离子状态, 在电场下迁移至底电极. Ag离子在底电极被注入的电子还原成Ag原子, 并逐步堆积成Ag导电通道贯穿整个ZnO:Mn薄膜, 器件从高阻态转变为低阻态; 当施加反向电压时, 氧化还原反应会导致Ag导电细丝断裂, 器件从低阻态转变为高阻态. 美国密歇根大学Lu实验组总结发现, 导电细丝的形状与金属离子在电介质中的迁移率(μ)和氧化还原速率(Γ)有关[21]: 当高的μ和高的Γ时, 导电细丝从负极开始生长, 形成倒锥形; 当低的μ和低的Γ时, 导电细丝从正极开始生长, 形成正锥形; 当低的μ和高的Γ时, 金属原子先在电介质中成核, 逐渐连接两端电极; 当高的μ和低的Γ时, 导电细丝负极开始生长, 形成树枝状结构.
图 2 (a, b) Ag/ZnO:Mn/Pt结构忆阻器原位透射电镜图; (c, d) 导电通道内部和外部的能谱图[20]
Figure2. (a, b) The in situ TEM images of Ag/ZnO:Mn/Pt memristor. (c, d) EDX spectrum collected inside and outside of conductive channels[20]
氧离子迁移: 在该模型中, 忆阻器均以惰性电极为顶底电极. 如图3所示为Pt/ZnO/Pt 结构忆阻器不同加电时间下的原位透射电镜(TEM)图, 电场在SET过程中, 电场能够诱导氧化物薄膜中氧离子发生迁移, 形成大量的氧空位缺陷态, 大量氧空位堆积贯穿整个薄膜, 使得器件从高阻态转变为低阻态; 施加反向电压时, 氧空位与氧结合, 导电细丝断裂, 器件从低阻态转变为高阻态[22]. 除ZnO材料外, 格勒诺布尔大学David Cooper 在SrTiO3忆阻器中, 利用TEM辅以电子能量损失谱观测到了高阻态和低阻态不同氧分布[23]; 中科院物理研究所Bai研究组, 利用高分辨TEM证实荧石结构的CeO2单晶薄膜忆阻器, 在低阻态时形成了氧空位, 出现了空位超晶格[24]. 国立首尔大学Hwang研究组在TiO2基忆阻器中观测到高低阻态的转变为TiO2与Ti4O7(Magneli相)之间的转变[25]. 除了利用原位TEM技术之外, 研究人员往往采用变温测试离子扩散系数, 高低阻态的导电类型等手段, 间接证明氧离子迁移模型.
图 3 (a-c) Pt/ZnO/Pt 结构忆阻器不同加电时间下的原位透射电镜图; (d-f) 不同扫描时间下的I -V曲线[22]
Figure3. (a-c) The in situ TEM images of Pt/ZnO/Pt memristor under the voltage sweep with differernt time. (d-f) the corresponding I ?V measurements of Pt/ZnO/Pt memristor under the voltage sweep with differernt time[22]
肖特基势垒调制模型: 金属与氧化物之间的肖特基势垒也是忆阻器实现电阻变化的位置. Stanley Williams 研究组提出通过调制Pt/TiO2界面的肖特基势垒高度能够实现高低阻态的转变[26]. 如图所示, Williams 研究组设计了图4左侧的测试实验, 其中Pt和Ti分别与TiO2呈肖特基接触和欧姆接触. 实验发现(图右侧所示)如: 当器件处于低阻态时Pt和TiO2之间的肖特基势垒消失, 而高阻态时势垒重新恢复. 当底电极加正偏压时, 阳离子在电场作用下向Ti电极一侧迁移, Pt与TiO2界面氧空位堆积进而降低肖特基势垒高度, 降低器件电阻; 当反向施加电压时, 阳离子与氧空位复合, 肖特基势垒恢复, 电阻升高.
图 4 左侧(a-b)Pt/TiO2-x/Ti器件结构示意图, 其中Pt/TiO2-x界面为肖特基接触, Ti/TiO2-x界面为欧姆接触; 右侧(a-d)电极与TiO2-x层势垒的变化[26]
Figure4. In the left: (a, b) Structure diagram of Pt/TiO2-x/Ti memristor, in which Pt/TiO2-x presents Schottky contact and Ti/TiO2-x is Ohmic contact. In the right: (a-d) the modulation of barrier between the electrode and TiO2-x layer[26]
2
2.3.模拟型忆阻器机制
自2008年惠普团队基于TiO2材料首次制备了实体的忆阻器件以后, 多个研究小组在不同的氧化物材料中均发现了忆阻行为, 如InGaZnO[27]、WOx[19,28]、SrTiO3[29]等. 忆阻行为出现具有普遍性, 目前具有代表性的忆阻模型主要有以下三种:导电前端移动模型: 该模型是由惠普团队最早所提出的忆阻模型, 如图5(a)所示, 其结构为两端类型: 顶、底电极和中间绝缘层. 绝缘层由一层为未掺杂(undoped)的TiO2薄膜和一层掺杂(doped)的TiO2薄膜组成[2]. 符合化学计量比的TiO2薄膜为低导电性(ROFF), 而掺杂后的TiO2薄膜内部氧空位增多, 薄膜呈现高导电性(RON), 器件相当于高低阻值的电阻串联. 当对器件施加电场的时候, 氧空位在两层之间迁移, 压缩undoped区域的宽度, 从而改变器件的电阻. 其数学表达关系式为:
图 5 惠普实验室提出的忆阻模型 (a) 忆阻器结构示意图; (b, c) 计算机模拟忆阻器在电压作用下的电学响应[2]
Figure5. The memristive model proposed by HP’s lab: (a) Schematic diagram of memristor, (b, c) computer simulated the electrical response of memristor under voltage sweep[2]
惠普团队提出的导电前端移动的模型具有普适性, 在不同的材料体系中均能实现稳定的忆阻行为. 然而在现有的模型中, 电阻的减小和增大均由外电场驱动完成, 而电场诱导电阻减小后对器件内部自发动力学过程描述, 对模拟神经突触的遗忘过程具有重要意义. 东北师范大学Liu研究组利用非晶氧化物同质结界面调控了氧离子漂移和定向扩散过程(如图6(a)), 证实了器件内部氧离子的迁移和扩散过程与器件电阻减小和自发增大之间的关系, 并以此来模拟突触的学习和遗忘过程[27]. 如图6(b)所示, 单一脉冲激励器件时, 随着电压的施加, 电流增大; 而当电压脉冲撤去时, 电流随着时间推移逐渐衰减至零, 这一现象和突触的兴奋性后电流相似. 其物理机制可以描述为: 利用材料中连续分布的氧离子缺陷态漂移过程, 实现电场激励动态响应的“记忆”功能; 利用退激励下界面自建电场和浓度梯度的差异调控氧离子定向扩散过程, 准确模拟神经突触通道内的“遗忘”功能. 为了证实这种浓度差异引起的氧离子扩散现象, Liu研究组引入了氧离子的一维扩散方程:
图 6 (a) 非晶InGaZnO基忆阻器件与神经突触结构对应图; (b) 单一脉冲在忆阻器中诱导产生的兴奋性后电流; (c) 不同温度下突触权重的衰减行为, 实现为单e指数拟合曲线; (d) 基于方程3拟合
Figure6. (a) The structural diagram of the bilayer α-InGaZnO memristor and a schematic illustration of the synapse between neurons. (b) the EPSC induced by a single pulse. (c) memory decay curves recorded after different numbers of stimuli (dots), the data was fitted by single exponential function. (d) plot of
导电细丝数量调控模型: 除了双层结构的忆阻器之外, 单层氧化物材料也能实现忆阻行为. 美国密歇根大学Lu实验组构筑了基于WOx薄膜的忆阻器, 同样实现了器件阻态的连续调节[31]. 研究者认为, 构建双层结构并不是实现忆阻行为的必要条件, 且导电前端模型并不适合于解释其忆阻行为. 相对应的, 该忆阻器的忆阻机理是通过增加或减少WOx薄膜内部氧空位导电细丝的数目来实现对阻态的调控. 如图7(a)所示, 忆阻器结构为Pd/WOx/W, 对其进行正负电压扫描时, 电阻的逐渐降低和增加证实了器件的忆阻特性. 图7(b) 给出了相应的机理解释: 在外加电压作用下, 氧离子的迁移改变了氧空位导电通道数目或者有效横截面积. 由于氧空位导电通道电阻低, 当其数目增加时, 器件电阻降低; 当其数目减少时, 器件电阻增大.
图 7 (a) 基于Pd/WOx/W结构忆阻器的电学特性; (b) 导电细丝数目模型机制图[31]
Figure7. (a) The I-V characteristic of Pd/WOx/W memristor. (b) memtistive mechanism diagram of modulating conductive filaments[31]
肖特基势垒调制模型: 基于单一材料体系构筑的忆阻器件, 除了调节阻变层本身电阻之外, 电极与绝缘层之间势垒的调制也是一种实现忆阻行为的有效方法. 如图8(a)所示, 在金属-绝缘体-金属结构的忆阻器中, 左侧金属与绝缘体为肖特基接触, 右侧为欧姆接触. 当右侧加正电压时, 氧离子向右侧电极迁移, 使得势垒区氧空位增加, 降低肖特基势垒高度, 从而降低器件电阻; 当反向时, 电场驱动氧离子向左侧迁移, 中和势垒区氧空位, 增加肖特基势垒高度, 从而增加器件电阻. 基于该理论模型, 华中科技大学Guo研究团队构筑了Pt/SrTiO3/Nb-SrTiO3结构的势垒调制型忆阻器[29], 如图8(b)所示, 器件的电导值能在正向脉冲下连续增加, 负向脉冲下连续减小, 具有稳定的忆阻行为.
图 8 (a) 界面肖特基势垒调制忆阻模型示意图; (b) 基于Pt/SrTiO3/Nb-SrTiO3结构忆阻器在脉冲模式下的阻变行为[29]
Figure8. (a) Schematic diagram of the memristive model by modulating Schottky barrier. (b) the potentiation and depression of Pt/SrTiO3/Nb-SrTiO3 memristor obtained under positive and negative pulses, respectively[29]
-->
3.1.基本传输特性
神经突触作为神经元之间相互接触部位, 具有独特的非线性传输特性. 神经突触的连接强度决定着信息传递的效率, 能够动态地随刺激信号的训练而改变, 并保持连续变化的状态. 而忆阻器的阻值能够随流经电荷量发生变化并能记住该变化量. 如图9(a, b)所示, 对忆阻器连续地施加正向/负向扫描电压时, 器件电流会随之连续的增加/减少[27]. 在脉冲模式下, 器件的连接强度可以通过连续的施加脉冲而发改变, 如图9(c): 和I-V曲线一致, 连续的正(负)脉冲施加时, 电流增加(减小). 这种非线性传输不仅和生物突触具有相似的特性, 而且为忆阻器模拟生物突触的学习功能提供了重要基础.图 9 忆阻器的非线性传输特性 (a), (b) 器件电流-电压特性曲线; (c) 在连续的增强/抑制脉冲下, 器件电导上升/下降[27]
Figure9. The nonlinear transmission characteristic of memtistor. (a), (b) I-V characteristic of the device measurement under positive and negative voltage sweep, respectively. (c) the continuously increase/decrease of device conductance under positive/negative pulse[27]
2
3.2.突触可塑性
神经突触的重要特性之一是其具有突触可塑性: 突触传递效率发生增强或减弱的变化现象, 按记忆的时间长短可以分类为短时程突触可塑性(short-term plasticity, STP)和长时程突触可塑性(long-term plasticity, LTP)[32-34]. STP对应于突触的连接受刺激后的短暂增强或减弱; 而LTP则对应于突触连接持久的改变. 前者往往对短时记忆有重要作用, 被认为能够帮助大脑过滤掉不必要的信息, 而后者能在短时记忆的基础上经过反复训练形成永久性记忆, 这两者已被公认为是学习记忆活动的细胞水平的生物学基础.3
3.2.1.短时可塑性(STP)
生物突触在接受刺激后, 会在突触前神经元瞬时积累Ca2+, 这些Ca2+能够影响突触活动中神经递质的释放, 进而影响突触权重的变化. 当相同强度的两个刺激连续施加时, 第二个刺激产生的兴奋性后电流(幅值为A2)明显会大于第一个刺激产生的兴奋性后电流(幅值为A1), 这种电流明显增强的现象在生命科学领域被称为双脉冲易化(PPF). PPF是典型的短时可塑性表现形式之一. 如图10(b)插图所示, 两个刺激的时间间隔为Δt, PPF的计算方式为图 10 (a) 在忆阻器中实现的PPF现象: PPF变化量和时间间隔的关系[31]; (b) 浦肯野细胞(Purkinje cell)和颗粒细胞(granule cell)之间神经突触的双脉冲易化行为; 插图为连续两个胞外刺激引起的兴奋性后电流变化[35]
Figure10. (a) PPF behaviors obtained in memristor: the change of PPF as the function of the time interval.[31] (b) the PPF measured in the synapse between Purkinje cell and granule cell. The insert is the EPSC induced by two extracellular stimuli[35]
美国密歇根大学Lu研究组基于WOx忆阻器实现了神经突触的双脉冲易化行为[31]. 当一个脉冲施加在器件上时, 形成一定数量的氧空位导电细丝会增强器件的电导. 撤去电压后, 随着时间推移氧空位由于浓度梯度的动力会向周围扩散, 导电细丝数目减少(即有效面积减小), 进而降低器件的电导. 如果第二个电压刺激紧接着第一个电压刺激施加时, 第一次形成的导电细丝并没有完全消失, 第二次形成的导电细丝会在此基础上形成更多的导电细丝(即更大的有效面积), 进而会得到更高的电导态. 图10(a) 给出了实际测试得到的PPF现象. 可以看到, 当双脉冲时间间隔越小时, PPF变化量越大; 反之, PPF变化量越小. 利用忆阻器不仅成功模拟出了突触的PPF行为, 而且实验结果在时间量级和变化率上均和神经突触相符合.
3
3.2.2.长时可塑性(LTP)
作为长时可塑性的表现形式之一, 放电时间依赖可塑性(STDP)规则是学习和记忆的基本机制: 突触权重能够随着突触前/后刺激在下发生较为持久的改变. 突触前刺激先于突触后刺激施加时, 突触的连接会增强, 即长时程增强. 突触前刺激后于突触后刺激施加时, 突触的连接会减弱, 即长时程减弱[36,37]. 模拟STDP是神经突触仿生的重要环节, 目前多种氧化物基忆阻器被报道能够模拟STDP行为, 如InGaZnO[27]、TiO2[38]、TaOx[39]、HfO2[40]、SrTiO3[29]等. 以InGaZnO为例, 图11(a) 给出了利用忆阻器模拟STDP的结果, 器件的突触权重的变化(ΔW)和脉冲刺激相对时序(Δt)呈现指数的关系: Δt < 0时, 突触权重增大, 增强的效果随着时间差越小而变强; Δt > 0时, 突出权重减小, 减弱的效果随着时间差越小而变强. 这样的变化和图11(b)中老鼠海马体神经元的兴奋性后电流和刺激的相对时序关系一致[41].图 11 (a) 基于忆阻器模拟放电时间依赖可塑性(相对突触权重和相对刺激时间的依赖性)[27]; (b) 老鼠海马体神经元中相对刺激时间的依赖性[41]
Figure11. (a) STDP behaviors obtained by the memristor.[27] (b) STDP behaviors measured in hippocampal neurons of the rats[41]
3
3.2.3.短时记忆向长时记忆转化
脑学习时的短时记忆(short-term memory, STM)[42-44]和长时记忆(long-term memory, LTM)[45,46]与神经突触的STP/LTP相对应. STP对应的短时记忆在时间层面上只能维持几分钟左右, 而LTP对应的长时记忆能够保持几个小时甚至更长时间. 虽然短时记忆在很快的时间以内遗忘了, 但是通过反复的学习和训练短时记忆会向长时记忆转变(如图12(a)所示). 从微观机制上来说, 反复的学习刺激造成了突触的连接程度的变强, 是短时记忆向长时记忆转变的原因.图 12 (a) 短时记忆向长时记忆转变示意图; (b) 艾宾浩斯遗忘曲线
Figure12. (a) Schematic diagram of the transition from short-term memory (STM) to long-term memory (LTM). (b) the Ebbinghaus Forgetting Curve.
美国密歇根大学Lu实验组基于导电通道有效面积(导电通道数目)调制的Pd/WOx/W忆阻器件, 通过增加刺激次数, 实现了STM向LTM的转化[19]. 如图13(a, b), 当对器件施加5个1.3 V, 持续时间1 ms, 间隔200 ms的电压脉冲时, 随着脉冲电压的逐次施加, 器件电导先增加随后自发衰减, 但随着脉冲电压施加多次后, 器件的电导总体提高, 这是由于两个刺激的时间间隔较短, 不足以使器件回到初始状态, 产生永久的电导变化. 除了电导提高之外, 在重复刺激下, 器件电导的维持时间也显著延长. 对器件施加相同的振幅、持续时间和脉冲时间间隔的脉冲序列时, 随着刺激数量N的增加, 电流衰减的越来越慢(如图13(c)所示). 从图13(d)可以看到: 弛豫时间τ随着刺激数量的增加, 明显增加; 并且当τ较短,对施加的刺激较为敏感, 而当τ较长,则对施加的刺激不敏感. 这是由于重复刺激使得氧空位向电极与中间层的交界处迁移, 并且侧向的氧空位扩散达到平衡, 使得导电通道很难被破坏. 图13(e)给出了经过大量刺激之后薄膜内部导电分布状态示意图. 这种通过对忆阻器件施加重复刺激可以使得其内部结构发生变化, 很好的模拟了STM向LTM的转化. 此外, 中山大学Pei研究组、印度Shivaji大学Dongale研究组和山东大学Jiang研究组同样利用NiO[47]、ZnO[48]和InGaZnO-HfO2[49]基忆阻器实现了STM向LTM的转化.
图 13 Lu研究组模拟短时可塑性向长时可塑性的转变 (a, b) 施加的脉冲信号和器件的响应电流; (c) 不同数量刺激后, 记忆的保持量; (d) 弛豫过程的初始电流及拟合时间参数随刺激次数的变化; (e) 长短时转变过程中, 器件内部结构变化示意图[19]
Figure13. STM-to-LTM transition obtained by Lu’s group. (a, b) the response current of the device under pulse stimulus. (c) memory retention data recorded after different numbers of identical stimuli (dots) and fitted curves using the SEF (solid lines). (d) characteristic relaxation time (τ) plotted with respect to the number of stimulations (N). (e) schematic of the structural change to the memristor during the transition[19]
2
3.3.经验式学习
德国心理学家艾宾浩斯(H. Ebbinghaus)在研究人类的记忆认知行为时发现, 不仅仅STM能够随着学习刺激的增加而转化成LTM, 而且第二次学习需要更少的时间/重复次数, 就能达到与第一次学习相同的程度[50], 这种易化过程被称为经验式学习. 之前的研究部分完成了艾宾浩斯记忆曲线中STM向LTM转化的过程, 东北师范大学Liu研究组基于InGaZnO忆阻器进一步模拟了具有STM向LTM转化和经验式学习行为的完整艾宾浩斯曲线[27]. 如图14所示, 对双层a-InGaZnO结构的忆阻器施加70个刺激脉冲时, 突触权重逐渐增强, 撤去激励脉冲后, 会出现突触权重自发遗忘过程. 紧接着, 当突触器件接受第二次刺激的时候, 学习到和第一次的相同的程度只需要相对少的4个刺激脉. 器件行为表明有学习经验的记忆单元要比没有经验的更容易再次获得信息.图 14 突触仿生器件的 “经验式行为”和器件运行动力学模型 (a) 突触权重随脉冲刺激近线性增加; (b) 电导自发弛豫过程; (c) 基于中间态的再次学习过程; 插图为器件运行的氧离子迁移扩散机制[27]
Figure14. The “learning-experience” behaviors, and the dynamic model of device operation. (a) Nearly linear increase of the synaptic weight with consecutive stimuli. (b) the spontaneous decay of the conductivity. (c) re-stimulation process from the mid-state. The inset illustrates an oxygen ion migration/diffusion model of device operation[27]
2
3.4.非联合式/联合式学习
非联合和联合式学习均属于高阶学习行为, 前者不需要在刺激和反应之间形成某种明确的联系[51,52]; 而后者会在刺激和反应之间形成一定的联系[53]. 习惯化属于典型的非联合式学习(如图15(a)所示): 当相同的刺激反复使用后, 突触的行为反应强度会下降. 通过习惯化, 动物和人类学会忽视那些已经丧失了新奇性或无意义的刺激, 而将注意力转向更重要的刺激. 而已经习惯化的动物或人类一旦接受到了新的刺激, 又会引起它们的注意, 这一过程叫去习惯化. Yang等人基于HfOx忆阻器实现了习惯化和去习惯化的模拟[54]. 如图15(b)所示, 器件接受连续的负脉冲时(幅值-1 V, 脉冲间隔 30 ms), 器件电流逐渐减弱. 该突触器件呈现习惯化, 即对不强烈的刺激逐渐熟悉, 不产生相应的响应; 而对习惯化的器件施加新的正向刺激(幅值0.45 V, 脉冲间隔 30 ms), 器件电流明显增加, 新的刺激引起了强烈的反应, 呈现去习惯化.图 15 (a) 生物系统中的习惯化和去习惯化行为; (b) 基于HfOx忆阻器实现的习惯化和去习惯化行为[54]
Figure15. (a) Habituation and dishabituation behaviors in biological systems. (b) schematic of stimulus trains used for the measurement of habituation/dishabituation and the measured device current changes under the application of stimulus trains[54]
著名的巴普洛夫经典条件反射属于典型的联合式学习. 图16(a)巴普洛夫条件反射的原型: 实验中, 给狗喂食物(非条件刺激, UCS), 狗会分泌唾液; 对狗摇铃(中性刺激, NS), 狗不会有反应; 但经过同时对狗进行喂食和摇铃以后, 单独的摇铃(条件刺激, CS)也会让狗分泌唾液. 铃声从原来的中性刺激变成了条件刺激. 巴普洛夫狗实验让原本不产生反射的刺激经过和产生反射的刺激联合后, 最终也能产生一定的条件反射[55-57]. 华中科技大学Guo研究组以Ni/Nb-SrTiO3/Ti忆阻器为基础, 图16(b)给出了模拟巴普洛夫狗实验的简单电路, 包括一个忆阻器、一个定值电阻(10 KΩ)和一个示波器[58]. UCS为一个脉冲序列, 幅值从4 V逐渐增加到5.5 V; CS为一个脉冲序列, 包含一个正向的5.5 V脉冲和一个负向的3.5 V脉冲. 每次施加完刺激后, 紧跟着一个幅值为300 mV的读取脉冲. 单独施加UCS时, 示波器分压为300 mV (> 45 mV), 此时分泌唾液; 当单独施加CS时, 由于忆阻器属于高阻态, 示波器分压远小于45 mV, 此时不分泌唾液; 当共同施加UCS和CS时, 叠加的脉冲逐渐将忆阻器开启; 此时单独施加CS, 忆阻器属于低阻态, 示波器分压将会大于45 mV, 此时分泌唾液. 通过联合学习, 成功地将铃声由原来的不产生反射的中性刺激变成产生反射的条件刺激. 此外, 随着UCS和CS施加的时间间隔越小, 出现条件反射的现象时间越长, 展现出学习频率对联合式学习的影响.
图 16 (a) 巴普洛夫条件反射的原型; (b) 基于忆阻器构建的巴普洛夫条件反射模拟电路; (c) 在不同时序关系的条件和非条件刺激下实验测量结果[58]
Figure16. (a) Prototype of the Pavlovian conditioning. (b) memristive circuit with electrical US and CS to mimic the Pavlovian conditioning. (c) the experimental results under the conditions of different intervals between conditioned and unconditioned stimulus[58]
除了以上的突触功能以外, 基于氧化物忆阻突触还能模拟一些其他的学习行为, 比如脉冲频率依赖突触可塑性(spike-rate-dependent plasticity, SRDP)等. 利用氧化物基忆阻器模拟神经突触, 被多方面证实是一种有效的方式, 有望通过忆阻器实现人工神经网络的构筑, 进而模拟人脑复杂的学习功能. 虽然利用忆阻器目前仅能对神经突触进行简单的仿生, 但随着科学技术的发展, 未来有望通过忆阻神经突触来模拟更加复杂人工神经网络.
-->
4.1.模式识别
目前, 基于忆阻型人工神经网络实现多种神经形态学习的模拟得到了研究人员的广泛关注[59-61]. 其中, 开发具有模式识别(如语音识别、人脸识别、指纹识别等)功能的计算机系统能够帮助人类充实自动运输和邮件分拣等繁琐的任务, 也因此实现模式识别被认为是信息科学和人工智能的一个重要应用领域. 近年来, 基于氧化物忆阻器阵列, 研究人员成功实现了模式识别功能. 米兰理工大学Ielmini实验组基于两个晶体管和一个HfO2数字型忆阻器(2T1R)模拟单个神经突触, 并通过构筑8 × 8 突触阵列实现了图像“X”的识别[62]. 近年来, 通过使用数字型和模拟型共存的忆阻器件, 一种学习精度和速度可调的模式识别的方法被提出[63]. 如图17(a)所示, 在经历形成过程(forming process)之前/后, 器件呈现出模拟型/数字型阻变行为. 由于模拟型忆阻器的STDP突触权重变化的波动性更小, 导致其图像识别精度更高; 而数字型忆阻器的STDP突触权重变化的变化率更大, 导致其图像识别速度更块. 更重要的是, 通过在忆阻神经网络中混合使用数字型和模拟型器件(如图17(b)所示), 获得了精度和速度连续可调的图像识别过程: 通过改变神经网络中模拟型(数字型)器件的比例, 学习精度(速度)可以从75%提高到95%(提高两倍) (如图17(c)所示).图 17 (a) 分别基于数字型和模拟型行为的图像演变过程; (b) 由数字型和模拟型忆阻器构成的混合人工神经网络; (c) 人工神经网络中数字型比例对图像识别准确性的影响[63]
Figure17. (a) Evolution of images during the learning process for the initial, intermediate, and final states based on Digital resistive switching (D-RS) and analog resistive switching (A-RS) behaviors, respectively. (b) hybrid ANN composed of A-RS memristors and D-RS memristors. (c) accuracy as a function of number of epochs for the hybrid ANN at four different A-RS proportions[63]
2
4.2.声音定位
声音定位是指大脑利用环境中的声音刺激能够确认声音方位和距离. 哺乳动物由于两耳间隔较大, 往往是利用感知声音的时间差别(interaural time difference, ITD)进行声音定位[64-66]. 近年来, 科学家利用简单的氧化物忆阻器阵列实现了对声音定位的模拟. 米兰理工大学Daniele Ielmini 研究组构筑了2 × 2 HfO2忆阻器阵列, 包含两个突触前端(相当于两只耳朵中的声音传感器)和两个突触后端(如图18(a, b))[67]. 内部电势(Vint)的不同代表了能够指示声音的定位, 即声音来源的方向角度. 如图18 (c-f)所示, 当一个音频信号触发左右前神经元时, 内部电势的差值(ΔVint = Vint 1 – Vint 2, 其中Vint 1为左耳信号引起的电势变化, Vint 2为右耳信号引起的电势变化)大于零时, 右耳声音先到达, 表明声源在接受者的右侧; 反之, 声源在接受者左侧. 该研究认为忆阻器脉冲时序/频率依赖特性使其能够进行时空模式学习.图 18 基于时空处理的声音定位 (a) 双耳效应示意图; (b) 2 × 2神经网络通过双耳时差进行声音定位; (c) 实验用到的左右耳声音波形; (d) 对应突触前神经元的轴突电位; (e) 不同时差信号引起的突触后神经元电位; (f) 不同声音方位下突触后神经元电位的测量和计算结果[67]
Figure18. Sound localization based on space-time processing. (a) Schematic illustration of binaural effect. (b) schematic structure of a 2 × 2 SNN to detect the sound direction from the ITD. (c) experimental sound waveforms of left and right ears, (d) corresponding axon potential of the two PREs, and (e) vint for the two POSTs with their corresponding difference. (f) measured and calculated Vint as a function of sound azimuth revealing analog information about the sound propagation direction[67]
2
4.3.逻辑运算
忆阻器独特的阻变特性使其在逻辑运算领域有着重要的应用. 通过忆阻器在高低阻态之间的转换, 能够实现逻辑运算[68-71]. 2010年, Stanley Williams研究组基于Pt/TiO2/Pt忆阻器实现了状态逻辑运算[8]. 如图19(a)所示为交叉结构的忆阻器电路, 基于该电路物理实现了蕴含(IMP)逻辑(如图19(b)所示), 并替代传统的晶体管实现了与非门(NAND)逻辑运算(图19(c)), 同时逻辑状态以电阻态的形式非易失地存储在忆阻器中. 进一步, 将IMP逻辑与FALSE 逻辑构成一组完备集, 基于该完备集能够进行任意的布尔函数逻辑运算. 此后, 基于氧化物忆阻器被应用于实现复杂和高阶逻辑功能. 传统的冯诺依曼计算体系中逻辑电路的输入和输出是高低电平. 由于高低电平逻辑状态易失, 即断电无法保存, 需要额外的存储器进行数据信息的记忆. 而基于忆阻器的逻辑电路中输入和输出是高低阻态, 能够在数据存储的位置进行逻辑运算, 实现了计算与存储的融合. 这样的融合能够有效降低信息处理的功耗, 提高信息处理的效率.图 19 (a) 实现逻辑电路的交叉阵列; (b) IMP逻辑运算电路; (c) NAND逻辑运算电路[8]
Figure19. (a) The memristors crossbar for logical circuit. (b) IMP logical circuit. (c) NAND logical circuit[8]
2
4.4.柔性可穿戴
近年来, 柔性电子吸引着研究人员的兴趣, 而开发柔性电子突触器件有助于在未来实现可穿戴计算机、可植入芯片和人工皮肤等应用. 为了使忆阻器件具备延展、可拉伸、和生物兼容等特点, 需要将其制备在一些非传统的衬底上, 如PET (聚对苯二甲酸乙二醇酯)和 PDMS (聚二甲基硅氧烷)等. 然而, 氧化物材料由于需要高温处理, 因而限制了氧化物基忆阻神经突触在柔性可穿戴领域的发展. 为了解决以上问题, 河北大学Yan研究组采用柔软的云母作为衬底, 制备出了具有柔性的TiN/Zr0.5Hf0.5O2/InGaZnO忆阻突触器件[72]. 为构筑柔性可转移的氧化物基忆阻神经突触, 一个具有普适性水溶NaCl方法被提出: 如图20(a)所示, 将Pt/WOx/Ti忆阻器件制备在表面抛光NaCl衬底上, 由于NaCl衬底的高耐热性, 忆阻器件的制备不会损坏衬底[73]. 利用水溶解NaCl衬底之后, 自支撑的忆阻器件可以转移到不同的衬底上. 图20(b)给出了分别转移至打印纸、3D玻璃半球、果胶和PDMS衬底上的器件实物图, 器件展现出柔性、随形可贴附和生物兼容性等应用潜力. 更重要地是, 转移至以上四种衬底的器件, 依然能够模拟神经突触STDP学习功能(如图20(c)所示), 器件在转移过程中并没有被破坏.图 20 (a) 利用水溶方法制备可转移的Pt/WOx/Ti忆阻神经突触器件示意图; (b) 转移至打印纸、3D玻璃半球、果胶和PDMS衬底上的器件实物图; (c) 转移至不同衬底上的忆阻器件STDP学习功能[73]
Figure20. (a) Schematic diagrams of the fabrication process for the transferable Pt/WOx/Ti synaptic devices using water-dissolution method. (b) the pictures of devices that are transferred on flexible printing paper, glass dome hemisphere with 3D surface, pectin and PDMS substrate. (c) the obtained STDP behaviors of the devices on different substrates[73]
2
4.5.光电忆阻神经突触
发展新型的光电耦合忆阻器有望突破基于传统CMOS工艺的图形处理器(GPU)在容量、集成度、速度等方面的技术瓶颈, 实现新一代集探测、存储与处理于一体的图像处理器. 中科院半导体所Shen研究组和香港理工大学Cai研究组, 分别提出了基于Al2O3和MoOx材料的忆阻器, 与光探测器相结合, 实现了模拟人工视觉系统的图像信息探测/存储功能[74,75]. 韩国成均馆大学Kim研究组基于InGaZnO薄膜的忆阻器, 利用光刺激代替电刺激, 实现了光电混合调制的忆阻神经突触[76]. 中科院宁波物理所Li研究组基于ITO/Nb:SrTiO3异质结, 构筑了人工光电神经突触, 模拟了视觉感知系统对外部环境光学信号的自适应检测、处理和记忆[77]. 如图21(a)所示, ITO/Nb:SrTiO3肖特基结电阻能够被光信号调制: 在光照下, 氧空位中捕获的电子被释放, 留下一些带正电荷的空位, 降低/缩窄肖特基势垒高度/宽度, 增加电子的隧穿几率, 进而降低肖特基结电阻. 进一步地, 利用光脉冲代替电脉冲, 成功模拟了神经突触的短时可塑性(双脉冲易化, 如图21(b, c)), 经验式学习及人类视觉短时记忆向长时记忆转变功能, 为光电神经突触模拟视觉神经提供了可能.图 21 (a) 光激励下ITO/Nb:SrTiO3基光电神经突触器件运行机理示意图; (b) 在光脉冲对下异质结的典型光响应特性; (c) 对脉冲易化度随脉冲间隔变化规律[77]
Figure21. (a) Photoresponsive characteristics of the ITO/Nb:SrTiO3 heterojunction artificial optoelectronic synapse under pulsed light stimuli. (b) photoresponsive characteristic of the heterojunction under a light pulse pair. (c) the variation of PPF index with the interval of light pulse pairs[77]
人类视觉系统是一个复杂的神经网络, 因而模拟视觉系统则需要多个忆阻神经突触的联合. 为了实现图像的感知和记忆, Li研究组构建了九个ITO/Nb:SrTiO3异质结人工光电神经突触, 来记忆像素为3 × 3的图像[77]. 如图22所示, 该突触网络能够感知不同光波长和强度的刺激: 图(a)显示了对用波长编码输入图像的感知和记忆过程, 通过测量经过光信号刺激后的突触后电流, 该突触网络很好的识别出了输入图像, 且识别的图像能够长时间被记忆; 图(b)则证实了利用强度编码输入图像的感知和记忆过程, 而图像的识别和刺激的频率有关, 频率越小, 学习和记忆的效果越弱(图(c)). 此外该研究组发现, 外加电场能调控异质结的光响应效率, 正、负电压分别引起增强和抑制效果. 基于此, 将光和电分别作为激励和调制信号, 实现了兴趣等因素调制的人类视觉记忆功能模拟.
图 22 基于ITO/Nb:SrTiO3异质结人工光电神经突触模拟视觉神经系统 (a) 用波长编码输入图像的感知和记忆过程. (b) 用强度编码输入图像的感知和记忆过程. (c) 低频率刺激下的图像感知和记忆过程[77]
Figure22. Mimicry of human visual memory using the ITO/Nb:SrTiO3 heterojunction artificial optoelectronic synapse. (a) The detection and memory process of image encoded by light wavelength. (b) the detection and memory process of image encoded by light intensity. (c) the detection and memory process of image with low stimulating frequency.