删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

基于卷积神经网络的手势动作雷达识别方法*

本站小编 Free考研考试/2021-12-25

手势动作识别技术通过对传感器获取的手势信息进行处理, 实现不同种类手势意图的分类判决, 该识别技术具有广泛的应用领域, 如手语实时翻译[1]、智能家居[2]、游戏操控[3]等。目前, 典型的手势信息感知途径包括可穿戴设备[4-8]、光学传感器[9-10]、深度传感器[11]以及雷达[12-14]等。相比于其他感知方式, 基于雷达传感器的手势识别通常具有非接触、不受光照和烟雾影响等特点, 并且由于雷达波具有一定的穿透遮挡传播能力, 所以可将小型化雷达传感器嵌入应用设备, 从而增强系统外观设计的灵活性以及探测感知的隐蔽性。
近年来, 部分科技公司和研究人员先后开展了雷达手势目标识别探索工作。Google设计并开发了2款工作于60 GHz的专用毫米波雷达芯片, 并通过低维特征向量提取和随机森林分类器实现多种手势动作识别[15]。文献[16]利用光学、深度和雷达传感器数据融合, 通过异源图像配准及三维卷积神经网络(Convolutional Neural Network, CNN)进行典型驾驶手势动作识别。文献[17]利用77 GHz线性调频连续波(Linear Frequency Modulated Continuous Wave, LFMCW)雷达获取手势目标的微多普勒回波, 通过其能量在各速度单元的分布提取高斯累加模型参数作为特征向量, 进而结合隐马尔可夫模型实现手势动作识别。
目前, 典型的手势动作识别雷达系统主要工作于60 GHz或以上频段, 其具有较高的开发难度和成本要求; 此外, 三维卷积处理、异源图像匹配的引入也将提升算法复杂度。因此, 本文研究了一种适用于通用型24 GHz工业雷达传感器的手势动作识别方法。以24 GHz工业雷达作为传感器, 通过对手势目标的LFMCW雷达回波依次进行去斜、快时间域快速傅里叶变换(Fast Fourier Transform, FFT)和相干积累处理, 获取其在距离-多普勒(Range-Doppler, RD)域的二维分布, 进而利用2层CNN算法实现对手势动作的自动特征提取与识别。利用实测数据分析以及与传统基于运动轨迹的动态时间规划(Dynamic Time Warping, DTW)法的结果进行比较, 验证了本文方法在雷达手势动作识别应用中的有效性。
1 LFMCW雷达信号的脉冲多普勒处理方法 LFMCW雷达具有结构简单、分辨率高、抗杂波能力强等特点, 并且通过去斜以及快时间和慢时间域上的FFT分析, 可获得目标距离和多普勒频率信息。设LFMCW雷达发射信号为
(1)

式中: 为脉内快时间; tm为脉间慢时间; t为快时间, 且t= +tm; A为发射信号幅度; fc为信号载波频率; Δf为扫频带宽; T为扫频周期。
则回波信号可表示为
(2)

式中:A′为回波信号幅度; tr为延迟时间, 可表示为tr=2r/c, r为目标径向距离, c为光速。
在此基础上, 以st(, tm)为参考, 经过去斜处理, 忽略幅度影响, 则差频输出信号为
(3)

考虑目标静止, 则可得差频输出信号频率f0与目标径向距离r的关系为
(4)

因此, 利用快时间域FFT处理, 可获得手势目标的实时径向距离信息。该过程如图 1所示, 其中, 横坐标为快时间t, 纵坐标为频率f。观察可知, f0tr、ΔfT之间明显满足:
(5)

图 1 LFMCW雷达测距示意图 Fig. 1 Schematic of range measurement by LFMCW radar
图选项




tr=2r/c代入式(5), 所得结果与式(4)结果相同。在此基础上, 对各距离单元内的基带信号做慢时间域的FFT处理, 进而可得回波信号在RD域的能量分布, 即雷达手势目标的二维RD像结果。
2 基于卷积神经网络的分类器 典型的CNN主要用于识别具有位移、缩放情况的二维图形。CNN避免特征提取, 仅通过数据训练学习特征。此外, 由于同一特征映射面上的神经元权值相同, 所以该网络可以并行学习, 节省资源。本文方法使用了11×11和4×42个卷积层进行特征选择, 2个2×2池化层进行降维, 之后进行全连接与softmax分类处理。与一般神经网络相同, 其主要分为正向传播和反向传播2部分。在正向传播中, 假设CNN第l层输出特征图为xjl, j表示特征图序号。该输出特征图可表示为
(6)

式中:Mj为选择的输入特征图组合; kij为输入第i种特征图与输出第j种特征图之间连接的卷积核; bj为第j种特征图偏置; f()为激活函数; “*”表示卷积运算。本文采用典型的sigmoid函数。
在反向传播过程中, 通过多次迭代使网络预测与实际正确情况更接近。以卷积层为例, 定义平均误差代价函数为
(7)

式中:yk为预测输出标签; tk为正确标签; kind为识别种类数量。迭代目标为使E逐渐减小。
定义节点灵敏度为
(8)

每层中每个输入特征图的节点灵敏度不同, 例如在第l层卷积层中, 有
(9)

式中:up(·)表示上采样; “。”表示每个元素相乘。
为了对核函数和偏置进行迭代更新, 所以需要分别求出平均误差代价函数对核函数和偏置的偏导数:
(10)

(11)

式中:(pjl-1〉)u, vxl-1〉j在与kij做卷积时每一个子模块; (u, v)为该模块的中心位置。
核函数和偏置的梯度下降更新公式为
(12)

(13)

式中:η为学习率。
在全连接层部分, 需要更新的变为权值w和偏置b, 且其输入与输出的关系为
(14)

因此, 节点灵敏度可表示为
(15)

通过多次迭代更新, 可使平均误差代价函数达到最小。
最后进行softmax分类, 其为一个类似逻辑回归的多分类问题, 即标签y可取k个不同的值。假设其训练集为{(x(1), y(1)), (x(2), y(2)), …, (x(m), y(m))}, p(y=j|x)表示给定测试输入数据为x时估测所属类别yj的概率值, 则设softmax的分类函数为
(16)

式中:θ1, θ2, …, θk为模型的参数。
对应softmax回归中, 代价函数为
(17)

式中:
(18)

同样利用梯度下降法获得J(θ)最小值对应的θ, 将θ值代入式(16), 对应概率值最大的一项作为最终分类结果。
3 雷达系统及测量场景 为了验证CNN对手势动作的识别能力, 本文采用基于Infineon BGT24MTR12射频前端的工业雷达传感器[18]进行数据采集, 主要结构如图 2所示。压控振荡器通过锯齿波电压进行调频控制, 且扫频周期T=2.50 ms; LFMCW雷达发射信号载波频率fc≈24.13 GHz, 扫频带宽Δf≈ 455 MHz, 采样频率fs=48 kHz; 相干积累时长为80 ms, 即对同一距离单元内连续32个慢时间域信号采样点进行FFT处理。需要说明的是, 由于本文方法仅需要手势回波的距离和多普勒信息, 因此, 实验数据针对单接收通道的同相(I路)和正交(Q路)2路信号进行采集。
图 2 用于手势动作识别的24 GHz LFMCW雷达实验系统结构 Fig. 2 Block diagram of 24 GHz LFMCW radar experimental system for hand gesture recognition
图选项




图 3给出了手势向前运动时的回波中频信号。观察可知, 一次调频周期内的采样点数为120, 与实验系统设置参数相符; 另一方面, 此时手势与雷达天线距离约为40 cm, 因此根据式(4)及调频周期, T时间内中频信号的周期数约为1。在此基础上, 图 4给出了基于快时间FFT处理的手势目标径向距离。
图 3 手势向前动作时的雷达回波中频信号 Fig. 3 Radar intermediate-frequency echoes of hand pushing
图选项




图 4 基于快时间FFT的手势目标径向距离 Fig. 4 Radial distance of gesture target based on FFT in fast-time domain
图选项




4 实验结果与分析 本文通过24 GHz雷达实验系统采集并生成4种手势动作的RD像, 包括向后运动、向前运动、旋转运动和静止。图 5给出了各手势动作的RD结果样图, 其尺寸大小为32×120。
图 5 4种手势动作的RD测量结果 Fig. 5 RD measurement results of four hand gestures
图选项




为了更好地验证CNN处理方法的识别性能, 本文将与传统基于手势轨迹的DTW[19]法进行对比。首先, 对每个动作的12帧图像分别提取单一位置的多普勒序列; 其次, 将该12列数据按时间信息融合为一个矩阵, 矩阵大小为32×12;最后, 提取每个时间点能量最大位置处置1, 其他位置处置0, 可得到不同动作的频率变化轨迹。分别选择每个动作的运动模板, 如图 6(a)~(d)所示。其中, 纵坐标为具有最大能量的频率情况。
图 6 运动轨迹模板 Fig. 6 Templates of moving tracks
图选项




图 6中, 向后动作的运动轨迹呈现向下弯曲情况, 如图 6(a)所示。这与实际情况中, 手相对雷达的速度变化情况一致。即从速度为0开始, 进行加速运动, 之后减速至0。同理, 向前运动与向后运动仅为运动速度方向相反, 所以运动轨迹呈现多条向上弯曲的情况, 如图 6(b)所示。对于旋转而言, 手相对雷达方向速度基本为0, 但也可能存在小部分时刻存在相对速度, 所以可能出现如图 6(c)所示局部模糊情况。而静止情况下, 手没有任何动作, 所以不会出现速度随时间变化的情况, 呈现结果应为图 6(d)所示的一条直线。在识别过程中, 对每个待识别的测试样本与4个模板分别进行DTW处理, 之后求出处理后模板与待识别样本之间的距离, 该样本与某一模板距离最小则说明其属于对应模板类。本组实验测试样本数为2 000组。
对4组动作的RD像进行本文提出的CNN分类处理, 具体CNN架构如图 7所示。其由2层结构组成, 而每层分别包括卷积层和池化层。其中, 2层卷积核大小分别为11×11和4×4, 之后进行全连接以及softmax分类, 最终输出分类结果。该实验的训练样本数为6 000组, 测试样本为2 000组。训练误差变化情况如图 8所示。可知, 系统已训练到稳定状态, 且训练误差维持在0.02~0.03。
图 7 基于RD像的CNN架构示意图 Fig. 7 Schematic diagram of CNN architecture used in RD image
图选项




图 8 训练错误率曲线 Fig. 8 Error rates in training
图选项




为了比较2种方法的识别准确率, 识别结果如表 1所示。观察可知, 在识别4种典型手势动作时, 除静止外, 本文方法的识别准确率明显高于DTW法, 且全局识别准确率可提高约0.138。
表 1 基于测试数据的手势识别准确率 Table 1 Testing accuracy of hand gesture recognition
方法准确率全局准确率
向后运动 向前运动 旋转运动 静止
DTW 0.816 7 0.913 3 0.240 0 1.000 0 0.740 0
本文 0.932 0 0.920 0 0.816 0 0.844 0 0.878 0


表选项






5 结论 本文研究了一种基于LFMCW雷达RD信息和CNN的手势动作识别方法。实验结果表明:
1) 该方法适用于通用的24 GHz工业雷达系统, 通过多普勒信息的引入可降低对系统带宽的要求。
2) 由于典型手势目标RD像集中在有限的RD单元中, 通过2层卷积处理即可实现有效特征表述, 从而利用全连接与softmax分类器能够对向后运动、向前运动、旋转运动和静止4种手势动作进行识别。
3) 该方法可针对单帧RD像进行识别, 具有较好的实时性, 且与基于手势轨迹分析的DTW法相比, 全局识别准确率可提升约0.138。

参考文献
[1] 张诗潮. 基于Kinect的手语教学系统设计研究[D]. 上海: 华东师范大学, 2014.
ZHANG S C. Design research in Kinect based sign-language teaching system[D]. Shanghai: East China Normal University, 2014(in Chinese).
[2] 孙凯, 严潇然, 谢荣平. 基于手势识别的智能家居人机交互系统设计[J].工业控制计算机, 2014, 27(4): 54–56.
SUN K, YAN X R, XIE R P. Design of man-machine interaction system in smart home[J].Industrial Control Computer, 2014, 27(4): 54–56.(in Chinese)
[3] 万华根, 肖海英, 邹松. 面向新一代大众游戏的手势交互技术[J].计算机辅助设计与图形学学报, 2011, 23(7): 1159–1165.
WAN H G, XIAO H Y, ZOU S. Hand gesture interaction for next-generation public games[J].Journal of Comouter-Aided Design & Computer Graphics, 2011, 23(7): 1159–1165.(in Chinese)
[4] OLIVITO R S, STUMPO P, SURACE L. Glove-Talk:A neural network interface between a data-glove and a speech synthesizer[J].IEEE Transactions on Neural Networks, 1993, 4(1): 2–8.DOI:10.1109/72.182690
[5] STURMAN D J, ZELYZER D. A survey of glove-based input[J].IEEE Computer Graphics & Applications, 1994, 14(1): 30–39.
[6] QUAM D L. Gesture recognition with a DataGlove[C]//Proceedings of Aerospace and Electronics Conference. Piscataway, NJ: IEEE Press, 1990, 2: 755-760.
[7] WANG C, CANNON D J. A virtual end-effector pointing system in point-and-direct robotics for inspection of surface flaws using a neural network based skeleton transform[C]//Proceedings of IEEE International Conference on Robotics and Automation. Piscataway, NJ: IEEE Press, 1993, 3: 784-789.
[8] BAUDEL T, BEAUDOUIN-LAFON M. Charade:Remote control of objects using free-hand gestures[J].Communications of the ACM, 1993, 36(7): 28–35.DOI:10.1145/159544.159562
[9] TRAVER V J, LATORRE-CARMONA P, SALVADOR-BALAGUER E, et al. Three-dimensional integral imaging for gesture recognition under occlusions[J].IEEE Signal Processing Le-tters, 2017, 24(2): 171–175.DOI:10.1109/LSP.2016.2643691
[10] SIMONYAN K, ZISSERMAN A. Two-stream convolutional networks for action recognition in videos[J].Advances in Neural Information Processing Systems, 2014, 1(4): 568–576.
[11] WANG C, LIU Z, ZHAO J. Hand gesture recognition based on canonical formed superpixel earth mover's distance[C]//Proceedings of IEEE International Conference on Multimedia and Expo. Piscataway, NJ: IEEE Press, 2016: 1-6.
[12] FAN T, MA C, GU Z, et al. Wireless hand gesture recognition based on continuous-wave Doppler radar sensors[J].IEEE Transactions on Microwave Theory & Techniques, 2016, 64(11): 4012–4020.
[13] KIM Y, TOOMAJIAN B. Hand gesture recognition using micro-Doppler signatures with convolutional neural network[J].IEEE Access, 2016, 4: 7125–7130.DOI:10.1109/ACCESS.2016.2617282
[14] REN N, QUAN X, CHO S H. Algorithm for gesture recognition using an IR-UWB radar sensor[J].Journal of Computer & Communications, 2016, 4(3): 95–100.
[15] LIEN J, GILLIAN N, KARAGOZLER M E, et al. Soli:Ubiquitous gesture sensing with millimeter wave radar[J].ACM Transactions on Graphics, 2016, 35(4): 1–19.
[16] MOLCHANOV P, GUPTA S, KIM K, et al. Multi-sensor system for driver's hand-gesture recognition[C]//Proceedings of IEEE International Conference and Workshops on Automatic Face and Gesture Recognition. Piscataway, NJ: IEEE Press, 2015: 1-8.
[17] MALYSA G, WANG D, NETSCH L, et al. Hidden Markov model-based gesture recognition with FMCW radar[C]//Proceedings of IEEE Global Conference on Signal and Information Processing. Piscataway, NJ: IEEE Press, 2016: 1017-1021.
[18] Infineon Technologies AG. 24 GHz chipset-family for industrial applications[EB/OL]. [2017-06-08]. http://www.infineon.com/dgdl?folderId=db3a304344baa87a0144d47968a72df7&fileId=db3a304344baa87a0144d47b9a5e2df9.
[19] EYE R M, DOMINGUEZ G, ESCALERA S. Feature weighting in dynamic time warping for gesture recognition in depth data[C]//Proceedings of IEEE International Conference on Computer Vision Workshops. Piscataway, NJ: IEEE Press, 2011: 1182-1188.


相关话题/运动 信号 系统 传感器 实验

  • 领限时大额优惠券,享本站正版考研考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是考研复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19
  • 基于Cartwheel构型的微推力卫星高精度编队系统*
    近年来,通过多颗微小型卫星彼此协同工作,从而实现单个大型复杂卫星才能完成甚至难以完成的任务,已成为微小型卫星最佳的空间应用模式。其协同工作的模式可以最大限度地扩展空间系统功能,提高空间利用效率和系统可靠性,降低系统的研制和维护成本。为进一步降低编队卫星的运行与管理成本,提高编队工作的实时性和灵活性, ...
    本站小编 Free考研考试 2021-12-25
  • GNSS多径信号模型及测高方法*
    随着人类对气候和环境变化重要性的认知,全球性气候的监测受到了越来越广泛的关注。探测手段表现出了多样化、多功能化、便捷化、非接触等发展趋势。全球导航卫星系统反射方法(GNSS-R)是一种新型的被动非合作式遥感手段,通过协同接收、处理导航卫星直射和经地表反射信号进行地表物理参数的反演,具有低成本、低功耗 ...
    本站小编 Free考研考试 2021-12-25
  • 激光测距传感器光束矢向和零点位置标定方法*
    在飞机制造装配中,铆接是最主要的连接方式,而铆接的第一道工序就是制孔,一架大飞机上大约有150~200万个连接孔[1]。中国飞机制造仍以手工制孔为主[2],难以满足高效率、高性能、低成本的要求,因此自动化制孔技术的研究已成为必然趋势。孔的垂直度对铆接质量具有重要的影响,研究表明,当紧固件沿外载荷作用 ...
    本站小编 Free考研考试 2021-12-25
  • 稀疏多小波时变系统辨识及脑电信号时频分析*
    脑电(Electroencephalography,EEG)信号包含丰富的脑活动信息,相比其他无创测量手段,如正电子发射计算机断层显像(PositronEmissionTomography,PET)。功能磁共振成像(functionalMagneticResonanceImaging,fMRI)等, ...
    本站小编 Free考研考试 2021-12-25
  • 基于形态学的自动驾驶仪振动信号基线漂移去噪*
    导弹自动驾驶仪包含陀螺仪、加速度计等敏感元件,其对调整和稳定弹体姿态有着重要的作用。为了更好地检测自动驾驶仪性能,测试中通常要进行环境振动试验。然而振动测试中,由于硬件不稳定,使采集到的信号污染严重[1],再加之由于敏感元件零偏不稳定,造成积分器输出的信号存在基线漂移,这对后续信号特征的提取产生了很 ...
    本站小编 Free考研考试 2021-12-25
  • 基于CPS方法的工业机器人系统*
    目前,生产越来越趋向于小批量和个性化,制造周期越来越短,制造成本越来越低。对柔性生产来说,生产过程根据加工需要调整的需求越来越迫切。信息物理融合系统(Cyber-PhysicalSystem,CPS)深度融合了计算、控制和通信技术[1-2],能够满足生产柔性化和开放化的要求[3]。CPS是计算和物理 ...
    本站小编 Free考研考试 2021-12-25
  • 基于系统PSN曲线的齿轮箱疲劳可靠度评估*
    齿轮传动系统在可靠度意义上可视为串联系统,系统中任意轮齿疲劳失效则系统失效。齿轮传动系统作为设备中造价昂贵的关键部件,其疲劳可靠度评估十分重要。目前,科研人员针对齿轮传动系统可靠度评估问题进行了许多研究,研究方法有通过对产品寿命直接分析,通过状态监测手段评估,以及基于应力-强度干涉模型的评估方法。通 ...
    本站小编 Free考研考试 2021-12-25
  • 导航卫星双频复用信号模拟失真的仿真*
    卫星有效载荷是资源与功率受限的系统。为了提高功率效率,载荷高功率放大器(HighPowerAmplifier,HPA)通常工作在饱和状态,这种情况下非恒包络的导航信号经过HPA放大后会产生较大的非线性失真;因而现代导航信号生成时在HPA放大前需要将同一频带的多个信号分量在数字基带进行恒包络复用调制; ...
    本站小编 Free考研考试 2021-12-25
  • 高速柔性转子系统非线性振动响应特征分析*
    航空发动机中,高速柔性转子为工作转速在弯曲振型临界转速之上的转子系统,该类转子系统往往采用多支点支承的方案,但受制造及装配工艺的限制,往往存在支承不同心问题。与地面设备相比,航空燃气涡轮发动机转子具有工作转速高、工作过程中除传递较大扭矩外还传递轴向力的特点,因此,多支点支承高速柔性转子系统在支承不同 ...
    本站小编 Free考研考试 2021-12-25
  • RP-3航空燃油中CO2扩散系数实验分析*
    来源于绿色惰化的3C惰化系统(lowtemperatureControllableoxygenConsumedCatalyticinertingsystem)中,CO2和N2作为惰性化气体返回油箱气相空间,降低油箱氧气浓度,达到安全惰化的目的[1-3]。而气体从燃油中逸出或向燃油中溶解的传质过程会改 ...
    本站小编 Free考研考试 2021-12-25