融合双流三维卷积和注意力机制的动态手势识别

删除或更新信息，请邮件至freekaoyan#163.com(#换成@)

本站小编 Free考研考试/2022-01-03

王粉花^{1, 2, 3,,},
张强¹,
黄超¹,
张苒¹
1.北京科技大学自动化学院北京 100083
2.北京科技大学人工智能研究院北京 100083
3.北京市工业波谱成像工程中心北京 100083
基金项目:国家重点研发计划重点专项(2017YFB1400101-01)，北京科技大学中央高校基本科研业务费专项资金(FRF-BD-19-002A)

详细信息

作者简介:王粉花：女，1971年生，博士，副教授，硕士生导师，研究方向为模式识别与智能信息处理
张强：男，1994年生，硕士生，研究方向为图像处理与手势识别
黄超：男，1993年生，硕士生，研究方向为图像处理

通讯作者:王粉花　wangfenhua@ustb.edu.cn

中图分类号:TP183

计量

文章访问数:681
HTML全文浏览量:246
PDF下载量:133
被引次数:0

出版历程

收稿日期:2020-01-16
修回日期:2020-12-06
网络出版日期:2020-12-18
刊出日期:2021-05-18

Dynamic Gesture Recognition Combining Two-stream 3D Convolution with Attention Mechanisms

Fenhua WANG^{1, 2, 3,,},
Qiang ZHANG¹,
Chao HUANG¹,
Ran ZHANG¹
1. School of Automation and Electrical Engineering, University of Science and Technology Beijing, Beijing 100083, China
2. Institute of Artificial Intelligence, University of Science and Technology Beijing, Beijing 100083, China
3. Beijing Engineering Research Center of Industrial Spectrum Imaging, Beijing 100083, China
Funds:The National Key Research and Development Project of China (2017YFB1400101-01), The Fundamental Research Funds for the Central Universities (FRF-BD-19-002A)

摘要
摘要:得益于计算机硬件以及计算能力的进步，自然、简单的动态手势识别在人机交互方面备受关注。针对人机交互中对动态手势识别准确率的要求，该文提出一种融合双流3维卷积神经网络(I3D)和注意力机制(CBAM)的动态手势识别方法CBAM-I3D。并且改进了I3D网络模型的相关参数和结构，为了提高模型的收敛速度和稳定性，使用了批量归一化(BN)技术优化网络，使优化后网络的训练时间缩短。同时与多种双流3D卷积方法在开源中国手语数据集(CSL)上进行了实验对比，实验结果表明，该文所提方法能很好地识别动态手势，识别率达到了90.76%，高于其他动态手势识别方法，验证了所提方法的有效性和可行性。
关键词:动态手势识别/
深度学习/
双流3维卷积神经网络/
注意力机制/
BN层
Abstract:Benefits from the progress of computer hardware and computing power, natural and simple dynamic gesture recognition gets a lot of attention in human-computer interaction. In view of the requirement of the accuracy of dynamic gesture recognition in human-computer interaction, a method of dynamic gesture recognition that combines Two-stream Inflated 3D (I3D) Convolution Neural Network (CNN) with the Convolutional Block Attention Module (CBAM-I3D) is proposed. In addition, relevant parameters and structures of the I3D network model are improved. In order to improve the convergence speed and stability of the model, the Batch Normalization (BN) technology is used to optimize the network, which shortens the training time of the optimized network. At the same time, experimental comparisons with various Two-stream 3D convolution methods on the open source Chinese Sign Language (CSL) recognition dataset are performed. The experimental results show that the proposed method can recognize dynamic gestures well, and the recognition rate reaches 90.76%, which is higher than other dynamic gesture recognition methods. The validity and feasibility of the proposed method are verified.
Key words:Dynamic gesture recognition/
Deep learning/
Two-stream 3D Convolution Neural Network (CNN)/
Attention mechanism/
Batch Normalization (BN) layer

PDF全文下载地址:

https://jeit.ac.cn/article/exportPdf?id=e6c137fe-1cc5-4b87-a078-51c79f925580

相关话题/网络 北京科技大学 北京 实验 优化

领限时大额优惠券,享本站正版考研考试资料!
优惠券领取后72小时内有效，10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材，产品类型包含电子书、题库、全套资料以及视频，无论您是考研复习、考证刷题，还是考前冲刺等，不同类型的产品可满足您学习上的不同需求。 ...
考试优惠券本站小编 Free壹佰分学习网 2022-09-19
基于多尺度圆周频率滤波与卷积神经网络的遥感图像飞机目标检测方法研究
杨钧智1,,,吴金亮2,智军11.北京市遥感信息研究所　北京　1000112.中国电子科技集团公司第五十四研究所　石家庄　050081详细信息作者简介:杨钧智：男，1978年生，副研究员，博士，研究方向为遥感影像处理、遥感影像目标检测与识别吴金亮：男，1984年生，高级工程师，博士，研究方向为遥感影 ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
基于多尺度卷积神经网络的自适应熵加权决策融合船舶图像分类方法
任永梅1,2,杨杰1,,,郭志强1,曹辉11.武汉理工大学信息工程学院宽带无线通信与传感器网络湖北省重点实验室武汉4300702.湖南工学院电气与信息工程学院衡阳421002基金项目:国家自然科学基金(51879211)，国家重点研发计划(2020YFB1710800)，湖南省教育厅科学研究项目(1 ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
孪生网络框架下融合显著性和干扰在线学习的航拍目标跟踪算法
孙锐,方林凤,,梁启丽,张旭东1.合肥工业大学计算机与信息学院合肥2300092.工业安全与应急技术安徽省重点实验室合肥230009基金项目:国家自然科学基金(61471154,61876057)，安徽省重点研发计划-科技强警专项(202004d07020012)详细信息作者简介:孙锐：男，1976 ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
一种优化的频率驾驭算法研究
赵书红1,2,董绍武1,2,3,4,,,白杉杉1,2,高喆1,21.中国科学院国家授时中心西安7106002.中国科学院时间频率基准重点实验室西安7106003.中国科学院大学北京1000494.中国科学院大学天文与空间科学学院北京100049基金项目:国家自然科学基金(11773030)；中国科学 ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
面向类不平衡网络流量的特征选择算法
唐宏1,2,刘丹1,2,,,姚立霜1,2,王云锋1,裴作飞1,21.重庆邮电大学通信与信息工程学院重庆4000652.移动通信技术重庆市重点实验室重庆400065基金项目:****和创新团队发展计划(IRT_16R72)详细信息作者简介:唐宏：男，1967年生，教授，研究方向为计算机网络、移动通信刘 ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
一种基于图注意力网络的异质信息网络表示学习框架
康世泽,,吉立新,张建朋战略支援部队信息工程大学郑州450001基金项目:国家自然科学基金(61521003)详细信息作者简介:康世泽：男，1991年生，博士生，研究方向为知识图谱吉立新：男，1969年生，研究员，博士生导师，研究方向为电信网关信息防护、大数据分析张建朋：男，1988年生，助理研究员 ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
基于球面Haar小波和卷积神经网络的飞行员虹膜识别
贾博1,冯孝鑫2,李军1,俞碧婷3,赵倩1,吴奇2,,1.东航技术应用研发中心有限公司上海2017072.上海交通大学电子信息与电气工程学院上海2002403.伍伦贡大学澳大利亚伍伦贡2500基金项目:国家自然科学基金(U1933125)详细信息作者简介:贾博：男，1987年生，工程师，研究方向为航 ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
语义分割网络重建单视图遥感影像数字表面模型
卢俊言1,2,3,贾宏光1,2,3,,,高放3,李文涛3,陆晴31.中国科学院长春光学精密机械与物理研究所长春1300332.中国科学院大学北京1000493.长光卫星技术有限公司长春130102基金项目:吉林省重大科技攻关项目(20170201006GX)，长春市科技局重大科技攻关项目(SA13R ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
基于超像素级卷积神经网络的多聚焦图像融合算法
聂茜茜,肖斌,,毕秀丽,李伟生重庆邮电大学计算智能重庆市重点实验室重庆400065基金项目:国家重点研发计划(2016YFC1000307-3)，国家自然科学基金(61976031,61806032)详细信息作者简介:聂茜茜：女，1992年生，博士，研究方向为图像处理、深度学习肖斌：男，1982年生 ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
软件定义无线接入网络的组件化研究
徐海东1,2,,,王江2,易辉跃1,21.上海无线通信研究中心上海2018992.中国科学院上海微系统与信息技术研究所上海200050基金项目:上海市自然科学基金(17ZR1428900)，中国科学院创新基金(CXJJ-20S037)详细信息作者简介:徐海东：男，1972年生，高级工程师，研究方向为 ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03