1(南通大学信息科学技术学院 江苏南通 226019);2(计算机软件新技术国家重点实验室(南京大学) 南京 210023);3(南通智能信息技术联合研究中心 江苏南通 226019);4(通科微电子学院 江苏南通 226019) (lihongjun@ntu.edu.cn)
出版日期:
2020-01-01基金资助:
国家自然科学基金项目(61871241);教育部产学研合作协同育人基金项目(201802302115);中国交通教育研究会教育科学研究课题(交教研1802-118);南通市科技计划资助项目(JC2018025,JC2018129);南京大学计算机软件新技术国家重点实验室基金项目(KFKT2019B015);江苏省研究生科研与实践创新计划项目(KYCX19_2056);南通大学-南通智能信息技术联合研究中心基金项目(KFKT2017B04)Action Recognition of Temporal Segment Network Based on Feature Fusion
Li Hongjun1,2,3,4, Ding Yupeng1, Li Chaobo1, Zhang Shibing1,31(School of Information Science and Technology, Nantong University, Nantong, Jiangsu 226019);2(State Key Laboratory for Novel Software Technology (Nanjing University), Nanjing 210023);3(Nantong Research Institute for Advanced Communication Technologies, Nantong, Jiangsu 226019);4(Tongke School of Microelectronics, Nantong, Jiangsu 226019)
Online:
2020-01-01Supported by:
This work was supported by the National Natural Science Foundation of China (61871241), the Ministry of Education Cooperation in Production and Education (201802302115), the Educational Science Research Subject of China Transportation Education Research Association (Jiaotong Education Research 1802-118), the Science and Technology Program of Nantong (JC2018025, JC2018129), the Nanjing University State Key Laboratory for Novel Software Technology (KFKT2019B015), the Postgraduate Research and Practice Innovation Program of Jiangsu Province (KYCX19_2056), and the Nantong University-Nantong Joint Research Center for Intelligent Information Technology (KFKT2017B04).摘要/Abstract
摘要: 行为识别是当今计算机视觉领域的一个研究热点,是一项具有挑战性的任务.行为识别分析与其网络输入数据类型、网络结构、特征融合环节具有密切联系.目前,主流的行为识别网络输入数据为RGB图像和光流图像,网络结构主要以双流和3D卷积为主;而特征选择直接影响到识别的效率,多层次的特征融合工作还有很多问题有待解决.针对主流的双流卷积网络输入数据为RGB图像和光流图像的局限,利用低秩空间中稀疏特征能够有效捕捉视频中运动物体信息的特点,对网络输入数据进行补充.同时,针对网络中缺乏信息交互的特点,将深度网络中高层语义信息和低层细节信息结合起来共同识别行为动作,使时序分割网络性能更具优势.在行为识别数据集UCF101和HMDB51上取得了97.1%和76.7%的识别效果,较目前主流算法有了较大的提升.实验结果表明,该方法能够有效地提高行为识别的识别率.
参考文献
相关文章 14
[1] | 陈善静, 向朝参, 康青, 吴韬, 刘凯, 冯亮, 邓涛. 基于多源遥感时空谱特征融合的滑坡灾害检测方法[J]. 计算机研究与发展, 2020, 57(9): 1877-1887. |
[2] | 李梦莹, 王晓东, 阮书岚, 张琨, 刘淇. 基于双路注意力机制的学生成绩预测模型[J]. 计算机研究与发展, 2020, 57(8): 1729-1740. |
[3] | 张露,王华彬,陶亮,周健. 基于分类距离分数的自适应多模态生物特征融合[J]. 计算机研究与发展, 2018, 55(1): 151-162. |
[4] | 刘胜蓝,冯林,孙木鑫,刘洋. 分组排序多特征融合的图像检索方法[J]. 计算机研究与发展, 2017, 54(5): 1067-1076. |
[5] | 郝亚洲,郑庆华,陈艳平,闫彩霞. 面向网络舆情数据的异常行为识别[J]. 计算机研究与发展, 2016, 53(3): 611-620. |
[6] | 单言虎,张彰,黄凯奇. 人的视觉行为识别研究回顾、现状及展望[J]. 计算机研究与发展, 2016, 53(1): 93-112. |
[7] | 同鸣,王凡,王硕,姬成龙. 一种3DHOGTCC和3DHOOFG的行为识别新框架[J]. 计算机研究与发展, 2015, 52(12): 2802-2812. |
[8] | 周良毅, 王 智, 王营冠,. 基于动态遮挡阈值的多视角多目标协作追踪[J]. 计算机研究与发展, 2014, 51(4): 813-823. |
[9] | 赵 绚, 彭启民,. 基于正弦级数拟合的行为识别方法[J]. , 2013, 50(2): 379-386. |
[10] | 刘晨光 刘家锋 黄剑华 唐降龙. 基于多特征融合的分块采样粒子滤波算法在人体姿态跟踪中的应用[J]. , 2011, 48(12): 2359-2368. |
[11] | 袁广林, 薛模根, 韩裕生, 周浦城,. 基于自适应多特征融合的mean shift目标跟踪[J]. , 2010, 47(9): 1663-1671. |
[12] | 古红英 潘云鹤. 基于纹理特征融合约减的虹膜识别研究[J]. , 2006, 43(1): 126-131. |
[13] | 茹立云 马少平 路 晶. 基于平均检索精度的图像特征融合方法[J]. , 2005, 42(9): 1640-1646. |
[14] | 孙权森, 曾生根, 杨茂龙, 王平安, 夏德深,. 基于典型相关分析的组合特征抽取及脸像鉴别[J]. , 2005, 42(4): 614-621. |
PDF全文下载地址:
https://crad.ict.ac.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=4085