融合空间-时间双网络流和视觉注意的人体行为识别

删除或更新信息，请邮件至freekaoyan#163.com(#换成@)

本站小编 Free考研考试/2022-01-03

刘天亮^1,,,
谯庆伟¹,
万俊伟¹,
戴修斌¹,
罗杰波²
1.南京邮电大学江苏省图像处理与图像通信重点实验室 ??南京 ??210003
2.罗彻斯特大学计算机科学系 ??纽约州 ??罗彻斯特市 ??14627
基金项目:国家自然科学基金(61001152, 31200747, 61071091, 61071166, 61172118)，江苏省自然科学基金(BK2012437)，南京邮电大学校级科研基金(NY214037)，国家留学基金

详细信息

作者简介:刘天亮：1980年生，男，博士，副教授，硕士生导师，研究方向为图像处理、计算机视觉
谯庆伟：1989年生，男，硕士生，研究方向为图像处理与多媒体通信
万俊伟：1993年生，男，硕士生，研究方向为图像处理与多媒体通信
戴修斌：1980年生，男，博士，副教授，硕士生导师，研究方向为医学图像重建、图像处理和模式识别
罗杰波：1968年生，博士，教授，博士生导师，研究方向为图像处理、计算机视觉、机器学习、数据挖掘和社交网络媒体等

通讯作者:刘天亮　 liutl@njupt.edu.cn

中图分类号:TP391.41

计量

文章访问数:1457
HTML全文浏览量:545
PDF下载量:60
被引次数:0

出版历程

收稿日期:2017-11-27
修回日期:2018-07-26
网络出版日期:2018-08-02
刊出日期:2018-10-01

Human Action Recognition via Spatio-temporal Dual Network Flow and Visual Attention Fusion

Tianliang LIU^1,,,
Qingwei QIAO¹,
Junwei WAN¹,
Xiubin DAI¹,
Jiebo LUO²
1. Jiangsu Provincial Key Laboratory of Image Processing and Image Communication, Nanjing University of Posts and Telecommunications, Nanjing 210003, China
2. Department of Computer Science, University of Rochester, Rochester, NY 14627, USA
Funds:The National Natural Science Foundation of China (61001152, 31200747, 61071091, 61071166, 61172118), The Natural Science Foundation of Jiangsu Provice of China (BK2012437), The Natural Science Foundation of NJUPT (NY214037), China Scholarship Council

摘要
摘要:该文受人脑视觉感知机理启发，在深度学习框架下提出融合时空双网络流和视觉注意的行为识别方法。首先，采用由粗到细Lucas-Kanade估计法逐帧提取视频中人体运动的光流特征。然后，利用预训练模型微调的GoogLeNet神经网络分别逐层卷积并聚合给定时间窗口视频中外观图像和相应光流特征。接着，利用长短时记忆多层递归网络交叉感知即得含高层显著结构的时空流语义特征序列；解码时间窗口内互相依赖的隐状态；输出空间流视觉特征描述和视频窗口中每帧标签概率分布。其次，利用相对熵计算时间维每帧注意力置信度，并融合空间网络流感知序列标签概率分布。最后，利用softmax分类视频中行为类别。实验结果表明，与其他现有方法相比，该文行为识别方法在分类准确度上具有显著优势。
关键词:人体行为识别/
光流/
双重时空网络流/
视觉注意力/
卷积神经网络/
长短时记忆神经网络
Abstract:Inspired by the mechanism of human brain visual perception, an action recognition approach integrating dual spatio-temporal network flow and visual attention is proposed in a deep learning framework. First, the optical flow features with body motion are extracted frame-by-frame from video with coarse-to-fine Lucas-Kanade flow estimation. Then, the GoogLeNet neural network with fine-tuned pre-trained model is applied to convoluting layer-by-layer and aggregate respectively appearance images and the related optical flow features in the selected time window. Next, the multi-layered Long Short-Term Memory (LSTM) neural networks are exploited to cross-recursively perceive the spatio-temporal semantic feature sequences with high level and significant structure. Meanwhile, the inter-dependent implicit states are decoded in the given time window, and the attention salient feature sequence is obtained from temporal stream with the visual feature descriptor in spatial stream and the label probability of each frame. Then, the temporal attention confidence for each frame with respect to human actions is calculated with the relative entropy measure and fused with the probability distributions with respect to the action categories from the given spatial perception network stream in the video sequence. Finally, the softmax classifier is exploited to identify the category of human action in the given video sequence. Experimental results show that this presented approach has significant advantages in classification accuracy compared with other methods.
Key words:Human action recognition/
Optical flow/
Spatio-temporal dual network flow/
Visual attention/
Convolution Neural Network (CNN)/
Long Short-Term Memory (LSTM)

PDF全文下载地址:

https://jeit.ac.cn/article/exportPdf?id=ae292eac-0748-4a00-9604-e9e5ce3607f9

相关话题/视觉 网络 图像 通信 博士

领限时大额优惠券,享本站正版考研考试资料!
优惠券领取后72小时内有效，10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材，产品类型包含电子书、题库、全套资料以及视频，无论您是考研复习、考证刷题，还是考前冲刺等，不同类型的产品可满足您学习上的不同需求。 ...
考试优惠券本站小编 Free壹佰分学习网 2022-09-19
基于视觉物体识别的抗差岭估计定位算法
徐昊玮,,廉保旺,邹晓军,岳哲,吴鹏西北工业大学电子信息学院??西安??710072基金项目:国家自然科学基金(61473308,61771393)详细信息作者简介:徐昊玮：男，1990年生，博士生，研究方向为卫星导航、惯性导航、LiDAR导航、组合导航、深度学习廉保旺：男，1962年生，教授，研究 ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
基于自适应波段聚类主成分分析和反向传播神经网络的高光谱图像压缩
陈善学,张燕琪,1.重庆邮电大学通信与信息工程学院??重庆??4000652.重庆邮电大学移动通信技术重庆市重点实验室??重庆??400065基金项目:国家自然科学基金(61271260)，重庆市教委科学技术研究项目(KJ1400416)详细信息作者简介:陈善学：男，1966年生，教授，研究方向为图 ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
软件定义网络中基于密码标识的报文转发验证机制
秦晰,唐国栋,,常朝稳,王瑞云信息工程大学??郑州??450001基金项目:国家自然科学基金(61572517)详细信息作者简介:秦晰：女，1978年生，副教授，硕士生导师，研究方向为SDN安全、可信计算唐国栋：男，1992年生，硕士生，研究方向为SDN安全常朝稳：男，1965年生，教授，博士生导师 ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
一种无线传感器网络中目标跟踪的自适应节点调度算法
胡波,王祺尧,冯辉,,罗灵兵1.复旦大学信息科学与工程学院??上海??2004332.复旦大学智慧网络与系统研究中心??上海??200433基金项目:国家自然科学基金(61501124)，上海市公安局科学技术发展基金(2017012)详细信息作者简介:胡波：男，1968年生，教授，研究方向为数字信号 ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
基于拓扑的命名数据网络缓存优化策略
魏欣1,,,颜拥2,郭少勇1,于卓3,邱雪松11.北京邮电大学网络与交换技术国家重点实验室??北京??1008762.国网浙江省电力公司电力科学研究院??杭州??3100093.北京中电普华信息技术有限公司??北京??100192基金项目:国家自然科学基金(61702048)，国家电网公司科技项目( ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
流特征感知的软件定义网络控制器动态关联机制
张少军,,兰巨龙,江逸茗,孙鹏浩国家数字交换系统工程技术研究中心??郑州??450002基金项目:国家自然科学基金(61521003,61572519,61502530)，国家863计划项目(2015AA016102)详细信息作者简介:张少军：男，1989年生，博士生，研究方向为软件定义网络兰巨龙： ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
非理想信道状态信息的认知无线网络下行功率分配和波束赋形方法
季中恒,,季新生,黄开枝国家数字交换系统工程技术研究中心??郑州??450002基金项目:国家863计划(SS2015AA011306)，国家自然科学基金(61379006,61521003)详细信息作者简介:季中恒：男，1971年生，副研究员，研究方向为无线通信理论及技术应用季新生：男，1968年 ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
基于全局背景与特征降维的视觉跟踪算法
孙彦景,,王赛楠,石韫开,云霄,施文娟中国矿业大学信息与控制工程学院??徐州??221116基金项目:江苏省自然科学基金青年基金(BK20150204)，国家重点研发计划(2016YFC0801403)，国家自然科学基金(51504214,51504255,51734009,61771417)，江苏 ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
一种基于局域中心频率的SAR图像舰船方位向速度估计方法
魏翔飞1,2,3,王小青4,种劲松1,2,,1.中国科学院电子学研究所??北京??1001902.微波成像技术国家重点实验室??北京??1001903.中国科学院大学??北京??1000494.中国科学院微电子研究所??北京??100029详细信息作者简介:魏翔飞：男，1991年生，博士生，研究方向 ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
基于互信息的荧光素眼底血管造影图像序列的自动配准方法
刘小燕1,,,王皓浩1,孙刚1,张谱2,刘敏1,高玲21.湖南大学电气与信息工程学院??长沙??4100822.中南大学湘雅附属第二医院??长沙??410011详细信息作者简介:刘小燕：女，1973年生，教授，博士生导师，研究方向为图像处理技术及其应用、智能建模与控制王皓浩：男，1994年生，硕士生 ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03