删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

视听相关的多模态概念检测

本站小编 Free考研考试/2022-01-01

奠雨洁,金琴
(中国人民大学信息学院 北京 100872) (dianyujie-blair@ruc.edu.cn)
出版日期: 2019-05-01


基金资助:国家自然科学基金项目(61772535);国家重点研发计划基金项目(2016YFB1001202)

Audio-Visual Correlated Multimodal Concept Detection

Dian Yujie, Jin Qin
(School of Information, Renmin University of China, Beijing 100872)
Online: 2019-05-01







摘要/Abstract


摘要: 随着在线视频应用的流行,互联网上的视频数量快速增长.面对互联网上海量的视频,人们对视频检索的要求也越来越精细化.如何按照合适的语义概念对视频进行组织和管理,从而帮助用户更高效、更准确地获取所需视频,成为亟待解决的问题.在大量的应用场景下,需要声音和视觉同时出现才能确定某个视频事件.因此,提出具有视听信息的多模态概念的检测工作.首先,以名词-动词二元组的形式定义多模态概念,其中名词表达了视觉信息,动词表达了听觉信息,且名词和动词具有语义相关性,共同表达语义概念所描述的事件.其次,利用卷积神经网络,以多模态概念的视听相关性为目标训练多模态联合网络,进行端到端的多模态概念检测.实验表明:在多模态概念检测任务上,通过视听相关的联合网络的性能超过了单独的视觉网络和听觉网络.同时,联合网络能够学习到精细化的特征表示,利用该网络提取的视觉特征,在Huawei视频数据集某些特定的类别上超过ImageNet预训练的神经网络特征;联合网络提取的音频特征,在ESC50数据集上,也超过在Youtube8m上训练的神经网络音频特征约5.7%.






[1]刘亚楠 吴 飞 庄越挺. 基于多模态子空间相关性传递的视频语义挖掘[J]. , 2009, 46(1): 1-8.





PDF全文下载地址:

https://crad.ict.ac.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=3932
相关话题/网络 视觉 信息 数据 中国人民大学

  • 领限时大额优惠券,享本站正版考研考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是考研复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19
  • 基于历史数据的虚拟机资源分配方法
    王海涛,李战怀,张晓,卜海龙,孔兰昕,赵晓南(西北工业大学计算机学院西安710129)(工信部大数据存储与管理重点实验室(西北工业大学)西安710129)(wanght@mail.nwpu.edu.cn)出版日期:2019-04-01基金资助:国家自然科学基金项目(61520106005,61761 ...
    本站小编 Free考研考试 2022-01-01
  • 纠删码存储系统中基于网络计算的高效故障重建方法
    唐英杰,王芳,谢燕文(武汉光电国家研究中心(华中科技大学)武汉430074)(信息存储系统教育部重点实验室(华中科技大学)武汉430074)(深圳华中科技大学研究院广东深圳518000)(tangyingjie@mail.hust.edu.cn)出版日期:2019-04-01基金资助:国家自然科学基 ...
    本站小编 Free考研考试 2022-01-01
  • 基于带权词格的循环神经网络句子语义表示建模
    张祥文1,2,陆紫耀1,杨静1,林倩1,卢宇1,王鸿吉1,苏劲松1,21(厦门大学福建厦门361000);2(江苏省计算机信息处理技术重点实验室(苏州大学)江苏苏州215006)(xwzhang@stu.xmu.edu.cn)出版日期:2019-04-01基金资助:国家自然科学基金项目(615201 ...
    本站小编 Free考研考试 2022-01-01
  • 基于网络节点聚类的目标IP城市级定位方法
    李明月1,2,罗向阳1,2,柴理想1,2,袁福祥1,2,甘勇31(中国人民解放军战略支援部队信息工程大学郑州450001);2(数学工程与先进计算国家重点实验室(中国人民解放军战略支援部队信息工程大学)郑州450001);3(郑州轻工业大学计算机与通信工程学院郑州450001)(lmypretty@ ...
    本站小编 Free考研考试 2022-01-01
  • 基于双线性映射的支持全操作的公共可验证外包数据库模型
    王强,周福才,玄鹏开,吴淇毓(东北大学软件学院沈阳110169)(wangq3635@126.com)出版日期:2019-03-01基金资助:国家自然科学基金项目(61772127,61472184,61321491);国家自然科学基金青年科学基金项目(61703088);中央高校基本科研业务费专项 ...
    本站小编 Free考研考试 2022-01-01
  • 点差分隐私下图数据的度直方图发布方法
    张宇轩1,魏江宏1,李霁1,刘文芬2,胡学先11(数学工程与先进计算国家重点实验室(中国人民解放军战略支援部队信息工程大学)郑州450001);2(广西密码学与信息安全重点实验室(桂林电子科技大学)广西桂林541004)(bigzhangq@163.com)出版日期:2019-03-01基金资助:国 ...
    本站小编 Free考研考试 2022-01-01
  • 基于智能手机感知数据的心理压力评估方法
    王丰1,2,5,王亚沙1,3,王江涛1,2,熊昊一4,赵俊峰1,2,张大庆1,21(高可信软件技术教育部重点实验室(北京大学)北京100871);2(北京大学信息科学技术学院北京100871);3(北京大学软件工程国家工程研究中心北京100871);4(密苏里科技大学计算机科学系美国密苏里州罗拉65 ...
    本站小编 Free考研考试 2022-01-01
  • 多元数据融合的非干扰身份识别方法
    于佃存1,2,陈益强1,3,彭晓晖1,焦帅1,李啸海1,钟习1,31(中国科学院计算技术研究所北京100190);2(山东大学软件学院济南250101);3(中国科学院大学北京100049)(yudiancun@ict.ac.cn)出版日期:2019-03-01基金资助:国家重点研发计划基金项目(2 ...
    本站小编 Free考研考试 2022-01-01
  • 基于层次信息粒表示的属性图链接预测模型
    罗晟1,2,苗夺谦1,2,张志飞1,3,张远健1,2,胡声丹1,21(同济大学计算机科学与技术系上海201804);2(嵌入式系统与服务计算教育部重点实验室(同济大学)上海201804);3(计算机软件新技术国家重点实验室(南京大学)南京210023)(tjluosheng@gmail.com)出版 ...
    本站小编 Free考研考试 2022-01-01
  • 硬件加速神经网络综述
    陈桂林,马胜,郭阳(国防科技大学计算机学院长沙410073)(cglnudt@163.com)出版日期:2019-02-01基金资助:国家自然科学基金项目(61672526);国防科技大学科研计划项目(ZK17-03-06)SurveyonAcceleratingNeuralNetworkwithH ...
    本站小编 Free考研考试 2022-01-01