1(中国科学技术大学软件学院 合肥 230051); 2(中国科学技术大学计算机学院大数据分析与应用安徽省重点实验室 合肥 230027) (sa614368@mail.ustc.edu.cn)
出版日期:
2019-02-01基金资助:
国家重点研发计划项目(2016YFB1000904);国家自然科学基金项目(61672483,U1605251);中国科学院青年创新促进会会员专项基金项目(2014299)Deep Semantic Representation of Time-Sync Comments for Videos
Wu Famin1, Lü Guangyi2, Liu Qi2, He Ming2, Chang Biao2, He Weidong2, Zhong Hui2, Zhang Le21(School of Software Engineering, University of Science and Technology of China, Hefei 230051); 2(Anhui Province Key Laboratory of Big Data Analysis and Application,School of Computer Science, University of Science and Technology of China, Hefei 230027)
Online:
2019-02-01摘要/Abstract
摘要: 随着互联网技术的进步,以视频实时评论为代表的众包短文本(又称弹幕)逐渐流行,对在线媒体分享平台和娱乐产业都带来了重要影响.针对此类短文本展开研究,为推荐系统以及人工智能等领域的发展提供了新的机遇,在各行各业都具有巨大价值.然而在弹幕带来机遇的同时,理解和分析这种面向视频的众包短文本也面临诸多挑战:视频实时评论的高噪声、不规范表达和隐含语义等特性,使得传统自然语言处理(natural language processing, NLP)技术具有很大局限性,因此亟需一种容错性强、能刻画短文本深度语义的理解方法.针对以上挑战,在“相近时间段内的视频实时评论具有相似语义”假设的基础上,提出了一种基于循环神经网络(recurrent neural network, RNN)的深度语义表征模型.该模型由于引入了字符级别的循环神经网络,避免了弹幕噪声对文本分词带来的影响.通过使用神经网络,使所得的语义向量能够表达弹幕的隐含语义.在此基础上,进一步设计了基于语义检索的弹幕解释框架,同时作为对语义表征结果的应用验证.最后,设计了多种对比方法,并采用不同指标对所提出的模型进行充分的验证.该模型能够精准地刻画弹幕短文本的语义,也证明了关于弹幕相关假设的合理性.
参考文献
相关文章 15
[1] | 张永, 陈蓉蓉, 张晶. 基于交叉熵的安全Tri-training算法[J]. 计算机研究与发展, 2021, 58(1): 60-69. |
[2] | 程大宁, 张汉平, 夏粉, 李士刚, 袁良, 张云泉. AccSMBO:一种基于超参梯度和元学习的SMBO加速算法[J]. 计算机研究与发展, 2020, 57(12): 2596-2609. |
[3] | 董业, 侯炜, 陈小军, 曾帅. 基于秘密分享和梯度选择的高效安全联邦学习[J]. 计算机研究与发展, 2020, 57(10): 2241-2250. |
[4] | 陈珂锐, 孟小峰. 机器学习的可解释性[J]. 计算机研究与发展, 2020, 57(9): 1971-1986. |
[5] | 丁成诚, 陶蔚, 陶卿. 一种三参数统一化动量方法及其最优收敛速率[J]. 计算机研究与发展, 2020, 57(8): 1571-1580. |
[6] | 王婕婷, 钱宇华, 李飞江, 刘郭庆. 消除随机一致性的支持向量机分类方法[J]. 计算机研究与发展, 2020, 57(8): 1581-1593. |
[7] | 贺一笑, 庞明, 姜远. 蒙德里安深度森林[J]. 计算机研究与发展, 2020, 57(8): 1594-1604. |
[8] | 鞠卓亚, 王志海. 基于选择性模式的贝叶斯分类算法[J]. 计算机研究与发展, 2020, 57(8): 1605-1616. |
[9] | 孟银凤, 梁吉业. 线性正则化函数Logistic模型[J]. 计算机研究与发展, 2020, 57(8): 1617-1626. |
[10] | 孙肖依, 刘华锋, 景丽萍, 于剑. 基于列表级排序的深度生成推荐方法[J]. 计算机研究与发展, 2020, 57(8): 1697-1706. |
[11] | 刘兴波, 聂秀山, 尹义龙. 基于双向线性回归的监督离散跨模态散列方法[J]. 计算机研究与发展, 2020, 57(8): 1707-1714. |
[12] | 杜圣东, 李天瑞, 杨燕, 王浩, 谢鹏, 洪西进. 一种基于序列到序列时空注意力学习的交通流预测模型[J]. 计算机研究与发展, 2020, 57(8): 1715-1728. |
[13] | 赵霞, 张泽华, 张晨威, 李娴. RGNE:粗糙粒化的网络嵌入式重叠社区发现方法[J]. 计算机研究与发展, 2020, 57(6): 1302-1311. |
[14] | 董轶群, 刘建东, 徐文星, 王淑鸿. 一种基于OPRA\-4方向关系推理定性距离变化的方法[J]. 计算机研究与发展, 2020, 57(5): 971-983. |
[15] | 王子晔, 苗夺谦, 赵才荣, 罗晟, 卫志华. 基于多粒度特征的行人跟踪检测结合算法[J]. 计算机研究与发展, 2020, 57(5): 996-1002. |
PDF全文下载地址:
https://crad.ict.ac.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=3864