1(吉林大学软件学院 长春 130012);2(吉林大学计算机科学与技术学院 长春 130012);3(符号计算与知识工程教育部重点实验室(吉林大学) 长春 130012);4(长春工程学院计算机技术与工程学院 长春 130012) (sunxw17@mails.jlu.edu.cn)
出版日期:
2019-11-12基金资助:
国家自然科学基金项目(61872161,61602057,61976103);吉林省科技发展计划项目(2018101328JC);吉林省科技厅优秀青年人才基金项目(20170520059JH);吉林省技术攻关项目(20190302029GX);吉林省发改委项目(2019C053-8);吉林省教育厅科研项目(JJKH20191257KJ)Aspect-Based Sentiment Analysis Model Based on Dual-Attention Networks
Sun Xiaowan1,3, Wang Ying1,2,3, Wang Xin3,4, Sun Yudong2,31(College of Software, Jilin University, Changchun 130012);2(College of Computer Science and Technology, Jilin University, Changchun 130012);3(Key Laboratory of Symbol Computation and Knowledge Engineering(Jilin University), Ministry of Education, Changchun 130012);4(College of Computer Technology and Engineering, Changchun Institute of Technology, Changchun 130012)
Online:
2019-11-12摘要/Abstract
摘要: 特定方面情感分析已经成为自然语言处理领域的研究热点,其通过学习文本上下文的信息判别文本中特定方面的情感极性,可以更加有效地帮助人们了解用户对不同方面的情感表达.当前,将注意力机制和神经网络相结合的模型在解决特定方面情感分析任务时大多仅考虑单一层面的注意力信息,并且卷积神经网络无法获取全局结构信息、循环神经网络训练时间过长且单词间的依赖程度随着距离增加而逐渐减弱.针对上述问题,提出一种面向双注意力网络的特定方面情感分析(dual-attention networks for aspect-level sentiment analysis, DANSA)模型.首先,引入多头注意力机制,通过对输入进行多次不同的线性变换操作,获取更全面的注意力信息,同时,多头注意力机制可以实现并行化计算,保证了DANSA的训练速度.其次,DANSA引入自注意力机制,通过计算输入中每个单词与其他所有单词的注意力得分获取全局结构信息,并且单词间的依赖程度不会受到时间和句子长度的影响.最后,融合上下文自注意力信息与特定方面单词注意力信息,共同作为特定方面情感预测的依据,最终实现特定方面情感极性的预测.相比结合注意力机制的神经网络,DANSA弥补了注意力信息单一问题,不仅可以有效获取全局结构信息,还能够实现并行化计算,大大降低了训练时间.在SemEval2014数据集和Twitter数据集上进行实验,DANSA获得了更好的分类效果,进一步证明了DANSA的有效性.
参考文献
相关文章 15
[1] | 吴宗友, 白昆龙, 杨林蕊, 王仪琦, 田英杰. 电子病历文本挖掘研究综述[J]. 计算机研究与发展, 2021, 58(3): 513-527. |
[2] | 曾碧卿, 曾锋, 韩旭丽, 商齐. 基于交互特征表示的评价对象抽取模型[J]. 计算机研究与发展, 2021, 58(1): 224-232. |
[3] | 李冬梅, 张扬, 李东远, 林丹琼. 实体关系抽取方法研究综述[J]. 计算机研究与发展, 2020, 57(7): 1424-1448. |
[4] | 刘金硕, 冯阔, Jeff Z. Pan, 邓娟, 王丽娜. MSRD: 多模态网络谣言检测方法[J]. 计算机研究与发展, 2020, 57(11): 2328-2336. |
[5] | 苏锦钿,欧阳志凡,余珊珊. 基于依存树及距离注意力的句子属性情感分类[J]. 计算机研究与发展, 2019, 56(8): 1731-1745. |
[6] | 石乐义,朱红强,刘祎豪,刘佳. 基于相关信息熵和CNN-BiLSTM的工业控制系统入侵检测[J]. 计算机研究与发展, 2019, 56(11): 2330-2338. |
[7] | 陈珂,梁斌,柯文德,许波,曾国超. 基于多通道卷积神经网络的中文微博情感分析[J]. 计算机研究与发展, 2018, 55(5): 945-957. |
[8] | 侯梦薇,卫荣,陆亮,兰欣,蔡宏伟. 知识图谱研究综述及其在医疗领域的应用[J]. 计算机研究与发展, 2018, 55(12): 2587-2599. |
[9] | 梁斌,刘全,徐进,周倩,章鹏. 基于多注意力卷积神经网络的特定目标情感分析[J]. 计算机研究与发展, 2017, 54(8): 1724-1735. |
[10] | 刘峤,李杨,段宏,刘瑶,秦志光. 知识图谱构建技术综述[J]. 计算机研究与发展, 2016, 53(3): 582-600. |
[11] | 王金水,翁伟,彭鑫. 一种基于句法分析的跟踪关系恢复方法[J]. 计算机研究与发展, 2015, 52(3): 729-737. |
[12] | 许 焱, 金 芝, 李 戈, 魏 强,. 基于多Web信息源的主题概念网络获取[J]. 计算机研究与发展, 2013, 50(9): 1843-1854. |
[13] | 余 凯 贾 磊 陈雨强 徐 伟. 深度学习的昨天、今天和明天[J]. 计算机研究与发展, 2013, 50(9): 1799-1804. |
[14] | 荆 涛, 左万利, 孙吉贵, 车海燕,. 中文网页语义标注:由句子到RDF表示[J]. , 2008, 45(7): 1221-1231. |
[15] | 杜永萍, 黄萱菁, 吴立德,. 利用模式及语言学特征提高阅读理解性能[J]. , 2008, 45(2): 293-299. |
PDF全文下载地址:
https://crad.ict.ac.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=4044