1(阿里巴巴集团 北京 100102);2(中国科学院信息工程研究所 北京 100093);3(廊坊职业技术学院 河北廊坊 065001) (yurui.zdj@alibaba-inc.com)
出版日期:
2021-07-01基金资助:
廊坊市科技支撑计划项目(2020011005)Fake Review Detection Based on Joint Topic and Sentiment Pre-Training Model
Zhang Dongjie1, Huang Longtao1, Zhang Rong1, Xue Hui1, Lin Junyu2, Lu Yao31(Alibaba Group, Beijing 100102);2(Institute of Information Engineering, Chinese Academy of Sciences, Beijing 100093);3(Langfang Polytechnic Institute, Langfang, Hebei 065001)
Online:
2021-07-01Supported by:
This work was supported by the Key Technology Research and Development Program of Langfang (2020011005).摘要/Abstract
摘要: 商品评论信息是用户线上决策的重要依据,但在利益的驱使下商家往往会通过雇佣专业的写手撰写大量虚假评论的方式来误导用户,进而达到包装自己或诋毁竞争对手的目的.这种现象会造成不正当的商业竞争和极差的用户体验.针对这一现象,我们通过情感预训练的方法对现有的虚假评论识别模型进行了改进,并提出了一种能够同时整合评论语义和情感信息的联合预训练学习方法.鉴于预训练模型强大的语义表示能力, 在联合学习框架中采用了2种预训练模型编码器分别用于抽取评论的语义和情感上下文特征,并通过联合训练的方法整合2种特征,最后使用Center Loss损失函数对模型进行优化.在多个公开数据集和多个不同任务上进行了验证实验,实验表明提出的联合模型在虚假评论检测与情感极性分析任务上都取得了目前最好的效果且具有更强的泛化能力.
参考文献
相关文章 11
[1] | 曾碧卿, 曾锋, 韩旭丽, 商齐. 基于交互特征表示的评价对象抽取模型[J]. 计算机研究与发展, 2021, 58(1): 224-232. |
[2] | 尉桢楷, 程梦, 周夏冰, 李志峰, 邹博伟, 洪宇, 姚建民. 基于类卷积交互式注意力机制的属性抽取研究[J]. 计算机研究与发展, 2020, 57(11): 2456-2466. |
[3] | 蔡国永,吕光瑞,徐智. 基于层次化深度关联融合网络的社交媒体情感分类[J]. 计算机研究与发展, 2019, 56(6): 1312-1324. |
[4] | 孙小婉,王英,王鑫,孙玉东. 面向双注意力网络的特定方面情感分析模型[J]. 计算机研究与发展, 2019, 56(11): 2384-2395. |
[5] | 陈珂,梁斌,柯文德,许波,曾国超. 基于多通道卷积神经网络的中文微博情感分析[J]. 计算机研究与发展, 2018, 55(5): 945-957. |
[6] | 李然,林政,林海伦,王伟平,孟丹. 文本情绪分析综述[J]. 计算机研究与发展, 2018, 55(1): 30-52. |
[7] | 梁斌,刘全,徐进,周倩,章鹏. 基于多注意力卷积神经网络的特定目标情感分析[J]. 计算机研究与发展, 2017, 54(8): 1724-1735. |
[8] | 陈龙,管子玉,何金红,彭进业. 情感分类研究进展[J]. 计算机研究与发展, 2017, 54(6): 1150-1170. |
[9] | 李雪妮 张绍武 杨 亮 林鸿飞. ARES:用于预测的情感感知自回归模型[J]. , 2013, 50(8): 1722-1727. |
[10] | 冯 时, 付永陈, 阳 锋, 王大玲, 张一飞,. 基于依存句法的博文情感倾向分析研究[J]. , 2012, 49(11): 2395-2406. |
[11] | 林 政, 谭松波, 程学旗,. 基于情感关键句抽取的情感分类研究[J]. , 2012, 49(11): 2376-2382. |
PDF全文下载地址:
https://crad.ict.ac.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=4451