基于异质集成学习的虚假评论检测
张大鹏1(),刘雅军2,*(),张伟1,沈芬1,杨建盛21. 燕山大学信息科学与工程学院,河北 秦皇岛 066004
2. 河北建筑工程学院信息工程学院,河北 张家口 075000
收稿日期:
2019-07-24出版日期:
2020-04-20发布日期:
2020-04-16通讯作者:
刘雅军E-mail:daniao@ysu.edu.cn;liuyajun@stumail.ysu.edu.cn作者简介:
张大鹏(1979—),男,河北秦皇岛人,副教授,硕士生导师,主要研究方向为机器学习和推荐系统. E-mail:基金资助:
张家口市科学技术研究与发展指令计划项目(1711007B);张家口市科学技术研究与发展指令计划项目(1711045H);张家口市科学技术研究与发展指令计划项目(1811009B-04)Fake comment detection based on heterogeneous ensemble learning
Dapeng ZHANG1(),Yajun LIU2,*(),Wei ZHANG1,Fen SHEN1,Jiansheng YANG21. School of Information Science and Engineering, Yanshan University, Qinhuangdao 066004, Hebei, China
2. College of Information Engineering, Hebei Institute of Architecture and Civil Engineering, Zhangjiakou 075000, Hebei, China
Received:
2019-07-24Online:
2020-04-20Published:
2020-04-16Contact:
Yajun LIU E-mail:daniao@ysu.edu.cn;liuyajun@stumail.ysu.edu.cnSupported by:
张家口市科学技术研究与发展指令计划项目(1711007B);张家口市科学技术研究与发展指令计划项目(1711045H);张家口市科学技术研究与发展指令计划项目(1811009B-04)摘要/Abstract
摘要: 为了防止卖家的恶性竞争、保证电商平台能够公平交易、保护消费者的权益不受侵犯,针对虚假评论检测领域中数据集小、标注不准确等问题,基于亚马逊最新发布的虚假评论数据集对相关算法进行改进。考虑到Word2vec模型无法识别英语中的词对,提出了Bigram-Word2vec模型;提出“二分类加权硬投票法”以解决异质集成学习中分类器投票数相等的情况;针对异质集成学习中分类器权重设置问题提出“加权软投票法”。试验结果表明,文中对相关算法的改进取得了较为理想的结果。
PDF全文下载地址:
http://gxbwk.njournal.sdu.edu.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=1903