删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

基于双层堆叠分类模型的水军评论检测

本站小编 Free考研考试/2022-02-06

基于双层堆叠分类模型的水军评论检测

廖祥文1,2,3,*(),徐阳1,2,3,魏晶晶4,杨定达1,2,3,陈国龙1,2,3
1. 福州大学数学与计算机科学学院, 福建 福州 350116
2. 福州大学福建省网络计算与智能信息处理重点实验室, 福建 福州 350116
3. 数字福建金融大数据研究所, 福建 福州 350116
4. 福建江夏学院电子信息科学学院, 福建 福州 350108
收稿日期:2018-10-17出版日期:2019-07-20发布日期:2019-06-27
通讯作者:廖祥文E-mail:liaoxw@fzu.edu.cn
作者简介:廖祥文(1980—),男,博士,副教授,研究方向为信息检索、观点挖掘和情感分析、自然语言处理. E-mail:liaoxw@fzu.edu.cn
基金资助:国家自然科学基金资助项目(61772135);国家自然科学基金资助项目(U1605251);福建省自然科学基金资助项目(2017J01755);中国科学院网络数据科学与技术重点实验室开放基金课题(CASNDST201708);中国科学院网络数据科学与技术重点实验室开放基金课题(CASNDST201606);北邮可信分布式计算与服务教育部重点实验室主任基金资助(2017KF01)

Review spam detection based on the two-level stacking classification model

Xiang-wen LIAO1,2,3,*(),Yang XU1,2,3,Jing-jing WEI4,Ding-da YANG1,2,3,Guo-long CHEN1,2,3
1. College of Mathematics and Computer Science, Fuzhou University, Fuzhou 350116, Fujian, China
2. Fujian Provincial Key Laboratory of Network Computing and Intelligent Information Processing, Fuzhou University, Fuzhou 350116, Fujian, China
3. Digital Fujian Institute of Financial Big Data, Fuzhou 350116, Fujian, China
4. College of Electronics and Information Science, Fujian Jiangxia University, Fuzhou 350108, Fujian, China
Received:2018-10-17Online:2019-07-20Published:2019-06-27
Contact:Xiang-wen LIAO E-mail:liaoxw@fzu.edu.cn

Supported by:国家自然科学基金资助项目(61772135);国家自然科学基金资助项目(U1605251);福建省自然科学基金资助项目(2017J01755);中国科学院网络数据科学与技术重点实验室开放基金课题(CASNDST201708);中国科学院网络数据科学与技术重点实验室开放基金课题(CASNDST201606);北邮可信分布式计算与服务教育部重点实验室主任基金资助(2017KF01)




摘要/Abstract


摘要: 对于水军评论检测问题,已有方法在提取用户行为关系以及通过神经网络提取特征时复杂度过大,同时由于网络评论属于短文本类,其书写的不规范会导致训练过程中文本特征提取困难;另外,已有方法对数据集不平衡分布情况考虑不足。为此,提出了一种基于双层堆叠分类模型的水军评论检测方法。首先通过三元组形式构造矩阵表示用户间关系,并通过主成分分析得到低维用户关系表示,以此刻画用户在评论数据中的行为差异并且降低计算的复杂度;然后,通过评论的段落向量表示以及计算离散型特征(包括文本相似度、信息熵等)解决文本特征难以提取的问题;最后将三者相联结作为融合文本与行为特征的整体特征表示。利用集成学习的方法构造双层堆叠分类模型对评论分类,以提升模型在非平衡数据集下的检测性能。实验采用Yelp2013评论数据集,结果表明,与目前最好的基准方法对比, F1值提高了1.7%~5.2%,在非平衡数据集中提升尤为明显。


PDF全文下载地址:

http://lxbwk.njournal.sdu.edu.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=3114
相关话题/数据 福建 网络 计算 科学

  • 领限时大额优惠券,享本站正版考研考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是考研复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19
  • vTCM:一种基于物理可信计算环境虚拟化的虚拟可信密码模块
    vTCM:一种基于物理可信计算环境虚拟化的虚拟可信密码模块胡俊(),刁子朋北京工业大学信息学部计算机学院,北京100124收稿日期:2018-09-20出版日期:2019-07-20发布日期:2019-06-27作者简介:胡俊(1972—),男,博士,讲师,研究方向为可信计算、云安全和安全操作系统. ...
    本站小编 Free考研考试 2022-02-06
  • 多策略融合的微博数据获取技术研究
    多策略融合的微博数据获取技术研究王培名1(),陈兴蜀1,2,王海舟2,王文贤3,()1.四川大学计算机(软件)学院,四川成都6100652.四川大学网络空间安全学院,四川成都6100653.四川大学网络空间安全研究院,四川成都610065收稿日期:2018-10-17出版日期:2019-05-20发 ...
    本站小编 Free考研考试 2022-02-06
  • 投入产出网络中的关键产业
    投入产出网络中的关键产业巩金秋(),徐进(),胡发胜山东大学数学学院,山东济南250100收稿日期:2018-09-23出版日期:2019-05-20发布日期:2019-05-09通讯作者:徐进E-mail:gongjinqiu@mail.sdu.edu.cn;jinxu@sdu.edu.cn作者简 ...
    本站小编 Free考研考试 2022-02-06
  • 基于基尼系数的网络异质性研究
    基于基尼系数的网络异质性研究吴六三1,2,陈丽11.南京农业大学工学院,江苏南京210031;2.南京大学信息管理学院,江苏南京210023发布日期:2019-04-08作者简介:吴六三(1986—),男,博士,讲师,硕士生导师,研究方向为复杂网络理论、应急管理.E-mail:wuls@njau.e ...
    本站小编 Free考研考试 2022-02-06
  • 社交网络用户敏感属性迭代识别方法
    社交网络用户敏感属性迭代识别方法谢小杰1,2(),梁英1,(),董祥祥1,21.中国科学院计算技术研究所泛在计算系统研究中心,北京1001902.中国科学院大学计算机科学与技术学院,北京100049收稿日期:2018-09-20出版日期:2019-03-20发布日期:2019-03-19通讯作者:梁 ...
    本站小编 Free考研考试 2022-02-06
  • 融合多源异构网络信息的标签推荐方法
    融合多源异构网络信息的标签推荐方法包恒泽(),周栋(),吴谈湖南科技大学计算机科学与工程学院,湖南湘潭411201收稿日期:2018-10-17出版日期:2019-03-01发布日期:2019-03-19通讯作者:周栋E-mail:2275050078@qq.com;dongzhou1979@hot ...
    本站小编 Free考研考试 2022-02-06
  • 大数据结构-逻辑特征与大数据规律
    大数据结构-逻辑特征与大数据规律史开泉山东大学数学学院,山东济南250100发布日期:2019-02-25作者简介:史开泉(1945—),男,教授,博士生导师,研究方向为数据智能系统理论与应用.E-mail:shikq@sdu.edu.cn基金资助:山东省自然科学基金资助项目(zr2013aq019 ...
    本站小编 Free考研考试 2022-02-06
  • 量子计算中旋转算子的相关性质
    量子计算中旋转算子的相关性质韩琦,殷世德*,陈芷禾西北师范大学数学与统计学院,甘肃兰州730070发布日期:2019-02-25作者简介:韩琦(1978—),男,博士,副教授,研究方向为随机分析及应用.E-mail:122155313@qq.com*通信作者简介:殷世德(1989—),男,硕士研究生 ...
    本站小编 Free考研考试 2022-02-06
  • 神经网络结构在功耗分析中的性能对比
    神经网络结构在功耗分析中的性能对比刘飚,路哲,黄雨薇,焦萌,李泉其,薛瑞北京电子科技学院管理系,北京100071发布日期:2019-01-23作者简介:刘飚(1981—),男,博士,研究方向为侧信道攻击与机器学习.E-mail:liubiao521@aliyun.com基金资助:国家重点研发计划资助 ...
    本站小编 Free考研考试 2022-02-06
  • 求解具有约束的l1-范数问题的神经网络模型
    求解具有约束的l1-范数问题的神经网络模型李翠平,高兴宝*陕西师范大学数学与信息科学学院,陕西西安710062出版日期:2018-12-20发布日期:2018-12-18作者简介:李翠平(1982—),女,博士研究生,讲师,研究方向为最优化方法(神经网络模型).E-mail:cuipli@126.c ...
    本站小编 Free考研考试 2022-02-06