基于特征融合和集成学习的建议语句分类模型
张璞1(
1. 重庆邮电大学计算机科学与技术学院, 重庆 400065
2. 重庆邮电大学电子商务与现代物流重点试验室, 重庆 400065
收稿日期:
2018-05-31出版日期:
2018-10-01发布日期:
2018-05-31作者简介:
张璞(1977—),男,云南昭通人,副教授,博士,主要研究方向为文本挖掘. E-mail:基金资助:
教育部人文社会科学研究青年基金资助项目(17YJCZH247);重庆市教委人文社会科学研究资助项目(17SKG055);国家自然科学基金资助项目(61472464);重庆邮电大学博士启动基金资助项目(A2016-02)Suggestion sentence classification model based on feature fusion and ensemble learning
Pu ZHANG1(
1. College of Computer Science and Technology, Chongqing University of Posts and Telecommunications, Chongqing 400065, China
2. Key Laboratory of Electronic Commerce and Logistics, Chongqing University of Posts and Telecommunications, Chongqing 400065, China
Received:
2018-05-31Online:
2018-10-01Published:
2018-05-31Supported by:
教育部人文社会科学研究青年基金资助项目(17YJCZH247);重庆市教委人文社会科学研究资助项目(17SKG055);国家自然科学基金资助项目(61472464);重庆邮电大学博士启动基金资助项目(A2016-02)摘要/Abstract
摘要: 建议挖掘作为一项新兴研究任务近年来逐渐受到了研究者的关注。与英文相比,中文的建议表达形式更为丰富,呈现出许多不同特点,因此有必要在中文环境下开展建议挖掘研究。针对建议挖掘中的建议语句检测这一核心任务,提出一种综合应用Stacking和Bagging方法的集成学习模型来进行建议语句分类。使用Stacking组合分类器来构建概率特征空间,分别使用卷积神经网络(convolutional neural network, CNN)和段落向量模型(paragraph vector, PV)构建评论文本的CNN特征空间和段落向量特征空间,对上述特征进行融合,并训练Bagging分类器来对建议语句分类。在中文数据集上的试验结果验证了本研究模型的有效性。
PDF全文下载地址:
http://gxbwk.njournal.sdu.edu.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=1757