基于概率潜在语义分析和Adaboost算法的文本分类技术研究
文献类型:期刊
作者:刘苗[1]
机构:[1]中国人民大学统计学院
[2]辅仁大学应用统计研究所
年:2010
期刊名称:统计与决策
期:19
页码范围:21-23
增刊:增刊
收录情况:中文核心期刊要目总览
所属部门:统计学院
语言:中文
ISSN:1002-6487
链接地址:http://d.g.wanfangdata.com.cn/Periodical_tjyjc201019007.aspx
关键词:文本自动分类;概率潜在语义分析(PLSA);Adaboost;TEM迭代
摘要:文章从文本特征抽取、分类算法效率和精度两个角度出发,首先利用概率潜在语义分析(PLSA)方法,有效地提取出隐舍在文档词频数据中的语义概念信息;然后构建了分类精度较高的Adaboost算法作为分类器.实验结果表明,该方法发挥了两种方法的优势,能够很好地完成对文本的自动分类.
作者其他论文
变量选择方法及其在健康食品市场研究中的应用探究.李扬;朱建锋;谢邦昌.统计与信息论坛.2013,28(10),17-24.
寿险业产业结构与企业经营策略对获利能力的影响.戴稳胜;张阿兰;林桢舜,等.统计研究.2004,19-22.
数据挖掘方法应用于调查数据的抽样权重问题--基于放回比例抽样的再抽样方法.谢佳斌;金勇进;谢邦昌.统计研究.2009,26(4),101-104.
算法建模发展解析.马景义;吴喜之;谢邦昌.统计研究.2009,26(2),58-61.
善用统计明白生活.戴稳胜;付荣;谢邦昌.中国统计.2008,43-44.