删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

文本聚类中罚多项混合模型的特征选择及其在互联网舆情分析中的应用

中国人民大学 辅仁网/2017-07-03

文献详情
文本聚类中罚多项混合模型的特征选择及其在互联网舆情分析中的应用
外文标题:Penalized Multinomial Mixture Model with Feature Selection for Text Clustering and its Application on Internet Public Opinions
文献类型:期刊
作者:薛薇[1]陈欢歌[2]
机构:中国人民大学,应用统计科学研究中心,北京100872;中国人民大学统计学院,北京100872;北京培黎职业学院计算机系,北京,100085

年:2012
期刊名称:统计与信息论坛
卷:27
期:1
页码范围:9-14
增刊:增刊
收录情况:CSSCI(61C1262012010002)
所属部门:统计学院
语言:中文
ISSN:1007-3116
链接地址:http://d.g.wanfangdata.com.cn/Periodical_tjyxxlt201201002.aspx
DOI:10.3969/j.issn.1007-3116.2012.01.002
关键词:特征选择;混合模型;文本聚类;舆情分析
摘要:高维稀疏数据的特征选择是互联网舆情文本聚类分析的关键.借鉴罚模型思想,利用罚多项混合模型,给不显著影响聚类结果的特征予较重惩罚的方式实现特征选择,可有效选出代表舆情各类观点的典型词汇,实证应用中有较为理想的表现.
作者其他论文



网络舆论倾向性的动态跟踪方法及实证研究.薛薇;闫阳.统计与信息论坛.2013,28(1),81-87.
非平衡数据集的改进SMOTE再抽样算法.薛薇.统计研究.2012,29(6),95-98.
银行最终金融服务是否应课以增值税的理论述评.薛薇;李艳艳.经济纵横.2007,77-79.
养老金计划与个人所得税政策.薛薇.涉外税务.2007,22-27.
税收收入Granger因果和协整关系检验.薛薇;张曼.中央财经大学学报.2005,16-19.

相关话题/北京 统计 统计学院 文献 中国人民大学