基于Word2Vec的情感词典自动构建与优化
文献类型:期刊
作者:杨小平[1]
机构:[1]中国人民大学信息学院
[2]中国人民大学信息学院
[3]中国人民大学信息学院
[4]中国人民大学信息学院
[5]中国人民大学信息学院
[6]中国人民大学信息学院
[7]中国人民大学信息学院
年:2017
期刊名称:计算机科学
期:01
页码范围:42-47+74
增刊:正刊
收录情况:中文核心期刊要目总览
所属部门:信息学院
语言:中文
ISSN:1002-137X
关键词:情感分析;多元情感分类;神经网络语言模型;情感消歧;情感强度优化框架
摘要:情感词典的构建是文本挖掘领域中重要的基础性工作。近几年,情感词典的极性标注从二元褒贬标注向多元情绪标注发展,词典的领域特性也日趋明显。但是情感类别的手工标注不但费时费力,而且情感强度难以得到准确量化,同时对领域性的过分关注也大大限制了情感词典的适用性[1]。通过神经网络语言模型对大规模中文语料进行统计训练,并在此基础上提出了基于转换约束集的多维情感词典自动构建方法;然后研究了基于词分布密度的感情色彩消歧方法,对兼具褒贬意味词语的感情极性进行区分和识别,并分别计算两种感情色彩下的情感类别与强度;最后提出基于多个语义资源的全局优化方案,得到包含10种情绪标注的多维汉语情感词典SentiRuc。实验...
作者其他论文
固态硬盘混合存储数据库的数据分布优化算法.周世民;柴云鹏;王良,等.计算机工程.2015,55-59.
近邻传播聚类算法研究.桂斌;杨小平;张中夏,等.山西大学学报(自然科学版).2014,37(1),7-11.
基于Struts2技术的社交网络服务平台.陈默;杨小平;李瑶,等.计算机系统应用.2014,19-27.
基于主题词表和 FCA的网页语义概念树构建研究.孙亚琳;赵林林;杨小平.计算机应用研究.2014,3308-3315.
基于语言网络和语义信息的文本相似度计算.詹志建;杨小平.计算机工程与应用.2014,33-38.