一种基于复杂网络的短文本语义相似度计算
外文标题:Measuring Semantic Similarity in Short Texts Through Complex Network
文献类型:期刊
作者:詹志建[1]
机构:[1]中国人民大学信息学院
[2]中国人民大学信息学院
年:2016
期刊名称:中文信息学报
卷:30
期:4
页码范围:71
增刊:正刊
收录情况:中文核心期刊要目总览
所属部门:信息学院
语言:中文
ISSN:1003-0077
基金:国家自然科学基金
关键词:复杂网络; 综合特征值; 短文本; 语义相似度
摘要:将传统的文本相似度量方法直接移植到短文本时,由于短文本内容简短的特性会导致数据稀疏而造成计算结果出现偏差。该文通过使用复杂网络表征短文本,提出了 一种新的短文本相似度量方法。该方法首先对短文本进行预处理,然后对短文本建立复杂网络模型,计算短文本词语的复杂网络特征值,再借助外部工具计算短文本 词语之间的语义相似度,然后结合短文本语义相似度定义计算短文本之间的相似度。最后在基准数据集上进行聚类实验,验证本文提出的短文本相似度计算方法在基 于F-度量值标准上,优于传统的TF-IDF方法和另一种基于词项语义相似度的计算方法。
作者其他论文
近邻传播聚类算法研究.桂斌;杨小平;张中夏,等.山西大学学报(自然科学版).2014,37(1),7-11.
基于Struts2技术的社交网络服务平台.陈默;杨小平;李瑶,等.计算机系统应用.2014,19-27.
基于主题词表和 FCA的网页语义概念树构建研究.孙亚琳;赵林林;杨小平.计算机应用研究.2014,3308-3315.
基于语言网络和语义信息的文本相似度计算.詹志建;杨小平.计算机工程与应用.2014,33-38.
经济二元结构与我国货币政策利率传导机制.徐琳;杨小平.安庆师范学院学报(社会科学版).2014,115-118.