删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

基于语言网络和语义信息的文本相似度计算

中国人民大学 辅仁网/2017-07-05

文献详情
基于语言网络和语义信息的文本相似度计算
外文标题:Text similarity calculation based on language network and semantic information
文献类型:期刊
作者:詹志建[1]杨小平[2]
机构:[1]中国人民大学信息学院计算机系
[2]中国人民大学信息学院计算机系

年:2014
期刊名称:计算机工程与应用
卷:50
期:5
页码范围:33-38
增刊:增刊
收录情况:中国科技核心期刊CSCD(CSCD:5065443)
所属部门:信息学院
语言:中文
ISSN:1002-8331
链接地址:http://d.g.wanfangdata.com.cn/Periodical_jsjgcyyy201405008.aspx
DOI:10.3778/j.issn.1002-8331.1308-0263
人气指数:33
浏览次数:33
基金:国家自然科学基金(No.70871115)。
关键词:语言网络 文本聚类 文本相似度 词语相似度 language network text clustering text similarity term semantic similarity
摘要:通过分析已有的基于统计和基于语义分析的文本相似性度量方法的不足,提出了一种新的基于语言网络和词项语义信息的文本相似度计算方法。对文本建立语言网络,计算网络节点综合特征值,选取TOP比例特征词表征文本,有效降低文本表示维度。计算TOP比例特征词间的相似度,以及这些词的综合特征值所占百分比以计算文本之间的相似度。利用提出的相似度计算方法在数据集上进行聚类实验,实验结果表明,提出的文本相似度计算方法,在F-度量值标准上优于传统的TF-IDF方法以及另一种基于词项语义信息的相似度量方法。
作者其他论文



近邻传播聚类算法研究.桂斌;杨小平;张中夏,等.山西大学学报(自然科学版).2014,37(1),7-11.
基于Struts2技术的社交网络服务平台.陈默;杨小平;李瑶,等.计算机系统应用.2014,19-27.
基于主题词表和 FCA的网页语义概念树构建研究.孙亚琳;赵林林;杨小平.计算机应用研究.2014,3308-3315.
经济二元结构与我国货币政策利率传导机制.徐琳;杨小平.安庆师范学院学报(社会科学版).2014,115-118.
贴近技术与社会发展改革大学计算机教育--分析与解读CFC2014.吴功宜;李凤霞;杨小平,等.计算机教育.2014,106-110.

相关话题/网络 语言 计算 信息 信息学院