从百度百科挖掘领域知识相关度
外文标题:Mining Relevance between Domains Via Baidupedia
文献类型:期刊
作者:胡婕茹[1]
机构:中国人民大学信息学院,北京,100872;中国政法大学科学技术教学部,北京,100088
年:2011
期刊名称:广西师范大学学报(自然科学版)
卷:29
期:4
页码范围:28-34
增刊:增刊
所属部门:信息学院
语言:中文
ISSN:1001-6600
链接地址:http://d.g.wanfangdata.com.cn/Periodical_gxsfdxxb201104007.aspx
DOI:10.3969/j.issn.1001-6600.2011.04.007
基金:国家自然科学基金; 法律信息元数据及其语义检索研究规划基金
关键词:领域知识;相关度;Web挖掘;百度百科
摘要:本文提出利用百度百科这个开放的中文知识百科全书来计算知识领域间关联度的方法.通过抽取百度百科中词条的解释和分类信息,并经过分词以后,我们可以用向量空间模型(VSM)量化分类中的词条,然后提出用领域内词条的关联矩阵迭代的方法来计算单个领域中各个词条的权重.要计算2个领域的相关度,首先要分别算出它们各自领域中每个词条的权重,而后通过扩展向量空间的方式把它们的概念空间扩展为一个公共的向量空间,并在此公共向量空间中用余弦夹角的方法计算2个领域的相关度.该研究成果可以辅助我们发现领域间的关联,加快不同领域间知识的融合.
作者其他论文
近邻传播聚类算法研究.桂斌;杨小平;张中夏,等.山西大学学报(自然科学版).2014,37(1),7-11.
基于Struts2技术的社交网络服务平台.陈默;杨小平;李瑶,等.计算机系统应用.2014,19-27.
基于主题词表和 FCA的网页语义概念树构建研究.孙亚琳;赵林林;杨小平.计算机应用研究.2014,3308-3315.
基于语言网络和语义信息的文本相似度计算.詹志建;杨小平.计算机工程与应用.2014,33-38.
经济二元结构与我国货币政策利率传导机制.徐琳;杨小平.安庆师范学院学报(社会科学版).2014,115-118.