基于多特征融合的同名专家消歧方法研究
曾健荣1, 张仰森1,2,?, 王思远1, 黄改娟1,2, 崔佳3, 马欢3 1. 北京信息科技大学智能信息处理研究所, 北京 1001012. 国家经济安全预警工程北京实验室, 北京 1000443. 国家计算机网络与信息安全管理中心, 北京 100029收稿日期:
2019-07-17修回日期:
2019-11-26出版日期:
2020-07-20基金资助:
国家自然科学基金(61772081)和促进高校内涵发展–研究生科技创新项目(5121911044)资助Research on Expert Disambiguation of Same Name Based on Multi-feature Fusion
ZENG Jianrong1, ZHANG Yangsen1,2,?, WANG Siyuan1, HUANG Gaijuan1,2, CUI Jia3, MA Huan3 1. Intelligent Information Processing Laboratory of Beijing Information and Technology University, Beijing 1001012. Beijing Laboratory of National Economic Security Early-warning Engineering, Beijing 1000443. National Computer Network and Information Security Management Center, Beijing 100029Received:
2019-07-17Revised:
2019-11-26Published:
2020-07-20
可视化
0复制本文网址
1. 探讨2016版国际胰瘘研究小组定义和分级系统对胰腺术后患者胰瘘分级的影响.PDF(500KB)
-->
摘要/Abstract
摘要: 针对专家库构建过程中出现的同名歧义现象, 提出一种基于多特征融合的同名专家消歧方法。从中国知网(CNKI)数据源中获取专家的论文信息, 抽取论文的标题、摘要、关键词、作者单位和合作者等关键信息, 并将其作为属性特征, 构建特征表示模型, 进而定义同名专家之间的相似度计算函数。根据计算得到的相似度, 将同名消歧问题转化为聚类问题。利用近邻传播聚类算法进行聚类, 解决同名消歧问题。在采集的专家论文数据上的实验表明, 基于多特征融合的同名专家消歧方法的准确率可达92%, 取得良好的消歧效果。
引用本文
曾健荣, 张仰森, 王思远, 黄改娟, 崔佳, 马欢. 基于多特征融合的同名专家消歧方法研究[J]. 北京大学学报自然科学版, 2020, 56(4): 607-613.
ZENG Jianrong, ZHANG Yangsen, WANG Siyuan, HUANG Gaijuan, CUI Jia, MA Huan. Research on Expert Disambiguation of Same Name Based on Multi-feature Fusion[J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2020, 56(4): 607-613.
PDF全文下载地址:
http://xbna.pku.edu.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=3495