1(国防科技大学信息系统工程重点实验室 长沙 410073);2(地球空间信息技术协同创新中心(武汉大学) 武汉 430079);3(新南威尔士大学计算机科学与工程学院 澳大利亚悉尼 2052) (zengweixin13@nudt.edu.cn)
出版日期:
2020-07-01基金资助:
国家自然科学基金项目(61872446,61902417,71690233,71971212);湖南省自然科学基金项目(2019JJ20024);湖南省研究生科研创新项目(CX20190033)Iterative Entity Alignment via Re-Ranking
Zeng Weixin1, Zhao Xiang1,2, Tang Jiuyang1,2, Tan Zhen1, Wang Wei31(Science and Technology on Information Systems Engineering Laboratory, National University of Defense Technology, Changsha 410073);2(Collaborative Innovation Center of Geospatial Technology (Wuhan University), Wuhan 430079);3(School of Computer Science and Engineering, The University of New South Wales, Sydney, Australia, 2052)
Online:
2020-07-01Supported by:
This work was supported by the National Natural Science Foundation of China (61872446, 61902417, 71690233, 71971212), the Natural Science Foundation of Hunan Province of China (2019JJ20024), and the Postgraduate Scientific Research Innovation Project of Hunan Province (CX20190033).摘要/Abstract
摘要: 现有的知识图谱无法避免地存在不完整这一问题.缓解此问题的可行方法是引入外部知识图谱中的知识.在此过程中,实体对齐是最关键的步骤.当前最先进的实体对齐解决方案主要依靠知识图谱的结构信息来判断实体的等价性,但在真实世界知识图谱上,大部分实体只具有较低的节点度数以及微少的结构信息.此外,标注数据的缺乏也大大限制了实体对齐模型的效果.为解决上述问题,提出将不受节点度数影响的实体名信息与结构信息相结合,从更全面的角度实现实体对齐.在此基本框架上,利用基于课程学习的迭代训练方法从易至难地选择高置信度结果加入到训练数据中,扩增标注数据的规模.最后使用词移距离模型进一步改进实体名信息的利用方式,并对前序对齐结果重排序,提升实体对齐准确率.在跨语言以及单语言实体对齐任务上的实验结果表明,提出的实体对齐方法性能远好于当前最好的方法.
参考文献
相关文章 4
[1] | 戴臣超,王洪元,倪彤光,陈首兵. 基于深度卷积生成对抗网络和拓展近邻重排序的行人重识别[J]. 计算机研究与发展, 2019, 56(8): 1632-1641. |
[2] | 张连成,王禹,孔亚洲,邱菡. 网络流水印安全威胁及对策综述[J]. 计算机研究与发展, 2018, 55(8): 1785-1799. |
[3] | 庄严,李国良,冯建华. 知识库实体对齐技术综述[J]. 计算机研究与发展, 2016, 53(1): 165-192. |
[4] | 陈尧, 赵永华,赵慰,赵莲. GPU加速不完全Cholesky分解预条件共轭梯度法[J]. 计算机研究与发展, 2015, 52(4): 843-850. |
PDF全文下载地址:
https://crad.ict.ac.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=4217