1(国防科技大学信息系统工程重点实验室 长沙 410073);2(地球空间信息技术协同创新中心(武汉大学) 武汉 430079);3(长沙商贸旅游职业技术学院经济贸易学院 长沙 410073) (huangpeixin15@nudt.edu.cn)
出版日期:
2019-12-01基金资助:
国家自然科学基金项目(61402494,61402498,71690233,61902417);湖南省自然科学基金项目(2015JJ4009)End-to-end Knowledge Triplet Extraction Combined with Adversarial Training
Huang Peixin1, Zhao Xiang1,2, Fang Yang1, Zhu Huiming1,3, Xiao Weidong1,21(Science and Technology on Information Systems Engineering Laboratory, National University of Defense Technology, Changsha 410073);2(Collaborative Innovation Center of Geospatial Technology(Wuhan University), Wuhan 430079);3(College of Economics and Trade, Changsha Commerce & Tourism College, Changsha 410073)
Online:
2019-12-01摘要/Abstract
摘要: 知识图谱作为一种有效表示现实世界的系统受到学术界和工业界广泛关注,并由于其精准表示知识的能力被广泛应用于信息服务、智慧搜索、自动问答等上层应用.知识图谱的核心为三元组形式的实体和关系.现有知识图谱远不足以描述现实世界,因此,如何通过实体关系抽取方法来补全或者构建新的知识图谱显得至关重要.传统流水线式的实体关系抽取方法会导致误差传递,而已有的联合抽取没有充分考虑命名实体识别与关系抽取之间的联系,从而降低抽取效果.针对上述问题,对知识三元组抽取方法进行了深入研究,提出了一种融合对抗训练的端到端知识三元组联合抽取方法.首先,采用了一种实体关系联合标注策略,通过端到端的神经网络抽取文本语义特征,并对文本进行自动标注;其次,模型在神经网络中加入自注意力机制增强对文本信息的编码能力,并通过引入带偏置项的目标函数提高对相关联实体的辨识能力;最后,模型融合了对抗训练以提高鲁棒性,改进抽取效果.在实验部分,采用4种分析方法和3种评价指标对模型性能进行评价分析,实验结果证明了模型在知识抽取上的性能明显优于现有方法.
参考文献
相关文章 15
[1] | 曾维新, 赵翔, 唐九阳, 谭真, 王炜. 基于重排序的迭代式实体对齐[J]. 计算机研究与发展, 2020, 57(7): 1460-1471. |
[2] | 李曈, 马伟, 徐士彪, 张晓鹏. 适应立体匹配任务的端到端深度网络[J]. 计算机研究与发展, 2020, 57(7): 1531-1538. |
[3] | 崔员宁, 李静, 沈力, 申扬, 乔林, 薄珏. Duration-HyTE:基于持续时间建模的时间感知知识表示学习方法[J]. 计算机研究与发展, 2020, 57(6): 1239-1251. |
[4] | 刘昱彤, 吴斌, 白婷. 古诗词图谱的构建及分析研究[J]. 计算机研究与发展, 2020, 57(6): 1252-1268. |
[5] | 张莹莹, 钱胜胜, 方全, 徐常胜. 基于多模态知识感知注意力机制的问答方法[J]. 计算机研究与发展, 2020, 57(5): 1037-1045. |
[6] | 董永强, 王鑫, 刘永博, 杨望. 异构YANG模型驱动的网络领域知识图谱构建[J]. 计算机研究与发展, 2020, 57(4): 699-708. |
[7] | 王萌, 王靖婷, 江胤霖, 漆桂林. 人机混合的知识图谱主动搜索[J]. 计算机研究与发展, 2020, 57(12): 2501-2513. |
[8] | 姚思雨, 赵天哲, 王瑞杰, 刘均. 规则引导的知识图谱联合嵌入方法[J]. 计算机研究与发展, 2020, 57(12): 2514-2522. |
[9] | 左笑晨,窦志成,黄真,卢淑祺,文继荣. 微博热门话题关联商品品类挖掘[J]. 计算机研究与发展, 2019, 56(9): 1927-1938. |
[10] | 王飞,钱铁云,刘斌,彭智勇. 支持范围查询的低冗余知识图谱管理[J]. 计算机研究与发展, 2019, 56(8): 1758-1771. |
[11] | 王硕,王建华,汤光明,裴庆祺,张玉臣,刘小虎. 一种智能高效的最优渗透路径生成方法[J]. 计算机研究与发展, 2019, 56(5): 929-941. |
[12] | 杜治娟, 杜治蓉, 王璐. 基于相邻和语义亲和力的开放知识图谱表示学习[J]. 计算机研究与发展, 2019, 56(12): 2549-2561. |
[13] | 郑庆华,董博,钱步月,田锋,魏笔凡,张未展,刘均. 智慧教育研究现状与发展趋势[J]. 计算机研究与发展, 2019, 56(1): 209-224. |
[14] | 杨晓慧,万睿,张海滨,曾义夫,刘峤. 基于符号语义映射的知识图谱表示学习算法[J]. 计算机研究与发展, 2018, 55(8): 1773-1784. |
[15] | 侯梦薇,卫荣,陆亮,兰欣,蔡宏伟. 知识图谱研究综述及其在医疗领域的应用[J]. 计算机研究与发展, 2018, 55(12): 2587-2599. |
PDF全文下载地址:
https://crad.ict.ac.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=4057