删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

基于神经网络的药物实体与关系联合抽取

本站小编 Free考研考试/2022-01-01

曹明宇,杨志豪,罗凌,林鸿飞,王健
(大连理工大学计算机科学与技术学院 辽宁大连 116024) (caomingyu1997@mail.dlut.edu.cn)
出版日期: 2019-07-01


基金资助:国家重点研发计划项目(2016YFC0901902);国家自然科学基金项目(61272373,61340020, 61572102);教育部新世纪优秀人才支持计划项目(NCET-13-0084)

Joint Drug Entities and Relations Extraction Based on Neural Networks

Cao Mingyu, Yang Zhihao, Luo Ling, Lin Hongfei, Wang Jian
(School of Computer Science and Technology, Dalian University of Technology, Dalian, Liaoning 116024)
Online: 2019-07-01







摘要/Abstract


摘要: 药物实体及关系抽取研究对于生物医学研究具有重要的促进作用,也是进一步构建生物医学知识库的基础.现存方法主要采用流水线方式,即先对文本进行实体识别后再对实体对进行关系分类.流水线方法主要存在任务错误传播、未能考虑2个子任务的相互影响和句子中不同关系的相互影响的问题.针对这些问题,提出了一种基于神经网络的药物实体与关系联合抽取方法.使用了一种新标注模式,将药物实体及关系的联合抽取转化为端对端的序列标注任务.使用词向量和字符向量作为词表示输入,使用BiLSTM-CRF模型进行药物实体与关系联合抽取.实验结果表明:在药物-药物交互作用(drug-drug interactions, DDI)2013语料集上,取得了89.9%的实体识别F-score及67.3%的关系抽取F-score,优于使用相同模型的流水线方法.






[1]李冬梅, 张扬, 李东远, 林丹琼. 实体关系抽取方法研究综述[J]. 计算机研究与发展, 2020, 57(7): 1424-1448.
[2]许晶航, 左万利, 梁世宁, 王英. 基于图注意力网络的因果关系抽取[J]. 计算机研究与发展, 2020, 57(1): 159-174.
[3]张晗,郭渊博,李涛. 结合GAN与BiLSTM-Attention-CRF的领域命名实体识别[J]. 计算机研究与发展, 2019, 56(9): 1851-1858.
[4]左笑晨,窦志成,黄真,卢淑祺,文继荣. 微博热门话题关联商品品类挖掘[J]. 计算机研究与发展, 2019, 56(9): 1927-1938.
[5]杨培,杨志豪,罗凌,林鸿飞,王健. 基于注意机制的化学药物命名实体识别[J]. 计算机研究与发展, 2018, 55(7): 1548-1556.
[6]何贤芒,陈银冬,李东,郝艳妮. 基于项目合作的社会关系网络构建[J]. 计算机研究与发展, 2016, 53(4): 776-784.
[7]甘丽新,万常选,刘德喜,钟青,江腾蛟. 基于句法语义特征的中文实体关系抽取[J]. 计算机研究与发展, 2016, 53(2): 284-302.
[8]秦兵,刘安安,刘挺. 无指导的中文开放式实体关系抽取[J]. 计算机研究与发展, 2015, 52(5): 1029-1035.
[9]毛存礼,余正涛,沈韬,高盛祥,郭剑毅,线岩团. 基于深度神经网络的有色金属领域实体识别[J]. 计算机研究与发展, 2015, 52(11): 2451-2459.
[10]陈立玮 冯岩松 赵东岩. 基于弱监督学习的海量网络数据关系抽取[J]. 计算机研究与发展, 2013, 50(9): 1825-1835.
[11]荆 涛, 左万利, 孙吉贵, 车海燕,. 中文网页语义标注:由句子到RDF表示[J]. , 2008, 45(7): 1221-1231.
[12]张玥杰 徐智婷 薛向阳. 融合多特征的最大熵汉语命名实体识别模型[J]. , 2008, 45(6): -.
[13]刘克彬 李 芳 刘 磊 韩 颖. 基于核函数中文关系自动抽取系统的实现[J]. , 2007, 44(8): 1406-1411.





PDF全文下载地址:

https://crad.ict.ac.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=3963
相关话题/计算机 药物 中文 网络 生物医学