删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

结合GAN与BiLSTM-Attention-CRF的领域命名实体识别

本站小编 Free考研考试/2022-01-01

张晗1,2, 郭渊博1, 李涛1
1(战略支援部队信息工程大学密码工程学院 郑州 450001); 2(郑州大学软件学院 郑州 450001) (zhang_han@zzu.edu.cn)
出版日期: 2019-09-10


基金资助:国家自然科学基金项目(61501515);河南省重点科技攻关项目(172102210002);郑州大学青年骨干教师项目(2017ZDGGJS048)

Domain Named Entity Recognition Combining GAN and BiLSTM-Attention-CRF

Zhang Han1,2, Guo Yuanbo1, Li Tao1
1(Department of Cryptogram Engineering, Strategic Support Force Information Engineering University, Zhengzhou 450001); 2(Software College, Zhengzhou University, Zhengzhou 450001)
Online: 2019-09-10


Supported by:This work was supported by the National Natural Science Foundation of China (61501515), the Key Scientific and Technological Research Project of Henan Province (172102210002), and the Young Scholar Teachers Project of Zhengzhou University (2017ZDGGJS048).




摘要/Abstract


摘要: 领域内命名实体识别通常面临领域内标注数据缺乏以及由于实体名称多样性导致的同一文档中实体标注不一致等问题.针对以上问题,利用生成式对抗网络(generative adversarial network, GAN)可以生成数据的特点,将生成式对抗网络与BiLSTM-Attention-CRF模型相结合.首先以BiLSTM-Attention作为生成式对抗网络的生成器模型,以CNN作为判别器模型,从众包标注数据集中整合出与专家标注数据分布一致的正样本标注数据来解决领域内标注数据缺乏的问题;然后通过在BiLSTM-Attention-CRF模型中引入文档层面的全局向量,计算每个单词与该全局向量的关系得出其新的特征表示以解决由于实体名称多样化造成的同一文档中实体标注不一致问题;最后,在基于信息安全领域众包标注数据集上的实验结果表明,该模型在各项指标上显著优于同类其他模型方法.






[1]宋珂慧,张莹,张江伟,袁晓洁. 基于生成式对抗网络的结构化数据表生成模型[J]. 计算机研究与发展, 2019, 56(9): 1832-1842.





PDF全文下载地址:

https://crad.ict.ac.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=4001
相关话题/数据 网络 郑州大学 计算 工程学院