面向武器装备领域的复杂实体识别
游新冬1, 葛昊杰1, 韩君妹2, 李育贤1, 吕学强1,? 1. 北京信息科技大学网络文化与数字传播北京市重点实验室, 北京 1001012. 军事科学院系统工程研究院复杂系统仿真总体重点实验室, 北京 100101收稿日期:
2021-09-01修回日期:
2021-11-01出版日期:
2022-05-20基金资助:
北京市自然科学基金(4212020)、国家自然科学基金(62171043)、国防科技重点实验室基金(6412006200404)、北京信息科技大学“勤信人才”培育计划项目(QXTCP B201908)和北京市市教委科研计划(KM202111232001)资助Recognition of Complex Entities in Weapons and Equipment Field
YOU Xindong1, GE Haojie1, HAN Junmei2 , LI Yuxian1, Lü Xueqiang1,? 1. Beijing Key Laboratory of Internet Culture and Digital Dissemination Research, Beijing Information Science and Technology University, Beijing 1001012. National Key Laboratory for Complex Systems Simulation, Institute of Systems Engineering, Beijing 100101
Received:
2021-09-01Revised:
2021-11-01Published:
2022-05-20摘要/Abstract
摘要: 针对武器装备领域复杂实体的特点, 提出一种融合多特征后挂载武器装备领域知识的复杂命名实体识别方法。首先, 使用BERT 模型对武器装备领域数据进行预训练, 得到数据向量, 使用Word2Vec模型学习郑码、五笔、拼音和笔画的上下位特征, 获取特征向量。然后, 将数据向量与特征向量融合, 利用Bi-LSTM模型进行编码, 使用CRF解码得到标签序列。最后, 基于武器装备领域知识, 对标签序列进行复杂实体的触发检测, 完成复杂命名实体识别。使用环球军事网数据作为语料进行实验, 分析不同的特征组合、不同神经网络模型下的识别效果, 并提出适用于评价复杂命名实体识别结果的计算方法。实验结果表明, 提出的挂载领域知识且融合多特征的武器装备复杂命名实体识别方法的F1值达到95.37%, 优于现有方法。
引用本文
游新冬, 葛昊杰, 韩君妹, 李育贤, 吕学强. 面向武器装备领域的复杂实体识别[J]. 北京大学学报自然科学版, 2022, 58(3): 391-404.
YOU Xindong, GE Haojie, HAN Junmei, LI Yuxian, Lü Xueqiang. Recognition of Complex Entities in Weapons and Equipment Field[J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2022, 58(3): 391-404.
PDF全文下载地址:
http://xbna.pku.edu.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=3737