删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

基于BERT-IDCNN-CRF的中文命名实体识别方法

本站小编 Free考研考试/2022-02-06

基于BERT-IDCNN-CRF的中文命名实体识别方法

李妮1(),关焕梅2,*(),杨飘2,董文永2
1. 中国电力科学研究院有限公司电网环境保护国家重点实验室,湖北 武汉 430074
2. 武汉大学计算机学院,湖北 武汉 430072
收稿日期:2019-09-02出版日期:2020-01-20发布日期:2020-01-10
通讯作者:关焕梅E-mail:lini@epri.sgcc.com.cn;hmguan@whu.edu.cn
作者简介:李妮(1982—),女,硕士,高级工程师,研究方向为电力系统电磁环境和电磁兼容. E-mail: lini@epri.sgcc.com.cn
基金资助:国家电网公司总部科技项目(GY71-18-009)

BERT-IDCNN-CRF for named entity recognition in Chinese

Ni LI1(),Huan-mei GUAN2,*(),Piao YANG2,Wen-yong DONG2
1. State Key Laboratory of Power Grid Environmental Protection, China Electric Power Research Institute, Wuhan 430074, Hubei, China
2. School of Computer Science, Wuhan University, Wuhan 430072, Hubei, China
Received:2019-09-02Online:2020-01-20Published:2020-01-10
Contact:Huan-mei GUAN E-mail:lini@epri.sgcc.com.cn;hmguan@whu.edu.cn






摘要/Abstract


摘要: 预训练语言模型能够表达句子丰富的句法和语法信息,并且能够对词的多义性建模,在自然语言处理中有着广泛的应用,BERT(bidirectional encoder representations from transformers)预训练语言模型是其中之一。在基于BERT微调的命名实体识别方法中,存在的问题是训练参数过多,训练时间过长。针对这个问题提出了基于BERT-IDCNN-CRF(BERT-iterated dilated convolutional neural network-conditional random field)的中文命名实体识别方法,该方法通过BERT预训练语言模型得到字的上下文表示,再将字向量序列输入IDCNN-CRF模型中进行训练,训练过程中保持BERT参数不变,只训练IDCNN-CRF部分,在保持多义性的同时减少了训练参数。实验表明,该模型在MSRA语料上F1值能够达到94.41%,在中文命名实体任务上优于目前最好的Lattice-LSTM模型,提高了1.23%;与基于BERT微调的方法相比,该方法的F1值略低但是训练时间大幅度缩短。将该模型应用于信息安全、电网电磁环境舆情等领域的敏感实体识别,速度更快,响应更及时。


PDF全文下载地址:

http://lxbwk.njournal.sdu.edu.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=3214
相关话题/中文 语言 湖北 环境 武汉大学

  • 领限时大额优惠券,享本站正版考研考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是考研复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19
  • 周期环境中具有尺度结构的两种群系统的最优控制
    周期环境中具有尺度结构的两种群系统的最优控制梁丽宇,雒志学兰州交通大学数理学院,甘肃兰州730070出版日期:2019-09-20发布日期:2019-07-30作者简介:梁丽宇(1994—),女,硕士研究生,研究方向为生物数学及最优控制理论.E-mail:liangliyu716@126.com基金 ...
    本站小编 Free考研考试 2022-02-06
  • 一类污染环境下具有扩散和年龄结构的随机单种群系统分析
    一类污染环境下具有扩散和年龄结构的随机单种群系统分析胡永亮,雒志学,梁丽宇,冯宇星兰州交通大学数理学院,甘肃兰州730070出版日期:2019-09-20发布日期:2019-07-30作者简介:胡永亮(1995—),男,硕士研究生,研究方向为生物数学.E-mail:Kevin906760673@16 ...
    本站小编 Free考研考试 2022-02-06
  • 黄河三角洲城市土地利用与生态环境耦合关系
    黄河三角洲城市土地利用与生态环境耦合关系陈浩1(),王仁卿1,2,刘建1,()1.山东大学环境研究院,山东青岛2662372.山东大学生命科学学院,山东青岛266237收稿日期:2019-01-02出版日期:2019-07-20发布日期:2019-06-27通讯作者:刘建E-mail:4458564 ...
    本站小编 Free考研考试 2022-02-06
  • vTCM:一种基于物理可信计算环境虚拟化的虚拟可信密码模块
    vTCM:一种基于物理可信计算环境虚拟化的虚拟可信密码模块胡俊(),刁子朋北京工业大学信息学部计算机学院,北京100124收稿日期:2018-09-20出版日期:2019-07-20发布日期:2019-06-27作者简介:胡俊(1972—),男,博士,讲师,研究方向为可信计算、云安全和安全操作系统. ...
    本站小编 Free考研考试 2022-02-06
  • 稀疏语言与r-析取语言的连接
    稀疏语言与r-析取语言的连接刘祖华1,2,郭聿琦1*1.兰州大学数学与统计学院,甘肃兰州730000;2.昆明学院数学学院,云南昆明650214发布日期:2019-06-05作者简介:LIUZu-hua(1981—),Male,PhD.Student,AssociateProfessor,Hisre ...
    本站小编 Free考研考试 2022-02-06
  • 污染环境下森林发展系统的最优控制
    污染环境下森林发展系统的最优控制曹雪靓,雒志学兰州交通大学数理学院数学系,甘肃兰州730070收稿日期:2017-11-14出版日期:2018-07-20发布日期:2018-07-03作者简介:曹雪靓(1994—),女,硕士研究生,研究方向为生物数学及最优控制理论.E-mail:1084551902 ...
    本站小编 Free考研考试 2022-02-06
  • 面向Windows环境进程主动动态度量方法
    面向Windows环境进程主动动态度量方法张建标1,2,3,李志刚1,2,3,刘国杰1,2,3,王超1,2,3,王玮1,2,31.北京工业大学信息学部,北京100124;2.可信计算北京市重点实验室,北京100124;3.信息安全等级保护关键技术国家工程实验室,北京100124收稿日期:2017-0 ...
    本站小编 Free考研考试 2022-02-06
  • 基于深度表示学习的多语言文本情感分析
    基于深度表示学习的多语言文本情感分析余传明1,冯博琳1,田鑫1,安璐2*1.中南财经政法大学信息与安全工程学院,湖北武汉430073;2.武汉大学信息管理学院,湖北武汉430072收稿日期:2017-04-15出版日期:2018-03-20发布日期:2018-03-13通讯作者:安璐(1979—), ...
    本站小编 Free考研考试 2022-02-06
  • 环境健康风险感知研究进展
    环境健康风险感知研究进展黄蕾1,叶子雯1,李湉湉2发布日期:2021-12-29通讯作者:黄蕾.E-mail:huanglei@nju.edu.cn基金资助:国家自然科学基金优青资助项目(41822709);江苏省自然科学基金面上项目(BK20201186)Researchprogressonenv ...
    本站小编 Free考研考试 2022-02-06
  • 加强环境健康风险预警研究,推动风险预警公共卫生服务
    加强环境健康风险预警研究,推动风险预警公共卫生服务李湉湉,王情,孙庆华发布日期:2021-12-29通讯作者:李湉湉.E-mail:litiantian@nieh.chinacdc.cn基金资助:国家自然科学基金重大研究计划集成项目(92043310)Strengthenresearchonearl ...
    本站小编 Free考研考试 2022-02-06