针对利用远程监督标注文本实体过程中存在实体类别标注错误问题导致模型难以有效区分各实体的类别特征,影响模型精准度的问题,本文提出一种利用原型网络过滤训练语料中标注错误样本的远程监督命名实体识别方法,利用预训练的原型网络编码正确标注实体生成类别原型表示,过滤语料中距类别原型较远的样本. 实验表明,使用原型网络有效地提高了语料的标注质量,提升了模型性能.
PDF全文下载地址:http://journal.bit.edu.cn/zr/article/exportPdf?id=185fedbf-57af-4ddc-b2a9-a90a3505e0c0
删除或更新信息,请邮件至freekaoyan#163.com(#换成@)