删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

基于Transformer局部信息及语法增强架构的中文拼写纠错方法

本站小编 Free考研考试/2021-12-20

基于Transformer局部信息及语法增强架构的中文拼写纠错方法

段建勇, 袁阳, 王昊?
北方工业大学信息学院, 北京 100043

收稿日期:2020-05-29修回日期:2020-08-13出版日期:2021-01-20

基金资助:国家自然科学基金(61972003, 61672040)资助

Chinese Spelling Correction Method Based on Transformer LocalInformation and Syntax Enhancement Architecture

DUAN Jianyong, YUAN Yang, WANG Hao?
School of Information Science and Technology, North China University of Technology, Beijing 100043

Received:2020-05-29Revised:2020-08-13Published:2021-01-20



PDF

(874KB)

可视化

0

复制本文网址



1. 探讨2016版国际胰瘘研究小组定义和分级系统对胰腺术后患者胰瘘分级的影响.PDF(500KB)

-->



摘要/Abstract


摘要: 针对中文拼写纠错, 提出两种新的改进方法。其一, 在Transformer注意力机制的基础上, 添加高斯分布的偏置矩阵, 用于提高模型对局部文本的关注程度, 加强对错误文本中错误字词和周边文字的信息提取。其二, 使用ON_LSTM模型, 对错误文本表现出的特殊语法结构特征进行语法信息提取。实验结果表明, 所提出的两种方法均能有效提高准确率和召回率, 并且, 将两种方法融合后的模型取得最高F1值。

引用本文



段建勇, 袁阳, 王昊. 基于Transformer局部信息及语法增强架构的中文拼写纠错方法[J]. 北京大学学报自然科学版, 2021, 57(1): 61-67.
DUAN Jianyong, YUAN Yang, WANG Hao. Chinese Spelling Correction Method Based on Transformer LocalInformation and Syntax Enhancement Architecture[J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2021, 57(1): 61-67.





PDF全文下载地址:

http://xbna.pku.edu.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=3568
相关话题/信息 语法 中文 信息学院 北京大学

  • 领限时大额优惠券,享本站正版考研考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是考研复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19
  • 时间精度与空间信息对神经网络模型预报PM2.5浓度的影响
    时间精度与空间信息对神经网络模型预报PM2.5浓度的影响邹思琳1,任晓晨1,2,王成功1,韦骏3,?1.北京大学物理学院大气与海洋科学系,北京1008712.96813部队,黄山2450003.中山大学大气科学学院,广州519082收稿日期:2010-05-08修回日期:2019-08-10出版日期 ...
    本站小编 Free考研考试 2021-12-20
  • 基于情感信息辅助的多模态情绪识别
    基于情感信息辅助的多模态情绪识别吴良庆,刘启元,张栋?,王建成,李寿山,周国栋苏州大学计算机科学与技术学院,苏州215006收稿日期:2019-05-22修回日期:2019-09-19出版日期:2020-01-20基金资助:国家自然科学基金(61331011,61375073)资助Multimoda ...
    本站小编 Free考研考试 2021-12-20
  • 北京大学道路地震学观测台阵设计及数据特点
    北京大学道路地震学观测台阵设计及数据特点温景充1,2,鲍铁钊1,2,冯永革1,宁杰远1,2,?1.北京大学地球与空间科学学院,北京1008712.高铁地震学联合研究组,北京100029收稿日期:2019-07-15修回日期:2019-08-14出版日期:2019-09-20基金资助:国家自然科学基金 ...
    本站小编 Free考研考试 2021-12-20
  • 基于步行时足底压力信息的前交叉韧带断裂辅助诊断方法
    基于步行时足底压力信息的前交叉韧带断裂辅助诊断方法黄红拾1,王政飞2,许国雄2,李文新2,张思1,张东霞1,敖英芳1,?1.北京大学第三医院运动医学研究所,北京1001912.北京大学信息科学技术学院,北京100871收稿日期:2018-06-14修回日期:2018-11-01出版日期:2019-0 ...
    本站小编 Free考研考试 2021-12-20
  • 中文篇章零元素语料库构建
    中文篇章零元素语料库构建盛晨,孔芳,周国栋苏州大学计算机科学与技术学院自然语言处理实验室,苏州215006收稿日期:2018-04-19修回日期:2018-08-07出版日期:2019-01-20基金资助:国家自然科学基金(61472264,61751206)和国家重点研发计划(20 ...
    本站小编 Free考研考试 2021-12-20
  • 中文嵌套命名实体关系抽取研究
    中文嵌套命名实体关系抽取研究许浩亮,李雁群,何云琪,钱龙华苏州大学计算机科学与技术学院,苏州215006收稿日期:2018-04-15修回日期:2018-08-06出版日期:2019-01-20基金资助:国家自然科学基金(2017YFB1002101)资助ResearchonChin ...
    本站小编 Free考研考试 2021-12-20
  • 结合RNN和CNN层次化网络的中文文本情感分类
    结合RNN和CNN层次化网络的中文文本情感分类罗帆,王厚峰北京大学计算语言学研究所,北京100871收稿日期:2017-07-13修回日期:2017-11-27出版日期:2018-05-20基金资助:国家社会科学基金(12&ZD227)和863计划(2015AA015402)资助Ch ...
    本站小编 Free考研考试 2021-12-20
  • 融合词、句层级信息的抽取式摘要优化框架
    融合词、句层级信息的抽取式摘要优化框架林心宜1,2,严睿1,,赵东岩11.北京大学计算机科学技术研究所,北京1000802.北京大学信息科学技术学院,北京100871收稿日期:2017-06-09修回日期:2017-08-31出版日期:2018-03-20基金资助:国家自然科学基金( ...
    本站小编 Free考研考试 2021-12-20
  • 基于部件拼接的高质量中文字库自动生成系统
    基于部件拼接的高质量中文字库自动生成系统刘成东,连宙辉,唐英敏,肖建国北京大学计算机科学技术研究所,北京100871收稿日期:2016-12-07修回日期:2017-04-26出版日期:2018-01-20基金资助:国家自然科学基金(61472015,61672056,6167204 ...
    本站小编 Free考研考试 2021-12-20
  • 北京大学未名湖水质与底泥菌群结构的时空变化
    北京大学未名湖水质与底泥菌群结构的时空变化陶怡乐,张晨枫,徐琳,温东辉()北京大学环境科学与工程学院,水沙科学教育部重点实验室,北京100871收稿日期:2016-07-12修回日期:2016-10-03出版日期:2017-10-24基金资助:2010年度北京大学校长基金和国家自然科学基金(5137 ...
    本站小编 Free考研考试 2021-12-20