删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

基于改进LeNet-5 模型的手写体中文识别

本站小编 Free考研考试/2022-01-16

何 凯,黄婉蓉,刘 坤,高圣楠
AuthorsHTML:何 凯,黄婉蓉,刘 坤,高圣楠
AuthorsListE:He Kai,Huang Wanrong,Liu Kun,Gao Shengnan
AuthorsHTMLE:He Kai,Huang Wanrong,Liu Kun,Gao Shengnan
Unit:天津大学电气自动化与信息工程学院,天津 300072
Unit_EngLish:School of Electrical and Information Engineering,Tianjin University,Tianjin 300072,China
Abstract_Chinese:手写体中文的自动识别是中文文档数字化的前提和基础,由于中文字符数目繁多、相似性强、字体种类繁多、书写随意、缺乏统一规范等原因,一直是计算机视觉领域中一个具有挑战性的问题.为解决这一难题,提出了一种基于卷积神经网络的手写体中文识别方法.在经典LeNet-5网络模型的基础上进行改进,提出了一种LeNet-Ⅱ模型.利用改进的Inception模块和空洞卷积,设计了一种并行的双路卷积神经网络结构;两路分支可分别提取手写中文图像中不同尺度的特征,获得多个尺度的特征图像;通过对其进行特征融合,可以达到丰富特征图像多样性、提升识别准确率的目的;最后经过全连接层进行分类.利用经典手写体中文数据集进行训练,利用该模型实现了3755类手写体中文字符及相关文本的自动识别.实验结果表明,基于改进LeNet-5模型的手写体中文识别方法,在同一训练数据集上的收敛速度和识别准确率明显优于经典LeNet-5模型,对经典数据集的识别准确率可以达到95.21%,也高于其他传统算法;此外,对4幅手写体中文文本的平均识别准确率达到97.30%,超出了人类表现,取得了理想的实际效果.
Abstract_English:Chinese handwriting recognition is the premise and foundation of the digitization of Chinese documents. It is a challenging problem in the computer vision field for many reasons such as the large number of Chinese characters,strong similarity,wide variety of fonts,free writing forms,and lack of standardization. To solve this problem,a Chinese handwriting recognition approach using a convolutional neural network(CNN)is proposed. An improved LeNet-Ⅱ network model based on the traditional LeNet-5model is also proposed. Using the improved Inception module and dilated convolution,a collateral dual CNN structure is designed. The two branches contribute to the feature extraction of Chinese handwriting images in different scales. After feature fusion,the diversity of feature images is enriched and therefore,the recognition accuracy is improved. Finally,classification is realized using a fully connected layer. Using the proposed network model,3755 handwritten Chinese characters as well as relative Chinese documents and texts are recognized by training the classic Chinese handwriting dataset. The experimental results compared with those obtained using classic methods show that the improved model performs well in terms of convergence speed and recognition accuracy under the same training dataset. The recognition accuracy on the classic dataset is 95.21%,which is higher than those obtained by other traditional algorithms. Moreover,the average recognition accuracy on four handwritten Chinese documents is 97.30%,which is higher than that of human performance.
Keyword_Chinese:手写体中文识别;卷积神经网络;LeNet-5 模型;Inception 模块
Keywords_English:Chinese handwriting recognition;convolutional neural network(CNN);LeNet-5 model;Inception module

PDF全文下载地址:http://xbzrb.tju.edu.cn/#/digest?ArticleID=6501
相关话题/中文 手写体

  • 领限时大额优惠券,享本站正版考研考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是考研复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19
  • 中文语境下基于事件关联挖掘的金融网络构建与分析
    李朋远1,于华1,江成21.中国科学院大学工程科学学院,北京100049;2.首都经济贸易大学管理工程学院,北京1000702020年1月8日收稿;2020年3月16日收修改稿基金项目:国家自然科学基金(71450009)、北京市社会科学基金(19YJC036)、北京市教育委员会科技一般项目(KM2 ...
    本站小编 Free考研考试 2021-12-25
  • 一种免除二值化的视频叠加中文字符识别方法
    田洁,王伟强,孙翼中国科学院大学计算机与控制学院,北京1014082017年03月15日收稿;2017年04月19日收修改稿基金项目:国家自然科学基金(61271434)资助通信作者:田洁,E-mail:Tianjie2016@gmail.com摘要:提出一种新的用于识别视频中字幕文字的方法。鉴于视 ...
    本站小编 Free考研考试 2021-12-25
  • 基于数据增强的中文医疗命名实体识别
    基于数据增强的中文医疗命名实体识别王蓬辉,李明正,李思北京邮电大学人工智能学院,北京100876收稿日期:2020-03-24发布日期:2021-03-11通讯作者:李思(1985-),女,副教授,E-mail:lisi@bupt.edu.cn.E-mail:lisi@bupt.edu.cn作者简介 ...
    本站小编 Free考研考试 2021-12-25
  • 使用有序词语移动距离特征进行中文文本蕴含识别
    使用有序词语移动距离特征进行中文文本蕴含识别谭咏梅,王敏达,牛少彰北京邮电大学计算机学院,北京100876收稿日期:2016-09-07出版日期:2017-10-28发布日期:2017-11-21作者简介:谭咏梅(1975-),女,副教授,硕士生导师,E-mail:ymtan@bupt.edu.cn ...
    本站小编 Free考研考试 2021-12-25
  • 基于深度学习的中文地名识别研究
    沈思,朱丹浩.基于深度学习的中文地名识别研究[J].北京理工大学学报(自然科学版),2017,37(11):1150~1155.SHENSi,ZHUDan-hao.ChinesePlaceNameRecognitionBasedonDeepLearning[J].TransactionsofBeij ...
    本站小编 Free考研考试 2021-12-21
  • 中文机器阅读理解的鲁棒性研究
    中文机器阅读理解的鲁棒性研究李烨秋1,唐竑轩1,钱锦1,邹博伟1,2,洪宇1,?1.苏州大学计算机科学与技术学院,苏州2150002.新加坡资讯通信研究院,新加坡138632收稿日期:2020-06-08修回日期:2020-08-14出版日期:2021-01-20基金资助:国家自然科学基金(6170 ...
    本站小编 Free考研考试 2021-12-20
  • 基于Transformer局部信息及语法增强架构的中文拼写纠错方法
    基于Transformer局部信息及语法增强架构的中文拼写纠错方法段建勇,袁阳,王昊?北方工业大学信息学院,北京100043收稿日期:2020-05-29修回日期:2020-08-13出版日期:2021-01-20基金资助:国家自然科学基金(61972003,61672040)资助ChineseSp ...
    本站小编 Free考研考试 2021-12-20
  • 中文篇章零元素语料库构建
    中文篇章零元素语料库构建盛晨,孔芳,周国栋苏州大学计算机科学与技术学院自然语言处理实验室,苏州215006收稿日期:2018-04-19修回日期:2018-08-07出版日期:2019-01-20基金资助:国家自然科学基金(61472264,61751206)和国家重点研发计划(20 ...
    本站小编 Free考研考试 2021-12-20
  • 中文嵌套命名实体关系抽取研究
    中文嵌套命名实体关系抽取研究许浩亮,李雁群,何云琪,钱龙华苏州大学计算机科学与技术学院,苏州215006收稿日期:2018-04-15修回日期:2018-08-06出版日期:2019-01-20基金资助:国家自然科学基金(2017YFB1002101)资助ResearchonChin ...
    本站小编 Free考研考试 2021-12-20
  • 结合RNN和CNN层次化网络的中文文本情感分类
    结合RNN和CNN层次化网络的中文文本情感分类罗帆,王厚峰北京大学计算语言学研究所,北京100871收稿日期:2017-07-13修回日期:2017-11-27出版日期:2018-05-20基金资助:国家社会科学基金(12&ZD227)和863计划(2015AA015402)资助Ch ...
    本站小编 Free考研考试 2021-12-20