基于LTP和HOG纹理特征融合的中亚文档图像文种识别
吴正健1,木特力甫·马木提2,吾尔尼沙·买买提1,阿力木江·艾沙1,3,库尔班·吾布力1,3*1.新疆大学信息科学与工程学院, 新疆 乌鲁木齐 830046;2.新疆大学图书馆, 新疆 乌鲁木齐 830046;3.新疆多语种信息技术重点实验室, 新疆 乌鲁木齐 830046
发布日期:
2021-04-16作者简介:
吴正健(1995— ),男,安徽芜湖人,硕士研究生,主要研究方向为模式识别,计算机视觉. E-mail:wzj199538@gmail.com. *通信作者简介:库尔班·吾布力(1974— ),男,维吾尔族,新疆巴楚人,博士,教授,主要研究方向为数字图像处理与模式识别. E-mail:Kurban@xju.edu.cn基金资助:
国家自然科学基金资助项目(61862061,6161563052,61363064);新疆大学博士科研启动基金项目(BS180268);新疆维吾尔自治区高校科研计划创新团队基金项目(XJEDU2017T002)Script identification of Central Asian document images based on LTP and HOG texture feature fusion
WU Zhengjian1, MUTALLIP Mamut2, HORNISA Mamat1, ALIM Aysa1,3, KURBAN Ubul1,3*1. School of Information Science Engineering, Xinjiang University, Urumqi 830046, Xinjiang, China;
2.The Library, Xinjiang University, Urumqi 830046, Xinjiang, China;
3. The Key Lab. of Xinjiang Multilingual Information Technology, Urumqi 830046, Xinjiang, China
Published:
2021-04-16摘要/Abstract
摘要: 针对中亚地区存在一些相似度较高的文种,提出一种基于具有旋转不变性的统一局部三值模式(rotation invariant uniform local ternary pattern,riu2-LTP)和方向梯度直方图(histogram of oriented gradients,HOG)特征交叉融合的文档图像文种方法。使用SVM分类器对包含10个文种共10 000张图片的数据库进行试验;为了提高多文种识别效果,采用贝叶斯优化SVM的超参数。对文档图像提取了半径为1,采样点为8的riu2-LTP;重新对数据库提取HOG;采用交叉融合方法将20维riu2-LTP特征与36维HOG特征分别依次融入到新的特征集。试验表明,本研究方法平均查准率达到99%,相较于单一LTP、riu2-LTP和HOG方法有更好性能。
PDF全文下载地址:
http://gxbwk.njournal.sdu.edu.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=2029