双向特征融合的快速精确任意形状文本检测

删除或更新信息，请邮件至freekaoyan#163.com(#换成@)

本站小编 Free考研考试/2022-01-03

边亮^1,,,
屈亚东²,
周宇²
1.北京航空航天大学电子信息工程学院北京 100191
2.中国科学技术大学信息科学技术学院合肥 230026

详细信息

作者简介:边亮：男，1982年生，博士生，研究方向为图像获取与处理
屈亚东：男，1998年生，硕士生，研究方向为场景图像文字合成、检测与识别
周宇：男，1992年生，博士生，研究方向为场景图像文字合成、检测与识别

通讯作者:边亮　askquestionbl@163.com

中图分类号:TN911.73

计量

文章访问数:542
HTML全文浏览量:185
PDF下载量:58
被引次数:0

出版历程

收稿日期:2020-10-16
修回日期:2021-01-29
网络出版日期:2021-02-05
刊出日期:2021-04-20

Bi-directional Feature Fusion for Fast and Accurate Text Detection of Arbitrary Shapes

Liang BIAN^1,,,
Yadong QU²,
Yu ZHOU²
1. School of Aeronautic Science and Engineering, Beihang University, Beijing 100191, China
2. School of Information Science and Technology, University of Science and Technology of China, Hefei 230026, China

摘要
摘要:现有的基于分割的场景文本检测方法仍较难区分相邻文本区域，同时网络得到分割图后后处理阶段步骤复杂导致模型检测效率较低。为了解决此问题，该文提出一种新颖的基于全卷积网络的场景文本检测模型。首先，该文构造特征提取器对输入图像提取多尺度特征图。其次，使用双向特征融合模块融合两个平行分支特征的语义信息并促进两个分支共同优化。之后，该文通过并行地预测缩小的文本区域图和完整的文本区域图来有效地区分相邻文本。其中前者可以保证不同的文本实例之间具有区分性，而后者能有效地指导网络优化。最后，为了提升文本检测的速度，该文提出一个快速且有效的后处理算法来生成文本边界框。实验结果表明：在相关数据集上，该文所提出的方法均实现了最好的效果，且比目前最好的方法在F-measure指标上最多提升了1.0%，并且可以实现将近实时的速度，充分证明了该方法的有效性和高效性。
关键词:场景文本检测/
双向特征融合/
多尺度特征/
后处理复杂度/
任意形状文本
Abstract:Existing segmentation based methods have problems, such as the difficulty in distinguishing adjacent text areas and the low efficiency of model detection caused by the complex steps in the post-processing stage. In order to solve this problem, this article proposes a novel scene text detection model based on fully convolutional network, which can solve the problem that adjacent texts are difficult to distinguish in existing methods and improve the detection speed of the model. First, it constructs a feature extractor to extract multi-scale feature map from the input image. Secondly, the bidirectional feature fusion module is used to fuse the semantic information of the two parallel branches and promote the joint optimization of the two branches. It then effectively differentiates adjacent texts by predicting both a reduced text area map and a full text area map in parallel. The former can guarantee the distinction between different text instances, while the latter can effectively guide the network optimization. Finally, in order to improve the speed of text detection, it proposes a fast and effective post-processing algorithm to generate text boundary boxes. The experimental results show that: on relative datasets, the method proposed in this article achieves the best performance, and improves the F-measure index by 1.0% at most compared with the current best method, and can achieve near-real-time speed, which proves fully the effectiveness and high efficiency of the method.
Key words:Scene text detection/
Bi-directional feature fusion/
Multi-scale feature/
Post-processing complexity/
Arbitrary-shaped texts

PDF全文下载地址:

https://jeit.ac.cn/article/exportPdf?id=1f8d4ce9-0a94-43f0-aec7-d69f608b3da5

相关话题/图像 网络 优化 博士生 文字

领限时大额优惠券,享本站正版考研考试资料!
优惠券领取后72小时内有效，10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材，产品类型包含电子书、题库、全套资料以及视频，无论您是考研复习、考证刷题，还是考前冲刺等，不同类型的产品可满足您学习上的不同需求。 ...
考试优惠券本站小编 Free壹佰分学习网 2022-09-19
基于球面Haar小波和卷积神经网络的飞行员虹膜识别
贾博1,冯孝鑫2,李军1,俞碧婷3,赵倩1,吴奇2,,1.东航技术应用研发中心有限公司上海2017072.上海交通大学电子信息与电气工程学院上海2002403.伍伦贡大学澳大利亚伍伦贡2500基金项目:国家自然科学基金(U1933125)详细信息作者简介:贾博：男，1987年生，工程师，研究方向为航 ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
语义分割网络重建单视图遥感影像数字表面模型
卢俊言1,2,3,贾宏光1,2,3,,,高放3,李文涛3,陆晴31.中国科学院长春光学精密机械与物理研究所长春1300332.中国科学院大学北京1000493.长光卫星技术有限公司长春130102基金项目:吉林省重大科技攻关项目(20170201006GX)，长春市科技局重大科技攻关项目(SA13R ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
基于超像素级卷积神经网络的多聚焦图像融合算法
聂茜茜,肖斌,,毕秀丽,李伟生重庆邮电大学计算智能重庆市重点实验室重庆400065基金项目:国家重点研发计划(2016YFC1000307-3)，国家自然科学基金(61976031,61806032)详细信息作者简介:聂茜茜：女，1992年生，博士，研究方向为图像处理、深度学习肖斌：男，1982年生 ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
一种在MR图像中进行脑胶质瘤检测和病灶分割的方法
陈皓1,2,,,李广1,刘洋1,强永乾31.西安邮电大学计算机学院　西安　7101212.陕西省网络数据分析与智能处理重点实验室　西安　7101213.西安交通大学第一附属医院　西安　710061基金项目:国家自然科学基金(61876138,61203311)，陕西省自然科学基金(2019JM-36 ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
基于最小位移可视差的连续Seam Carving算法在图像缩放中的研究
崔嘉1,2,宋磊1,2,陆宏菊3,唐明晰4,戚萌1,2,,1.山东师范大学信息科学与工程学院济南2503582.山东师范大学智能信息计算与安全实验室济南2503583.济南技师学院济南2500314.香港理工大学设计学院香港999077基金项目:国家自然科学基金(61902225,61502285) ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
软件定义无线接入网络的组件化研究
徐海东1,2,,,王江2,易辉跃1,21.上海无线通信研究中心上海2018992.中国科学院上海微系统与信息技术研究所上海200050基金项目:上海市自然科学基金(17ZR1428900)，中国科学院创新基金(CXJJ-20S037)详细信息作者简介:徐海东：男，1972年生，高级工程师，研究方向为 ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
面向用户体验的多小区混合非正交多址接入网络资源分配方法
邵鸿翔1,孙有铭2,3,,,蔡佶昊31.洛阳理工学院　洛阳　4710232.中国人民解放军61062部队　北京　1000893.陆军工程大学　南京　210007基金项目:国家自然科学基金(61901518)，河南省科技攻关项目(192102210249)，河南省高等学校重点项目(19B510007) ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
距离相关噪声AOA协同定位下无人机路径优化方法
左燕,,刘雪娇,彭冬亮杭州电子科技大学自动化学院杭州310018基金项目:国家自然科学基金(61673146,61771028,61973102)，电子信息控制重点实验室基金(6142105200102)详细信息作者简介:左燕：女，1980年生，副教授，研究方向为无源定位、目标跟踪、传感器管理刘雪娇 ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
面向射频隐身的组网雷达多目标跟踪下射频辐射资源优化分配算法
时晨光,,丁琳涛,汪飞,周建江南京航空航天大学雷达成像与微波光子教育部重点实验室南京210016基金项目:国家自然科学基金(61801212)，国防科技创新特区资助，中国博士后科学基金面上项目(2019M650113)，江苏省自然科学基金青年基金项目(BK20180423)详细信息作者简介:时晨光： ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
基于双重注意力机制的遥感图像场景分类特征表示方法
徐从安1,2,吕亚飞1,3,,,张筱晗1,4,刘瑜1,崔晨浩5,顾祥岐11.海军航空大学信息融合研究所烟台2640002.清华大学电子工程系北京1000843.91977部队北京1000894.61646部队北京1000895.32144部队渭南714000基金项目:国家自然科学基金(6179055 ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03