多层次MSER自然场景文本检测
Natural scene text detection based on multi-level MSER作者机构:哈尔滨工业大学计算机科学与技术学院黑龙江哈尔滨150001 哈尔滨工业大学媒体技术与艺术系黑龙江哈尔滨150001
出 版 物:《浙江大学学报(工学版)》 (Journal of Zhejiang University:Engineering Science)
年 卷 期:2016年第50卷第6期
页 面:1134-1140页
核心收录:
学科分类:08[工学] 080203[工学-机械设计及理论] 0802[工学-机械工程]
基 金:国家自然科学基金资助项目(61073125 61350004) 中央高校基本科研业务费专项资金资助项目(HIT.NSRIF.2013091 HIT.HSS.201407)
主 题:自然场景文本检测 多层次最大稳定极值区域(MSER) 卷积神经网络(CNN) 随机森林回归器
摘 要:提出一种新的基于多层次最大稳定极值区域(MSER)的自然场景文本检测方法,其由候选区域的提取和文本检测组成.在候选区域提取过程中,采用多层次MSER区域提取方法:通过对原始图像进行多个颜色空间变换和多尺度放缩得到多个变换后的图像,采用多个阈值对其进行MSER区域检测,并将检测到的区域作为候选区域用于文本检测.检测过程中,对候选区域提取手工设计的底层特征和基于卷积神经网络(CNN)的深层特征,训练一个随机森林回归器对特征进行分类得到字符区域,再将其合并成单词区域,并进行相似的特征提取和分类,从而得到最终的文本检测结果.使用2个标准的数据库(ICDAR2011和ICDAR2013)对提出的方法进行性能评价,F指标在ICDAR2011和ICDAR2013上均为0.79,表明了所提出的自然场景文本检测方法的有效性.