咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >自然场景下文本区域定位方法的研究 收藏
自然场景下文本区域定位方法的研究

自然场景下文本区域定位方法的研究

作     者:王毅 

作者单位:哈尔滨工业大学 

学位级别:硕士

导师姓名:高会军

授予年度:2016年

学科分类:08[工学] 080203[工学-机械设计及理论] 0802[工学-机械工程] 

主      题:自然场景 文本定位 笔画宽度转换 文本模型 

摘      要:随着具有拍照功能电子设备的普及,海量的图片和视频文件每时每刻都在产生,自然场景下的文字识别技术能够帮助人们高效、准确的获取图片中的文本信息,因此得到了快速发展。文本定位是文字识别的首要环节,是当前计算机视觉的研究热点之一,具有十分重大的研究意义。本文以自然场景为研究背景,围绕自然场景下的文本目标定位方法展开研究,以字符笔画为基础特征,在前人研究的基础上进行拓展,提出两种自然场景下文本目标定位方法:第一种是基于连通区域的文本定位方法。首先利用笔画宽度转换将原图像转换为笔画宽度图像,对笔画宽度图像进行有条件搜索获取候选字符连通区域,并利用启发式规则过滤候选字符连通区域,之后提取候选字符区域特征,并训练支持向量机(Support Vector Machine)对候选字符区域进行验证,删除非字符区域,再根据文本特点对字符区域进行合并,最终得到文本目标的位置信息。第二种是基于图结构的文本定位模型方法。该模型将字符个体及字符之间关系进行抽象,首先,将候选字符视为图节点,提出平均角度偏差、非噪声分量、笔画宽度向量三大特征,并由此定义字符能量,来表征节点对象是字符的可能性大小;之后,将相邻候选字符间的关系视为图的边,根据字符间的特征相似性定义链接能量,来表征这两个字符属于同一文本的可能性大小;最后,结合字符能量和链接能量定义文本能量,来表征候选文本模型是真实文本概率大小,并通过设定文本能量的阈值来获取最终符合条件的文本目标位置。除此之外,为了使本文方法更有效的获取文本目标的位置信息,提出了一些预处理方法:利用保留非连续性平滑的方法来抑制自然场景中的噪声和部分细小杂质背景;通过彩色图像边缘检测获取尽可能多的文本边缘信息;提出的闭合边缘检测算子则是为了满足基于图结构的文本定位模型三大基础特征获取的条件。在文章的最后,对比了本文提出的算法和其他算法在定位效果上的优劣,提出了本算法的不足以及未来的期望。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分