自然场景下文本区域定位方法的研究-南通市图书馆

文献详情 >自然场景下文本区域定位方法的研究收藏

自然场景下文本区域定位方法的研究

作者：王毅

作者单位：哈尔滨工业大学

学位级别：硕士

导师姓名：高会军

授予年度：2016年

学科分类：08[工学] 080203[工学-机械设计及理论] 0802[工学-机械工程]

主题：自然场景文本定位笔画宽度转换文本模型

摘要：随着具有拍照功能电子设备的普及,海量的图片和视频文件每时每刻都在产生,自然场景下的文字识别技术能够帮助人们高效、准确的获取图片中的文本信息,因此得到了快速发展。文本定位是文字识别的首要环节,是当前计算机视觉的研究热点之一,具有十分重大的研究意义。本文以自然场景为研究背景,围绕自然场景下的文本目标定位方法展开研究,以字符笔画为基础特征,在前人研究的基础上进行拓展,提出两种自然场景下文本目标定位方法:第一种是基于连通区域的文本定位方法。首先利用笔画宽度转换将原图像转换为笔画宽度图像,对笔画宽度图像进行有条件搜索获取候选字符连通区域,并利用启发式规则过滤候选字符连通区域,之后提取候选字符区域特征,并训练支持向量机(Support Vector Machine)对候选字符区域进行验证,删除非字符区域,再根据文本特点对字符区域进行合并,最终得到文本目标的位置信息。第二种是基于图结构的文本定位模型方法。该模型将字符个体及字符之间关系进行抽象,首先,将候选字符视为图节点,提出平均角度偏差、非噪声分量、笔画宽度向量三大特征,并由此定义字符能量,来表征节点对象是字符的可能性大小;之后,将相邻候选字符间的关系视为图的边,根据字符间的特征相似性定义链接能量,来表征这两个字符属于同一文本的可能性大小;最后,结合字符能量和链接能量定义文本能量,来表征候选文本模型是真实文本概率大小,并通过设定文本能量的阈值来获取最终符合条件的文本目标位置。除此之外,为了使本文方法更有效的获取文本目标的位置信息,提出了一些预处理方法:利用保留非连续性平滑的方法来抑制自然场景中的噪声和部分细小杂质背景;通过彩色图像边缘检测获取尽可能多的文本边缘信息;提出的闭合边缘检测算子则是为了满足基于图结构的文本定位模型三大基础特征获取的条件。在文章的最后,对比了本文提出的算法和其他算法在定位效果上的优劣,提出了本算法的不足以及未来的期望。

本地馆藏 |

1、借阅数量：每证可借书6册，期刊2册，团体读者证可借书刊300册。 2、借阅时间：个人借期为30天，每本书可续借1次，借期为30天；团体借期为90天。 3、归还地点：3楼服务台、自助借还设备、还书箱、各分馆 4、馆际互借：读者未能在本馆获取所需文献资料，可至参考咨询阅览室服务台填写《南通市图书馆馆际互借读者申请表》，根据馆际互借协议，我馆将为读者向其他馆代借文献。馆际互借过程中所产生的费用（资料复印、邮寄费等），由读者个人承担。 5、服务电话续借：59003605 59003606 咨询：81100100 59003600

电子资源

同方学位论文库

目录详情 | 试阅读 |

读者评论与其他读者分享你的观点

学校读者

用户名:未登录

我的评分

欢迎您,

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

看过本文的还看了

相关文献

该作者的其他文献

自然场景下文本区域定位方法的研究

读者评论与其他读者分享你的观点

请选择收藏分类：

欢迎您,

建议与咨询 留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

看过本文的还看了

相关文献

该作者的其他文献

自然场景下文本区域定位方法的研究

读者评论 与其他读者分享你的观点

请选择收藏分类： 新增自定义分类 确定 取消

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

读者评论与其他读者分享你的观点

请选择收藏分类：