静态图像中文字提取关键技术研究-南通市图书馆

文献详情 >静态图像中文字提取关键技术研究收藏

静态图像中文字提取关键技术研究

作者：戴志明

作者单位：华中科技大学

学位级别：硕士

导师姓名：黄金国

授予年度：2011年

学科分类：08[工学] 080203[工学-机械设计及理论] 0802[工学-机械工程]

主题：文字检测文字分割二值化文字倾斜校正

摘要：随着计算机和网络技术的发展,越来越多的信息以多媒体的形式出现,图像在其中占据着相当的比例,因而图像内容的分类和识别越来越引起人们的重视。图像中出现的文字包含着丰富的信息,对图像内容的起着诠释的作用。提取和识别其中的文字对图像的理解、视频内容的分析、智能交通、机器视觉等方面有着重要的意义。由于图像中的文字通常存在较为复杂的背景干扰,使得通用的OCR系统不能直接对复杂背景中的文字进行识别,因此,如何从复杂背景中提取文字成为解决这一问题的主要难点。近些年来,不少学者在这方面做了大量的研究,也取得了阶段性的成果,但是,由于图像的复杂性和内容的多变性,造成这一问题还没有达到人们期望的要求,仍然有不少问题需要进一步的研究。本文以提取静态图像中存在复杂背景的文字为主要研究内容,重点讨论如何利用文字的笔画纹理特征区别图像中的文字与非文字两种模式类,如何将文字从复杂的背景中分割出来,以及文字倾斜校正的方法。主要工作如下: 采用粗检测——确认的文字检测方法,设计出了一种健壮的文字检测方法。在确认阶段使用SVM对候选文字块进行确认,实验结果表明该方法具有较好的适应性和准确性。在对文字进行分割的过程中,结合文字图像中文字的特点,提出了对待分割文字区域进行有针对性的直方图均衡化方法,以达到对文字区域的增强。在此基础上研究一种全局阀值和局部阀值相结合的方法对文字图像进行二值化,有效的弥补了单纯使用全局阀值或局部阀值所存在的问题。在分析经典的基于Hough变换和Radom变换的倾斜校正的方法之后,发现图像中文字不满足上述两者的基本要求,设计出一种多方向投影的方法检测文字的倾斜角度,达到了商用OCR系统在识别文字时对文字的倾斜角度要求。

本地馆藏 |

1、借阅数量：每证可借书6册，期刊2册，团体读者证可借书刊300册。 2、借阅时间：个人借期为30天，每本书可续借1次，借期为30天；团体借期为90天。 3、归还地点：3楼服务台、自助借还设备、还书箱、各分馆 4、馆际互借：读者未能在本馆获取所需文献资料，可至参考咨询阅览室服务台填写《南通市图书馆馆际互借读者申请表》，根据馆际互借协议，我馆将为读者向其他馆代借文献。馆际互借过程中所产生的费用（资料复印、邮寄费等），由读者个人承担。 5、服务电话续借：59003605 59003606 咨询：81100100 59003600

电子资源

同方学位论文库

目录详情 | 试阅读 |

读者评论与其他读者分享你的观点

学校读者

用户名:未登录

我的评分

欢迎您,

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

看过本文的还看了

相关文献

该作者的其他文献

静态图像中文字提取关键技术研究

读者评论与其他读者分享你的观点

请选择收藏分类：

欢迎您,

建议与咨询 留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

看过本文的还看了

相关文献

该作者的其他文献

静态图像中文字提取关键技术研究

读者评论 与其他读者分享你的观点

请选择收藏分类： 新增自定义分类 确定 取消

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

读者评论与其他读者分享你的观点

请选择收藏分类：