咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >静态图像中文字提取关键技术研究 收藏
静态图像中文字提取关键技术研究

静态图像中文字提取关键技术研究

作     者:戴志明 

作者单位:华中科技大学 

学位级别:硕士

导师姓名:黄金国

授予年度:2011年

学科分类:08[工学] 080203[工学-机械设计及理论] 0802[工学-机械工程] 

主      题:文字检测 文字分割 二值化 文字倾斜校正 

摘      要:随着计算机和网络技术的发展,越来越多的信息以多媒体的形式出现,图像在其中占据着相当的比例,因而图像内容的分类和识别越来越引起人们的重视。图像中出现的文字包含着丰富的信息,对图像内容的起着诠释的作用。提取和识别其中的文字对图像的理解、视频内容的分析、智能交通、机器视觉等方面有着重要的意义。由于图像中的文字通常存在较为复杂的背景干扰,使得通用的OCR系统不能直接对复杂背景中的文字进行识别,因此,如何从复杂背景中提取文字成为解决这一问题的主要难点。近些年来,不少学者在这方面做了大量的研究,也取得了阶段性的成果,但是,由于图像的复杂性和内容的多变性,造成这一问题还没有达到人们期望的要求,仍然有不少问题需要进一步的研究。 本文以提取静态图像中存在复杂背景的文字为主要研究内容,重点讨论如何利用文字的笔画纹理特征区别图像中的文字与非文字两种模式类,如何将文字从复杂的背景中分割出来,以及文字倾斜校正的方法。主要工作如下: 采用粗检测——确认的文字检测方法,设计出了一种健壮的文字检测方法。在确认阶段使用SVM对候选文字块进行确认,实验结果表明该方法具有较好的适应性和准确性。 在对文字进行分割的过程中,结合文字图像中文字的特点,提出了对待分割文字区域进行有针对性的直方图均衡化方法,以达到对文字区域的增强。在此基础上研究一种全局阀值和局部阀值相结合的方法对文字图像进行二值化,有效的弥补了单纯使用全局阀值或局部阀值所存在的问题。 在分析经典的基于Hough变换和Radom变换的倾斜校正的方法之后,发现图像中文字不满足上述两者的基本要求,设计出一种多方向投影的方法检测文字的倾斜角度,达到了商用OCR系统在识别文字时对文字的倾斜角度要求。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分