基于多尺度Gabor滤波器和BP神经网络的文本检测算法研究-南通市图书馆

文献详情 >基于多尺度Gabor滤波器和BP神经网络的文本检测算法研究收藏

基于多尺度Gabor滤波器和BP神经网络的文本检测算法研究

作者：李萌

作者单位：东北师范大学

学位级别：硕士

导师姓名：吕英华;孔俊

授予年度：2007年

学科分类：081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术（可授工学、理学学位）]

主题：文本检测多尺度Gabor滤波特征选择 BP神经网络纹理分析

摘要：目前,基于内容的图像检索和视频检索所采用的特征基本上是低级视觉的特征,如颜色、纹理和形状,而且往往要人工加入关键词和描述信息,以便于组织信息,这就增加了工作量,同时也引入了人为的主观因素,不利于检索。要达到语义级的基于内容的检索是非常困难的,而彩色图像和视频中的文本字符,是图像高层语义内容的一个重要来源,它包含许多非常重要的有用的信息,如街道名称、商店名称、路标、交通标示、字幕等,这些信息对于图像和视频资料的自动注释、索引、压缩等方面有重要的参考作用。因此,通过对它们的检测、识别和分析,再结合已有的检索技术,就有可能在一定程度上达到概念级的基于内容的图像检索。本文以现有的文本检测算法为基础,通过对文本特征研究现状的分析,实验表明了一些图像文本检测算法的不足之处:实验场景过于单一、鲁棒性差;对光照条件不好的图像处理能力较差等。基于这些问题,提出了一个基于多尺度Gabor滤波器和BP神经网络相结合的文本检测算法。该算法首先对HSI颜色空间中的I分量图像进行预处理,利用Sobel边缘检测算子和基于灰度的区域增长算法对一些可能是文本的区域进行粗定位。其次,对这些候选文本区域进行Gabor滤波。运用多尺度的方法,在Gabor滤波后的子图中提取72个纹理特征。然后,用统计的方法对得到的特征进行筛选。最后,把筛选后的特征作为相应区域的特征向量输入BP神经网络,进行分类,得到真正的文本区域。本文提出的文本检测算法,进一步拓展了Gabor滤波器的研究领域,也显著提高了检测算法的准确性。同时对输入神经网络的纹理特征进行筛选,可以改良BP神经网络固有的训练速度慢的缺点。本文算法不仅准确的检测到了图像中的文本,而且达到了较高的检测率。在多种场景中的文本检测实验中验证了本文方法较现有经典方法而言具有更高的灵活性和鲁棒性,尤其在对图像和视频帧中的文本检测都具有良好的准确性,检测率达到96.3 %。

本地馆藏 |

1、借阅数量：每证可借书6册，期刊2册，团体读者证可借书刊300册。 2、借阅时间：个人借期为30天，每本书可续借1次，借期为30天；团体借期为90天。 3、归还地点：3楼服务台、自助借还设备、还书箱、各分馆 4、馆际互借：读者未能在本馆获取所需文献资料，可至参考咨询阅览室服务台填写《南通市图书馆馆际互借读者申请表》，根据馆际互借协议，我馆将为读者向其他馆代借文献。馆际互借过程中所产生的费用（资料复印、邮寄费等），由读者个人承担。 5、服务电话续借：59003605 59003606 咨询：81100100 59003600

电子资源

同方学位论文库

目录详情 | 试阅读 |

读者评论与其他读者分享你的观点

学校读者

用户名:未登录

我的评分

欢迎您,

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

看过本文的还看了

相关文献

该作者的其他文献

基于多尺度Gabor滤波器和BP神经网络的文本检测算法研究

读者评论与其他读者分享你的观点

请选择收藏分类：

欢迎您,

建议与咨询 留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

看过本文的还看了

相关文献

该作者的其他文献

基于多尺度Gabor滤波器和BP神经网络的文本检测算法研究

读者评论 与其他读者分享你的观点

请选择收藏分类： 新增自定义分类 确定 取消

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

读者评论与其他读者分享你的观点

请选择收藏分类：