基于空间结构信息的图像检索技术研究
作者单位:山东师范大学
学位级别:硕士
导师姓名:张化祥
授予年度:2016年
学科分类:08[工学] 080203[工学-机械设计及理论] 0802[工学-机械工程]
主 题:基于内容的图像检索 局部特征描述子 边缘方向检测 角度结构描述子 多趋势结构描述子
摘 要:图像描述了客观物体的视觉信息,是一种重要的媒体表达形式。借助于图像中包含的信息,人类可以更加形象的认知外部世界。随着计算机技术的发展,数字图像的数量呈现爆炸式增长,用户在规模巨大的数据库中找到满足需要的图像已经变得越来越困难,因此,图像检索技术应运而生。如何有效的描述图像视觉特征并找到合适的图像特征表示方式一直是图像检索领域中的核心问题。随着研究的深入,多种图像特征描述子被相继提出,但图像底层特征与高层认知语义之间存在难以跨越的语义鸿沟,这制约了图像检索技术的发展。本文在提取图像底层特征的过程中,结合了人类视觉认知特性,充分利用了图像空间结构信息,提出了三种图像特征描述子。具体研究成果如下:(1)空间结构信息可以有效描述图像特性,本文提出了一种基于图像颜色和边缘方向的图像特征表示方法。该方法结合了图像的颜色信息和边缘方向信息,通过边缘方向检测的方式计算边缘方向角度值。基于上述两种特征的分析,该方法根据中心像素点与周围像素点在位置关系上的差异,为每个像素点计算特征值。最后求和得到整幅图像中具有相同特征值的像素点个数,构建特征直方图。该方法利用空间结构信息,详细区分了像素点间不同的位置关系,有效的描述了图像的颜色分布和空间特性,提高了图像检索准确率和召回率。(2)从微观上看,图像由许多局部结构共同构成。局部结构中包含了图像的空间特性,适合分析图像内容。有研究指出人类视觉对图像中的角度变化十分敏感。基于上述分析,本文提出了一种图像特征描述子,命名为角度结构描述子(ASD)。ASD以定义的三种不同方向的角度结构作为桥梁提取图像特征。基于颜色信息,ASD利用角度结构探测图像,并提取角度结构中像素点之间的相互关系,以此构建特征向量。ASD在一定程度上模仿了人类视觉处理过程,能够有效描述多种视觉特征。实验表明,ASD对图像具有良好的区分能力,能够改善图像检索效果。(3)生物学家认为人类视觉认知机制有助于认知图像,该机制分为视觉注意阶段和视觉认知阶段。前一阶段用于提取多种视觉特征信息;后一阶段感受来自视觉信息的刺激并形成对图像的认知。受到该理论启发,本文提出了一种新的图像特征描述子,命名为多趋势结构描述子(MTSD)。MTSD基于局部结构中定义的三种趋势变化,能够深入挖掘局部结构中存在的内部关系。借助于构建的颜色信息图、边缘方向信息图和密度信息图,MTSD使用三种趋势变化探测图像,其更加符合人类视觉认知机制。实验表明,MTSD能够更好的描述图像细节,提高特征描述子对图像的分辨能力。