基于显著度抠像的图像检索研究与实现
作者单位:大连理工大学
学位级别:硕士
导师姓名:郭禾
授予年度:2011年
学科分类:08[工学] 080203[工学-机械设计及理论] 0802[工学-机械工程]
摘 要:随着Internet网络以及多媒体技术的蓬勃发展,信息爆炸也成为人们越来越需要解决的问题,互联网上每天都会产生大量的多媒体信息、。虽然文本检索取得了一些令人满意的成果,但是对于图像的检索仍然存在很大的挑战性,于是基于内容的图像检索成为国内外研究的热点,如何建立高效准确的图像检索系统成为迫切需要解决的问题。 抠像技术是一种把图像中的前景物体和背景想分离的技术,被广泛的应用于图像处理以及电影和电视的合成领域。传统的图像抠像方法都需要一定的人工参与,通过涂抹或者是颜色的选择为精确的抠像提供帮助。显著度用来表示一幅图像中的某个像素点吸引人的注意力的程度,用一定的数值量化到一幅图像中便就构成了显著度图,数值较大的区域就是显著区域,数值较小的区域是背景区域。一般在人的视野当中,变化较快较迅速的区域吸引人的注意的可能性也会较大。基本上所有的显著度图提取算法都是基于这样一种假设来设计的,在灰度图中,变化较为剧烈的区域会被赋予较大的显著度值,变化较为平缓的区域会被赋予较小的显著度值,于是就形成了显著度图。本文设计了种算法,利用显著度信息、作为辅助条件,实现了非监督的图像抠像,该算法结果优于其他的非监督的图像抠像算法,和监督的抠像算法的结果相当。 在基于内容的图像检索领域,人们的研究重点集中在如何提取出一种对图像放缩、旋转具有不变形的高区分度的底层特征,并取得了丰硕的成果,如sift以及gist在基于内容的图像检索中都得到了广泛的应用。基于sift特征,本文利用词袋模型进行聚类和降维,很大程度的减小了各特征间的相关性,提高了图像匹配的速度和准确度。通过抠像处理,本文可以提取图像中的前景物体的精确空间位置信息,利用空间位置信息以及sift特征,计算出一副图像的全局特征描述符,用于图像之间的匹配和检索。实验表明,本算法在面向对象的图像检索中,有明显的识别率提升。 基于本文算法,设计并实现了一个综合颜色、纹理以及轮廓特征的多特征综合的图像检索系统,该系统在实现了图像的导入、浏览以及相册管理等基本功能外,还实现了基于颜色、轮廓以及纹理的单特征检索和这些特征任意组合的多特征综合检索。通过设置相似度的值,可以动态的调整检索结果中的图像个数。