基于多层字典稀疏重构的图像显著性检测
作者单位:大连理工大学
学位级别:硕士
导师姓名:戚金清
授予年度:2017年
学科分类:08[工学] 080203[工学-机械设计及理论] 0802[工学-机械工程]
摘 要:根据一副图像分析周围场景是计算机视觉领域中的一个重要挑战,为了实现这一目标,学习图像的视觉显著性信息是最基本的一步。因此,近年来图像显著性检测逐渐成为了计算机视觉领域的科研重点之一。其目标是识别场景中最重要,包含信息最多的部分,通常也是人们在观察一幅图像时,最先关注的部分,并将检测结果用一幅趋近二值化的灰度图表示出来。受到图像信号自身及其语义的稀疏特征启发,本文提出了一种基于多层字典稀疏表达的图像显著性检测算法。该算法首先通过简单的线性迭代聚类将图像分割成超像素。然后根据中心先验选择部分背景超像素来训练背景字典,通过该字典和正交匹配追踪算法来计算所有超像素的重构误差,并将其定义为各超像素的显著性值。最后结合K近邻平滑和多尺度融合算法得到最终的像素级显著图。在字典学习的部分,本文算法将每一尺度的背景字典代入下一尺度,从而使除第一尺度外所有尺度均可以得到一个多层字典。得到显著图后,再将其与目标定位算法相结合,选择最显著的部分超像素来训练前景字典,重新进行检验。相对于依据中心先验得到的背景字典,前景字典更具有代表性,因此经过该处理过程,可以得到一幅效果更好的显著图。本文将这一步骤总结为一个性能增强框架,用来提升显著性检测算法的检验效果。此外,该框架还适用于大部分经典算法甚至部分近期提出的优秀算法。在实验过程中,本文将所提出的检测算法与性能增强框架在五个最具有代表性的图像显著性检测数据库中进行了测试,并将测试结果与现有的多种经典算法做了对比。实验结果表明,本文所提出的算法能较全面而准确地突出显著性目标。