基于视频模型的镜头分割及关键帧提取算法研究
作者单位:吉林大学
学位级别:硕士
导师姓名:付平
授予年度:2007年
学科分类:08[工学] 080203[工学-机械设计及理论] 0802[工学-机械工程]
摘 要:随着Internet的应用和普及,多媒体信息检索系统对社会各领域产生越来越大的影响。传统的信息检索采用基于文本的检索方式,查询时需要说明文本特征,要求用户对文本特征的描述具有一定的准确性和规范性。但由于视频数据的丰富内涵以及人们对视频内容进行抽取的主观性,视频信息难以用几个关键词描述。因此,基于内容的视频检索应运而生。 基于内容的视频检索通常有两种方法。一种方法是把视频信息看作是独立的帧或图像的集合,利用图像检索的方法进行视频索引和检索。这种方法的缺点是忽略了视频帧之间的时序关系,而且需要处理大量的图像。另一种方法是把视频序列分成若干组镜头,索引和检索针对镜头中有代表性的关键帧进行,该方法是目前研究的热点。 本文主要研究的目标是第二种方法中的两个主要问题:镜头边界检测和关键帧提取。 首先结合视频的编辑模型,针对几种常见的镜头切换方式:切变、淡入、淡出及溶解,分别讨论了其常见的特征向量,然后针对这几种特征向量的不足,作了部分改进。针对切变镜头,本文选取直方图作为切变特征向量,提出了一种基于滑窗的自适应阈值方法,该算法能避免靠经验和实验分析来选取阈值的局限性,增强了算法的鲁棒性;针对淡入、淡出变换,本文在利用前人对亮度方差二阶差分曲线的负峰值进行检测的同时,提出了同时利用另外一种特征向量——亮度均值的一阶差分图像作为判断的依据,同时结合两种特征对镜头进行检测,有效地消除了运动带来的误检;针对溶解变换,提出了采用亮度方差的一阶差分作为特征向量,通过检验特征向量曲线的过零率来检测镜头变换的方法。接下来对于镜头关键帧的提取,本文提出了一种基于内容分析的关键帧提取算法,该算法结合镜头内帧间距离和镜头内帧直方图的差方,能够根据镜头内容的复杂度自动选取关键帧数目和合适的关键帧,达到了自动分析的目的。