多层视频语义概念分析与理解
Analysis and Understanding for Multi-Level Video Semantic Concepts作者机构:南京理工大学计算机科学与技术学院南京210094 成都信息工程学院计算机科学与技术系成都610225
出 版 物:《计算机辅助设计与图形学学报》 (Journal of Computer-Aided Design & Computer Graphics)
年 卷 期:2008年第20卷第1期
页 面:85-92页
核心收录:
学科分类:08[工学] 081203[工学-计算机应用技术] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家自然科学基金(60273035) 四川省教育厅青年基金(2006B063) 成都信息工程学院发展基金(KYTZ20060904)
主 题:视频语义分析 视频语义概念 层次隐马尔可夫模型 多模式融合
摘 要:基于统计学理论,提出了一种视频多粒度语义分析的通用方法,使得多层次语义分析与多模式信息融合得到统一.为了对时域内容进行表示,首先提出一种具有时间语义语境约束的关键帧选取策略和注意力选择模型;在基本视觉语义识别后,采用一种多层视觉语义分析框架来抽取视觉语义;然后应用隐马尔可夫模型(HMM)和贝叶斯决策进行音频语义理解;最后用一种具有两层结构的仿生多模式融合方案进行语义信息融合.实验结果表明,该方法能有效融合多模式特征,并提取不同粒度的视频语义.