基于多维矢量矩阵的最优变换的研究
作者单位:吉林大学
学位级别:硕士
导师姓名:陈贺新;桑爱军
授予年度:2012年
学科分类:08[工学] 080203[工学-机械设计及理论] 0802[工学-机械工程]
摘 要:随着网络技术的高速发展与数字通信的日趋成熟,人们对图像和视频的依赖程度越来越高。图像和视频作为信息量最大的载体与人们的生活是密不可分的。然而未经过压缩的图像和视频的数据量非常庞大,所以需要对图像和视频进行压缩编码来满足存储空间与传输带宽的要求,因此,图像和视频的压缩编码技术便成为解决问题的关键。基于多维矢量矩阵模型的图像和视频编码技术是多媒体领域中一种有效的压缩编码技术。K-L变换是对连续随机过程作为级数展开而引出的,它作为图像压缩编码技术中的最优变换,每幅图像的统计特性均不相同,故有不同的变换核矩阵,可以完全消除图像信号中像素之间的相关性。 本实验室已经提出了多维矢量矩阵的数学模型,并归纳总结了多维矢量矩阵的完整定义和基本数学运算准则。本文结合线性代数相关理论及多维矢量矩阵模型,创新性地提出了多维矢量矩阵的伴随矩阵、行列式、逆矩阵的定义和相关性质,完善了多维矢量矩阵逆过程中的相关数学概念,并采用多维矢量矩阵的乘法准则来验证其定义的正确性。同时提出了多维矢量矩阵的特征值与特征向量的定义,为基于多维矢量矩阵的最优变换过程奠定了理论基础。最后结合最优变换的算法和多维矢量矩阵的模型得到了基于多维矢量矩阵的最优变换。多维矢量矩阵经过最优变换后得到的变换系数矩阵满足其正交性和能量集中性。因此该方法实现了在均方误差最小的条件下基于多维矢量矩阵的最优变换,为多维图像和视频数据的处理奠定了坚实的数学基础。 本实验利用Visual C++6.0编程实现多维矢量矩阵的逆过程和基于多维矢量矩阵的最优变换,并对实验结果进行了总结和分析。本文选用的是YUV格式的8视角视频,对其Y、U、V各个分量进行分块后,重新对8个通道的数据组合进行最优变换。由于普通的视频数据都是三维的,而本文引用的视频数据多了视角,因此是四维数据。最后对变换系数矩阵进行正交性和能量集中性分析,最优变换与其他变换相比较可以在均方误差最小的条件下完全恢复原始图像。本文创新性地将多维矢量矩阵模型应用到多视角视频的最优变换编码中,可以处理任意阶数的多维矢量方阵,获得了视频数据的最优变换,但同时也带来了庞大的计算量和复杂度。通过实验结果验证出本文算法的有效性及可行性,但该算法还有尚未完善和有待改进的部分,会在后续的研究中改进。本文研究内容是在国家自然科学基金项目(项目号:60911130128)的支持下进行的。