空间音频编码及多声道音频恢复技术研究-南通市图书馆

文献详情 >空间音频编码及多声道音频恢复技术研究收藏

空间音频编码及多声道音频恢复技术研究

作者：赵毅

作者单位：北京理工大学

学位级别：硕士

导师姓名：王晶

授予年度：2015年

学科分类：0810[工学-信息与通信工程] 08[工学] 081002[工学-信号与信息处理]

主题：参数立体声多声道音频 G.719编码器张量数据挖掘 Mushra测试

摘要：随着人们对影音娱乐需求的不断提高，临场感通信不断走进人们的生活。音频信号也由最初的单声道发展到多声道音频如22.2声道甚至更多声道，这些变化所带给人们的空间感也逐渐增强。但随着声道数量的增加，传输带宽会受到限制，立体声、多声道音频的传输成为关键问题。如何利用较低的码率实现较高质量的编码传输是我们需要考虑的重要问题。 ITU标准组织针对此问题在2008年提出了一种应用于视频会议等交互式通信场景的低复杂度、全频带的音频编码标准G.719(G.722.1-FB)。该编码算法基于变换编码，采用了自适应时间分辨率、自适应比特分配和晶格矢量量化、Huffman编码等先进技术，具有复杂度低、低比特透明传输等特点本文详细介绍了常见的立体声、多声道编解码技术，ITU-T标准组织针对高清语音和音频通讯的需求，提出在G.719的编解码器增加立体声及多声道模块，对G.719进行立体声、多声道扩展。本文将Opus编码器中的CELT层立体声编码思想引入到G.719编解码器中，此外鉴于空间参数编码可以将多声道信号压缩，使其所占存储空间与带宽进一步降低，以实现高效的存储和传输，所以本文将空间参数编码技术应用到G.719编码器中，实现G.719编码器的立体声及多声道音频扩展。主观听音实验结果表明，该空间参数编码方法能够获得较高的立体声、多声道音频编码增益。此外，近年来国内外对于张量的数据挖掘机理有了一定研究，将其应用于医学图像、视频图像及交通数据等领域，并取得了较为理想的实验结果。本文基于张量CP(Candecomp/Parafac)分解的加权最优化算法对数据缺失的5.1声道音频文件进行信号内容层面的预测恢复，并利用Mushra(Multiple Stimuli with Hidden Reference andAnchor)测试方法对恢复得到的5.1声道音频文件进行测试。实验结果表明，该算法能够获得较好的音频恢复质量。

本地馆藏 |

1、借阅数量：每证可借书6册，期刊2册，团体读者证可借书刊300册。 2、借阅时间：个人借期为30天，每本书可续借1次，借期为30天；团体借期为90天。 3、归还地点：3楼服务台、自助借还设备、还书箱、各分馆 4、馆际互借：读者未能在本馆获取所需文献资料，可至参考咨询阅览室服务台填写《南通市图书馆馆际互借读者申请表》，根据馆际互借协议，我馆将为读者向其他馆代借文献。馆际互借过程中所产生的费用（资料复印、邮寄费等），由读者个人承担。 5、服务电话续借：59003605 59003606 咨询：81100100 59003600

电子资源

同方学位论文库

目录详情 | 试阅读 |

读者评论与其他读者分享你的观点

学校读者

用户名:未登录

我的评分

欢迎您,

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

看过本文的还看了

相关文献

该作者的其他文献

空间音频编码及多声道音频恢复技术研究

读者评论与其他读者分享你的观点

请选择收藏分类：

欢迎您,

建议与咨询 留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

看过本文的还看了

相关文献

该作者的其他文献

空间音频编码及多声道音频恢复技术研究

读者评论 与其他读者分享你的观点

请选择收藏分类： 新增自定义分类 确定 取消

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

读者评论与其他读者分享你的观点

请选择收藏分类：