多失真图像盲质量评估算法研究
作者单位:华东师范大学
学位级别:硕士
导师姓名:王慈
授予年度:2019年
学科分类:08[工学] 080203[工学-机械设计及理论] 0802[工学-机械工程]
主 题:图像质量评估 多失真 无参考 自然场景统计 视觉码本 局部二进制模式
摘 要:图像在端到端的压缩和传输过程中会引入各种各样的失真,失真导致了图像质量的下降,因此在接收端对已收到的图像进行质量评估可以量化多媒体压缩和传输系统的性能。图像质量评估(Image Quality Assessment)已有较长的研究历史,起初人们主要研究只包含一种失真类型的单失真图像,但由于现实生活中图像往往受到多种失真类型影响,因此近年来多失真质量评估受到关注。相较于单失真,多失真质量评估更具应用价值,也更具挑战性。本文聚焦于更富挑战性的多失真图像质量评估问题,针对多失真图像质量评估算法准确率和泛化能力还需提高的事实,提出了一种基于MOS(Mean Opinion Score)训练的算法和一种无MOS训练的算法。基于MOS训练的算法用于解决准确率问题,无MOS训练的方法用于解决泛化能力问题。基于MOS训练的算法中我们提出了一种多失真质量评价的新思路。这是因为我们考虑到多种失真类型对图像造成的破坏可以概括为真实细节损失和冗余细节增加,细节损失和细节增加之间的视觉掩膜效应不利于质量评估。据此,首先将失真图像分解为细节损失图和细节冗余图,并分别为其设计特征表示,然后融合两种特征表示形成新的特征向量,最后基于SVR(Support Vector Regression)训练了图像质量预测模型。基于MOS训练的算法其泛化能力一般较弱,因此在该算法的基础上我们又提出了一种泛化能力更强的无MOS训练方法。该无MOS方法属于质量评估领域挑战难度较大的全盲方法,它无需MOS分数即可工作,这在很大程度上省却了耗时费力的主观质量评价工作。该方法首先基于感知相关的特征构建了质量已知的多失真视觉码本,然后统计码本中每个视觉单词对质量的贡献比重,最后加权每个视觉单词的质量分数推理全图质量分数。本文提出的基于MOS训练的算法在四个公开数据集的平均准确率比当下最好的算法GWH-GLBP提高了3%,提出的无MOS算法在三个公开多失真数据集的平均泛化能力比GWH-GLBP高了14%。实验结果表明本文两种算法与人眼主观评价具有更好的一致性。