咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >面向视觉数据处理与分析的解耦表示学习综述 收藏

面向视觉数据处理与分析的解耦表示学习综述

A review of disentangled representation learning for visual data processing and analysis

作     者:李雅婷 肖晶 廖良 王正 陈文益 王密 Li Yating;Xiao Jing;Liao Liang;Wang Zheng;Chen Wenyi;Wang Mi

作者机构:武汉大学计算机学院国家多媒体软件工程技术研究中心武汉430072 日本国立信息学研究所数字内容和媒体科学研究部东京101-8430日本 武汉大学测绘遥感信息工程国家重点实验室武汉430079 

出 版 物:《中国图象图形学报》 (Journal of Image and Graphics)

年 卷 期:2023年第28卷第4期

页      面:903-934页

核心收录:

学科分类:08[工学] 081201[工学-计算机系统结构] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

基  金:湖北省自然科学基金项目(2020CFA001) 湖北省重点研发计划项目(2020BIB006) 

主  题:解耦表示学习 视觉数据 潜在表征 变化因素 潜空间 

摘      要:表示学习是机器学习研究的核心问题之一。机器学习算法的输入表征从过去主流的手工特征过渡到现在面向多媒体数据的潜在表示,使算法性能获得了巨大提升。然而,视觉数据的表示通常是高度耦合的,即输入数据的所有信息成分被编码进同一个特征空间,从而互相影响且难以区分,使得表示的可解释性不高。解耦表示学习旨在学习一种低维的可解释性抽象表示,可以识别并分离出隐藏在高维观测数据中的不同潜在变化因素。通过解耦表示学习,可以捕获到单个变化因素信息并通过相对应的潜在子空间进行控制,因此解耦表示更具有可解释性。解耦表征可用于提高样本效率和对无关干扰因素的容忍度,为数据中的复杂变化提供一种鲁棒性表示,提取的语义信息对识别分类、域适应等人工智能下游任务具有重要意义。本文首先介绍并分析解耦表示的研究现状及其因果机制,总结解耦表示的3个重要性质。然后,将解耦表示学习算法分为4类,并从数学描述、类型特点及适用范围3个方面进行归纳及对比。随后,分类总结了现有解耦表示工作中常用的损失函数、数据集及客观评估指标。最后,总结了解耦表示学习在实际问题中的各类应用,并对其未来发展进行了探讨。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分