基于特征变换和度量网络的小样本学习算法
Feature Transformation and Metric Networks for Few-shot Learning作者机构:中国科学技术大学合肥230026 中国科学院自动化研究所模式识别国家重点实验室北京100190 阿里巴巴科技(北京)有限公司北京100016
出 版 物:《自动化学报》 (Acta Automatica Sinica)
年 卷 期:2024年第50卷第7期
页 面:1305-1314页
核心收录:
学科分类:0810[工学-信息与通信工程] 1205[管理学-图书情报与档案管理] 12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 08[工学] 081104[工学-模式识别与智能系统] 080203[工学-机械设计及理论] 0835[工学-软件工程] 0802[工学-机械工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家重点研发计划(2018AAA0102802) 国家自然科学基金(62036011,62192782,61721004) 中国科学院前沿科学重点研究计划(QYZDJ-SSW-JSC040)资助
摘 要:在小样本分类任务中,每个类别可供训练的样本数量非常有限.因此在特征空间中同类样本分布稀疏,异类样本间边界模糊.提出一种新的基于特征变换和度量网络(Feature transformation and metric networks,FTMN)的小样本学习算法用于小样本分类任务.算法通过嵌入函数将样本映射到特征空间,并计算输入该样本与所属类别中心的特征残差.构造一个特征变换函数对该残差进行学习,使特征空间内的样本特征经过该函数后向同类样本中心靠拢.利用变换后的样本特征更新类别中心,使各类别中心间的距离增大.算法进一步构造了一种新的度量函数,对样本特征中每个局部特征点的度量距离进行联合表达,该函数能够同时对样本特征间的夹角和欧氏距离进行优化.算法在小样本分类任务常用数据集上的优秀表现证明了算法的有效性和泛化性.