基于字典学习的机器人多模态感知技术研究
作者单位:南昌大学
学位级别:硕士
导师姓名:熊鹏文;吴成中
授予年度:2024年
学科分类:080202[工学-机械电子工程] 08[工学] 0804[工学-仪器科学与技术] 0802[工学-机械工程]
摘 要:近年来随着人工智能和传感器技术的不断进步,机器人感知技术迅猛发展,被广泛应用于工业和服务业。物体识别和纹理识别作为机器人感知技术的重要组成部分,可以帮助机器人更准确地理解周围环境,并提高机器人执行任务的精确度和效率,将给人类带来更多便利和帮助。当前机器人感知技术往往需要训练大量的数据以获得准确的感知结果,在处理样本较少的问题时感知效果往往不尽人意。为使机器人能够像人类一样在训练样本很少的情况下实现准确感知,本文针对物体识别和纹理识别问题,提出了两种基于多模态融合的字典学习方法: (1)针对少样本学习的机器人物体识别问题,提出一种判别性支持向量引导的字典学习算法。通过基于特征融合的多模态融合技术获得更准确、更全面的特征,缓解样本量较少的问题。为改善支持向量引导的字典学习模型仅学习原始数据浅层特征的局限性,构建支持向量引导的深度字典学习模型,学习更深层、更抽象的表示,更准确地表征多模态数据。针对支持向量引导的字典学习模型忽略数据空间的局部结构的问题,构造基于字典原子的判别图约束正则化项,同时约束类标签与邻接关系,使编码系数的局部几何结构保持较高的类内相似性与类间差异性,获得带判别性的局部结构,提升模型的判别能力。实验结果表明,面向少样本物体识别问题,本文所提出的判别性支持向量引导的字典学习方法相比于传统方法可达到更好的识别效果。 (2)针对单样本学习的机器人纹理识别问题,提出一种自适应多层字典学习算法。为减少不同材料样本之间的干扰,基于由材料大类到纹理子类的递进学习思想,构建具有多层字典结构的多次学习框架。首先,利用基于特征融合的多模态融合技术减小了字典学习方法对纹理样本量的依赖;然后,通过多层字典学习方法对训练样本进行初次学习,得到每个测试样本的材料标签集;最后,提出局部约束的支持向量引导的字典学习方法识别纹理类别,基于测试样本的材料标签集自适应学习特定的局部约束性字典,聚焦于样本的本质特征。引入局部约束项可选择高度相似的字典原子表示样本,使样本的编码集中在所属类的字典原子上,有效捕捉类别特征,提高模型的鉴别性。实验结果表明,面向单样本纹理识别问题,本文所提出的自适应多层字典学习方法相比于传统方法具有更高的识别精确度。