一种由粗至精的RGB-D室内场景语义分割方法
Coarse-to-Fine semantic parsing method for RGB-D indoor scenes作者机构:南京邮电大学江苏省图像处理与图像通信重点实验室南京210003 罗彻斯特大学计算机科学系美国罗彻斯特14627
出 版 物:《东南大学学报(自然科学版)》 (Journal of Southeast University:Natural Science Edition)
年 卷 期:2016年第46卷第4期
页 面:681-687页
核心收录:
学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家自然科学基金资助项目(31200747 61001152 61071091 61071166 61172118) 江苏省自然科学基金资助项目(BK2010523 BK2012437) 南京邮电大学校级科研基金资助项目(NY210069 NY214037) 国家留学基金资助项目 教育部互联网应用创新开放平台示范基地(气象云平台及应用)资助项目(KJRP1407)
主 题:RGB-D室内场景 语义分割 SLIC过分割 稠密CRFs 递归式反馈
摘 要:为了标注室内场景中可见物体,提出一种基于RGB-D数据由粗至精的室内场景语义分割方法.首先,利用分层显著度导引的简单线性迭代聚类过分割和鲁棒多模态区域特征,构建面向语义类别的超像素区域池,基于随机决策森林分类器判决各个超像素区域的语义类别,实现粗粒度区域级语义标签推断.然后,为了改善粗粒度级的语义标签,利用几何深度导引和内部反馈机制改进像素级稠密全连接条件随机场模型,以求精细粒度像素级语义标注.最后,在粗、细粒度语义标注之间引入全局递归式反馈,渐进式迭代更新室内场景的语义类别标签.2个公开的RGBD室内场景数据集上的实验结果表明,与其他方法相比,所提出的语义分割方法无论在主观还是客观评估上,均具有较好的效果.