咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >视听融合耦合坐标自注意的单目深度估计 收藏

视听融合耦合坐标自注意的单目深度估计

作     者:马存良 蒲江川 许春冬 易见兵 嘉明珍 

作者机构:江西理工大学信息工程学院 

出 版 物:《计算机辅助设计与图形学学报》 (Journal of Computer-Aided Design & Computer Graphics)

年 卷 期:2024年

核心收录:

学科分类:08[工学] 080203[工学-机械设计及理论] 0802[工学-机械工程] 

基  金:国家自然科学基金(11864016) 江西省自然科学基金(20224BAB211012) 江西省教育厅科技项目(GJJ210828) 

主  题:单目深度估计 视听融合 池化金字塔模块 自注意力 

摘      要:针对单目图片和声音回波信号都含空间信息这一特点, 提出一种视听融合的单目深度估计方法. 首先, 通过池化金字塔模块融合分析回波与材料特征来自适应估计单目图片的离散深度值; 然后, 采用卷积神经网络和Transformer相结合的方法对单目图片进行编码, 改进坐标注意力提出坐标自注意力模块对图片特征解码获得离散深度值的概率分布; 最后, 将像素点的深度值建模为离散深度值的期望来构建最终深度图. 实验结果表明, 在仿真数据集Replica和Matterport3D数据集上, 所提方法的均方根误差分别为0.205和0.875, 相对误差分别为0.095和0.161, 均取得具有竞争力的结果; 在真实数据和含噪声数据中, 该方法能够应用于真实场景的深度估计.

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分