文献详情 >多元视觉-语义联合嵌入的人-物交互检测网络收藏

多元视觉-语义联合嵌入的人-物交互检测网络

作者：吕学强王晓英韩晶陈玉忠

作者机构：北京信息科技大学网络文化与数字传播北京市重点实验室青海师范大学藏语智能信息处理及应用国家重点实验室

出版物：《计算机辅助设计与图形学学报》 (Journal of Computer-Aided Design & Computer Graphics)

年卷期：2024年

核心收录：

学科分类：08[工学] 081203[工学-计算机应用技术] 080203[工学-机械设计及理论] 0802[工学-机械工程] 0835[工学-软件工程] 0812[工学-计算机科学与技术（可授工学、理学学位）]

基　　金：国家自然科学基金(62171043,62202061) 北京市自然科学基金(4232025) 青海省创新平台建设专项(2022-ZJ-T02) 北京市教委科研计划科技一般项目(KM202311232003)

主　　题：人-物交互语言先验层次视觉图注意力机制

摘要：人-物交互检测对理解以人为中心的场景任务十分重要，但其存在因动词的一词多义带来的视觉偏差问题以及图像的层次信息和语义关系难以合理利用的挑战. 为此，提出多元视觉特征和语言先验联合嵌入的网络，设计了视觉-语义双分支结构. 在视觉分支上，将人-物对中人、对象和交互的多元层次关系在层次视觉融合模块中进行丰富的上下文交换，增加用于关系推理的细粒度的上下文信息; 在语义分支上，将交互三元组标签中的名词、交互动词和三元组短语联合编码成一个语义汇聚一致性图注意网络，进行信息传递和多义感知; 最后通过视觉-语义联合嵌入模块计算视觉和语义之间的拟合程度，得到交互三元组的检测结果. 实验结果表明，在V-COCO数据集上，代理平均精度达到70.7%，角色平均精度达到72.4%; 在HICO-DET数据集上，默认场景下，完整类、罕见类和非罕见类的平均精度分别达到35.91%， 33.65%和36.28%; 所提网络优于对比的网络，在少样本和零样本情况下同样表现出色.

本地馆藏 |

1、借阅数量：每证可借书6册，期刊2册，团体读者证可借书刊300册。 2、借阅时间：个人借期为30天，每本书可续借1次，借期为30天；团体借期为90天。 3、归还地点：3楼服务台、自助借还设备、还书箱、各分馆 4、馆际互借：读者未能在本馆获取所需文献资料，可至参考咨询阅览室服务台填写《南通市图书馆馆际互借读者申请表》，根据馆际互借协议，我馆将为读者向其他馆代借文献。馆际互借过程中所产生的费用（资料复印、邮寄费等），由读者个人承担。 5、服务电话续借：59003605 59003606 咨询：81100100 59003600

电子资源

同方期刊数据库

目录详情 | 试阅读 |

读者评论与其他读者分享你的观点

学校读者

用户名:未登录

我的评分

欢迎您,

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

看过本文的还看了

相关文献

该作者的其他文献

多元视觉-语义联合嵌入的人-物交互检测网络

读者评论与其他读者分享你的观点

请选择收藏分类：

欢迎您,

建议与咨询 留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

看过本文的还看了

相关文献

该作者的其他文献

多元视觉-语义联合嵌入的人-物交互检测网络

读者评论 与其他读者分享你的观点

请选择收藏分类： 新增自定义分类 确定 取消

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

读者评论与其他读者分享你的观点

请选择收藏分类：