咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >视觉问答技术研究 收藏

视觉问答技术研究

Research on Visual Question Answering Techniques

作     者:俞俊 汪亮 余宙 Yu Jun;Wang Liang;and Yu Zhou

作者机构:杭州电子科技大学计算机学院杭州310018 复杂系统建模与仿真教育部重点实验室(杭州电子科技大学)杭州310018 

出 版 物:《计算机研究与发展》 (Journal of Computer Research and Development)

年 卷 期:2018年第55卷第9期

页      面:1946-1958页

核心收录:

学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

基  金:国家自然科学基金优秀青年基金项目(61622205)~~ 

主  题:视觉问答 见觉推理 见频问答 深度学习 知识网络 

摘      要:随着深度学习在计算机视觉、自然语言处理领域取得的长足进展,现有方法已经能准确理解视觉对象和自然语言的语义,并在此基础上开展跨媒体数据表达与交互研究.近年来,视觉问答(visual question answering,VQA)是跨媒体表达与交互方向上的研究热点问题.视觉问答旨在让计算机理解图像内容后根据自然语言输入的查询进行自动回答.围绕视觉问答问题,从概念、模型、数据集等方面对近年来的研究进展进行综述,同时探讨现有工作存在的不足;最后从方法论、应用和平台等多方面对视觉问答未来的研究方向进行了展望.

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分