咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于门机制注意力模型的文本生成图像方法 收藏

基于门机制注意力模型的文本生成图像方法

Text-to-Image Method Based on Attention Model with Increased Gate Mechanism

作     者:陈积泽 姜晓燕 高永彬 CHEN Jize;JIANG Xiaoyan;GAO Yongbin

作者机构:上海工程技术大学电子电气工程学院上海201620 

出 版 物:《计算机工程与应用》 (Computer Engineering and Applications)

年 卷 期:2023年第59卷第12期

页      面:208-216页

核心收录:

学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

基  金:国家自然科学基金重点项目(U2033218) 

主  题:注意力机制 卷积神经网络 生成对抗网络 深度学习 

摘      要:针对传统文本生成图像方法存在生成图像局部纹理单一、边缘细节不清晰和不符合输入文本描述等问题,提出一种门机制注意力模型的文本生成图像方法RAGAN。针对传统方法无法生成细粒度图像的问题,使用增加门机制的注意力模型网络筛选出相关的词向量,并与中间隐藏向量相结合形成新的隐藏向量,再通过生成对抗网络的相互博弈让生成器生成纹理更加丰富、目标物体边缘更加清晰的图像,从而提高图像质量;针对生成图像不符合输入文本描述的问题,使用文本重构提取生成图像中蕴含的深层次的语义特征,与输入文本的语义特征进行对比,通过定义重构损失提高语义一致性。相比于基准模型,在CUB数据集上的Inception Score与R-precision分别提高了9.17%和8.3%,在COCO数据集上的Inception Score与R-precision分别提高了13.67%和5.56%,证明了该模型在保持语义一致性的同时,有效提高了生成图像的真实性和艺术性。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分