咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于多奖励强化学习的半监督文本风格迁移方法 收藏

基于多奖励强化学习的半监督文本风格迁移方法

Semi-supervised Text Style Transfer Method Based on Multi-reward Reinforcement Learning

作     者:李静文 叶琪 阮彤 林宇翩 薛万东 LI Jingwen;YE Qi;RUAN Tong;LIN Yupian;XUE Wandong

作者机构:华东理工大学计算机科学与工程学院上海200237 

出 版 物:《计算机科学》 (Computer Science)

年 卷 期:2024年第51卷第8期

页      面:263-271页

学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

基  金:上海市促进产业高质量发展专项资金(2021-GZL-RGZN-01018) 国家重点研发计划(2021YFC2701800,2021YFC2701801) 

主  题:文本生成 文本风格迁移 多阶段训练 风格标注模型 强化学习 

摘      要:文本风格迁移是自然语言处理中的一项重要任务,其主要目的在于改变文本的风格属性,同时保留必要的语义信息。然而,在许多任务缺乏大规模平行语料库的情况下,现有的无监督方法存在文本多样性不足和语义一致性较差的问题。针对这些问题,文中提出了一种半监督的多阶段训练框架。该框架首先利用风格标注模型和掩码语言模型构造伪平行语料库,以有监督的方式引导模型学习多样性的迁移方式。其次,设计了对抗性相似奖励、Mis奖励和风格奖励,从未标记的数据中进行强化学习以增强模型的语义一致性、逻辑一致性和风格准确性。在基于YELP数据集的情感极性转换任务中,该方法的BLEURT分数提升了3.1%,Mis分数提升了2.5%,BLEU分数提升了9.5%;在基于GYAFC数据集的正式文体转换实验中,该方法的BLEURT分数提高了6.2%,BLEU分数提高了3%。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分