基于MLM的小样本学习方法的研究-南通市图书馆

文献详情 >基于MLM的小样本学习方法的研究收藏

基于MLM的小样本学习方法的研究

作者：邓越

作者单位：内蒙古农业大学

学位级别：硕士

导师姓名：李宏慧

授予年度：2022年

学科分类：08[工学] 081104[工学-模式识别与智能系统] 081203[工学-计算机应用技术] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术（可授工学、理学学位）]

主题：小样本命名实体识别专利文本 MLM NLP

摘要：近年来,在自然语言处理方面,深度学习技术已经有了长足的进步。但是,大多数的深度学习都是通过对大量的标记样本学习,完成对目标任务的模型构建。然而,在某些情况下,由于涉及数据隐私保护,获得足够的训练样本变得非常困难。除此之外,对海量样本的标记也非常费时费力。为了解决小样本情况下自然语言处理问题,学者提出了小样本学习方法。但是,其中大多数的小样本学习模型参数设定较多、模型复杂度大,对计算机的算力要求非常高。为此,本文提出了基于MLM(Masked Language Model)模型的小样本学习方法。在多个数据集上的仿真实验结果表明,该方法在小样本学习任务上优于经典的机器学习及深度学习方法。本文具体研究工作如下:(1)提出了小样本学习训练方法FPT-MLM(Few-shot Pattern Training based on MLM),完成了小样本自然语言处理任务。该方法每次选择一小部分token来掩盖,然后在同一个样本上反复训练,获得双向融合信息的训练模型后,再将测试集转换为填空概率问题,并适当添加前缀或者后缀,然后利用解码层进行解码,最终得到预测标签序列的概率,实现自然语言的识别、分类及分析。(2)将提出的FPT-MLM方法应用于专利文本实体识别。针对专利文本领域缺乏足够的标注数据以及少量样本情况下传统的实体识别方法准确性偏低等问题,选取压力传感器制备领域的少量专利摘要文本,采用BMEO标注的方式进行人工标注,建立了带标签的中文专利摘要实验语料库。利用本文提出的FPT-MLM方法,完成了特定专利领域实体识别任务,识别效果较机器学习方法和深度学习方法,其准确率和F值均表现优异。(3)将提出的FPT-MLM方法应用于小样本情感分析和短文本分类中,实验结果表明,该方法可以有效的减少模型复杂度并保持基准效率。

本地馆藏 |

1、借阅数量：每证可借书6册，期刊2册，团体读者证可借书刊300册。 2、借阅时间：个人借期为30天，每本书可续借1次，借期为30天；团体借期为90天。 3、归还地点：3楼服务台、自助借还设备、还书箱、各分馆 4、馆际互借：读者未能在本馆获取所需文献资料，可至参考咨询阅览室服务台填写《南通市图书馆馆际互借读者申请表》，根据馆际互借协议，我馆将为读者向其他馆代借文献。馆际互借过程中所产生的费用（资料复印、邮寄费等），由读者个人承担。 5、服务电话续借：59003605 59003606 咨询：81100100 59003600

电子资源

同方学位论文库

目录详情 | 试阅读 |

读者评论与其他读者分享你的观点

学校读者

用户名:未登录

我的评分

欢迎您,

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

看过本文的还看了

相关文献

该作者的其他文献

基于MLM的小样本学习方法的研究

读者评论与其他读者分享你的观点

请选择收藏分类：

欢迎您,

建议与咨询 留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

看过本文的还看了

相关文献

该作者的其他文献

基于MLM的小样本学习方法的研究

读者评论 与其他读者分享你的观点

请选择收藏分类： 新增自定义分类 确定 取消

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

读者评论与其他读者分享你的观点

请选择收藏分类：