文献详情 >基于大语言模型的多输入中文拼写纠错方法收藏

基于大语言模型的多输入中文拼写纠错方法

作者机构：贵州大学文本计算与认知智能教育部工程研究中心贵州大学计算机科学与技术学院贵州轻工职业技术学院信息工程系

出版物：《计算机应用》 (Journal of Computer Applications)

年卷期：2025年

学科分类：12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081203[工学-计算机应用技术] 081104[工学-模式识别与智能系统] 08[工学] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术（可授工学、理学学位）]

基　　金：国家自然科学基金资助项目(62066007) 贵州省科技支撑计划项目(2022277)

主　　题：中文拼写纠错大语言模型模型集成模型微调提示学习

摘要：中文拼写纠错是自然语言处理中的一项重要研究任务，现有的基于大语言模型的中文拼写纠错方法由于大语言模型的生成机制，会生成和原文存在语义偏差的纠错结果。为此，提出基于大语言模型(LLM)的多输入中文拼写纠错方法。该方法包含多输入候选集合构建和LLM纠错两阶段。第一阶段将多个小模型的纠错结果构建为多输入候选集合;第二阶段使用LoRA(Low-Rank Adaptation)对LLM进行微调，借助大语言模型的推理能力，在多输入候选集合中预测出没有拼写错误的句子作为最终的纠错结果。在公开数据集SIGHAN13、SIGHAN14、SIGHAN15和修正后的SIGHAN15上，相较于使用LLM直接生成纠错结果的方法 Prompt-GEN-1，所提方法的纠错F1值分别提升9.6、24.9、27.9和34.2个百分点，相较于表现次优的纠错小模型分别提升1.0、1.1、0.4和2.4个百分点，验证了所提方法能提升中文拼写纠错任务的效果。

本地馆藏 |

1、借阅数量：每证可借书6册，期刊2册，团体读者证可借书刊300册。 2、借阅时间：个人借期为30天，每本书可续借1次，借期为30天；团体借期为90天。 3、归还地点：3楼服务台、自助借还设备、还书箱、各分馆 4、馆际互借：读者未能在本馆获取所需文献资料，可至参考咨询阅览室服务台填写《南通市图书馆馆际互借读者申请表》，根据馆际互借协议，我馆将为读者向其他馆代借文献。馆际互借过程中所产生的费用（资料复印、邮寄费等），由读者个人承担。 5、服务电话续借：59003605 59003606 咨询：81100100 59003600

电子资源

同方期刊数据库

目录详情 | 试阅读 |

读者评论与其他读者分享你的观点

学校读者

FontfaceFontSizeBoldItalicUnderlineBackColorAlignListLinkImgEmot

用户名:未登录

我的评分

欢迎您,

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

分类表

所选分类

看过本文的还看了

相关文献

该作者的其他文献

基于大语言模型的多输入中文拼写纠错方法

读者评论与其他读者分享你的观点

请选择收藏分类：

欢迎您,

建议与咨询 留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

分类表

所选分类

看过本文的还看了

相关文献

该作者的其他文献

基于大语言模型的多输入中文拼写纠错方法

读者评论 与其他读者分享你的观点

请选择收藏分类： 新增自定义分类 确定 取消

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

读者评论与其他读者分享你的观点

请选择收藏分类：