文献详情 >YuLan-Chat：基于多阶段课程学习的大语言模型收藏

YuLan-Chat：基于多阶段课程学习的大语言模型

作者：周昆朱余韬陈志朋毛科龙陈文通陈昱硕孙一丁曹乾王磊张蕾庞新程谢曙方赵鑫窦志成林衍凯毛佳昕宋睿华陈旭徐君胡迪严睿黄文炳魏哲巍文继荣

出版物：《计算机学报》 (Chinese Journal of Computers)

年卷期：2024年

核心收录：

学科分类：12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081203[工学-计算机应用技术] 081104[工学-模式识别与智能系统] 08[工学] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术（可授工学、理学学位）]

基　　金：国家自然科学基金(No.62222215/U2001212) 北京市自然科学基金(No.4222027)资助

主　　题：大语言模型课程学习预训练指令微调人类对齐

摘要：近年来，大语言模型已成为研究热点。其在大规模数据上预训练之后，具有强大的少样本和零样本上下文学习能力，能够便捷地用于许多真实场景复杂任务。然而，对大语言模型进行从头到尾的开发和训练，可参考的实现较少；且存在较难习得的知识，如长尾知识相关数据、复杂指令、难区分的负例等。为填补该领域空白，并强化对较难掌握数据的学习，本文提出了多阶段的课程学习方法，针对以上三种典型数据，使用了（1）迭代增强长尾知识的预训练课程；（2）由简单到复杂的指令微调课程；和（3）由易到难的人类对齐课程，完成了YuLan-Chat从头开始的整个训练流程。本文在四个与大语言模型基础能力和人类对齐能力相关的中英文评测基准上对YuLan-Chat进行评测，结果表明该模型能够在大部分场景下优于基线模型。分析实验进一步表明了该三阶段课程在预训练、指令微调和人类对齐阶段分别能够提升模型9.7%(GAOKAO),22.2%和18.9%(AlignBench)。

本地馆藏 |

1、借阅数量：每证可借书6册，期刊2册，团体读者证可借书刊300册。 2、借阅时间：个人借期为30天，每本书可续借1次，借期为30天；团体借期为90天。 3、归还地点：3楼服务台、自助借还设备、还书箱、各分馆 4、馆际互借：读者未能在本馆获取所需文献资料，可至参考咨询阅览室服务台填写《南通市图书馆馆际互借读者申请表》，根据馆际互借协议，我馆将为读者向其他馆代借文献。馆际互借过程中所产生的费用（资料复印、邮寄费等），由读者个人承担。 5、服务电话续借：59003605 59003606 咨询：81100100 59003600

电子资源

同方期刊数据库

目录详情 | 试阅读 |

读者评论与其他读者分享你的观点

学校读者

用户名:未登录

我的评分

欢迎您,

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

看过本文的还看了

相关文献

该作者的其他文献

YuLan-Chat：基于多阶段课程学习的大语言模型

读者评论与其他读者分享你的观点

请选择收藏分类：

欢迎您,

建议与咨询 留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

看过本文的还看了

相关文献

该作者的其他文献

YuLan-Chat：基于多阶段课程学习的大语言模型

读者评论 与其他读者分享你的观点

请选择收藏分类： 新增自定义分类 确定 取消

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

读者评论与其他读者分享你的观点

请选择收藏分类：