咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于提示学习的医学量表问题文本多分类研究 收藏

基于提示学习的医学量表问题文本多分类研究

A study on multi-class classification of medical questionnaire item texts based on prompt learning

作     者:郝洁 彭庆龙 丛山 李姣 孙海霞 HAO Jie;PENG Qinglong;CONG Shan;LI Jiao;SUN Haixia

作者机构:中国医学科学院/北京协和医学院医学信息研究所北京100020 哈尔滨工程大学青岛创新发展基地山东青岛266000 

出 版 物:《中国循证医学杂志》 (Chinese Journal of Evidence-based Medicine)

年 卷 期:2024年第24卷第1期

页      面:76-82页

核心收录:

学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 10[医学] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

基  金:国家社会科学基金项目(编号:21BTQ069) 中国医学科学院医学与健康科技创新工程项目(编号:2021-I2M-1-056) 国家重点研发计划(编号:2022YFC3601005) 

主  题:医学量表 问题分类 多分类 提示学习 预训练语言模型 

摘      要:目的 目前医学量表资源的加工与组织多集中在文档层面,不利于用户从条目层面进行检索与复用。本文旨在提出一种低资源场景下的医学量表条目多分类方法,支持细粒度医学量表资源组织与服务。方法 采用一种基于预训练语言模型BERT的提示学习分类方法来实现医学量表条目文本的多分类。首先收集肺癌临床评估量表,提取功能、领域分类标签,采用人工标注“功能-领域组合标签形成肺癌临床评估条目小样本语料集;然后采用提示学习方法,通过将自定义构建的模板格式输入BERT模型,对模板空缺位置进行预测填充;最后将填充文本映射到标签,实现对医学量表中条目文本的多分类。结果 构建的语料包含肺癌临床评估条目347条,涉及“功能-领域分类标签9个;在自制的语料集上,提出的多分类方法的平均准确率达到93%,比次优的GAN-BERT模型性能提高约6%。结论 基于预训练语言模型BERT的提示学习分类方法能够在减少医学量表条目语料构建成本的同时保持较优的性能,在医学量表条目分类研究与实践中具有推广价值。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分