面向不平衡数据的电子病历自动分类研究
Automatic Classification with Unbalanced Data for Electronic Medical Records作者机构:吉林大学公共卫生学院长春130021 深圳市卫生健康发展研究和数据管理中心深圳518028
出 版 物:《数据分析与知识发现》 (Data Analysis and Knowledge Discovery)
年 卷 期:2022年第6卷第2期
页 面:233-241页
核心收录:
学科分类:08[工学] 081203[工学-计算机应用技术] 10[医学] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:教育部人文社会科学规划项目(项目编号:18YJA870017) 深圳市医学信息中心委托项目(项目编号:2020(261)) 吉林大学研究生创新基金项目(项目编号:101832020CX279)的研究成果之一。
摘 要:【目的】提出一种面向不平衡数据的电子病历自动分类方法,以进一步提高临床电子病历分类性能。【方法】利用MC-BERT增强电子病历的语义表示,并设计了相应的深度神经网络框架以提高模型的语义提取能力,最终利用类别数量比例、梯度协调机制和类别相似度从样本数量不平衡和样本分类难度不平衡两个角度设计了新的损失函数。【结果】通过真实电子病历数据集进行实证和对比实验,本文方法的精确率、宏平均F1值、微平均F1值分别为81.37%、65.89%、81.47%,优于前人提出的分类方法。【局限】仅针对单一临床科室的病历进行了实证研究。【结论】面向不平衡数据的电子病历自动分类方法可以有效地提高电子病历分类性能。