基于少样本命名实体识别技术的电子病历指纹特征提取
Fingerprint Feature Extraction of Electronic Medical Records Based on Few-Shot Named Entity Recognition Technology作者机构:南开大学网络空间安全学院天津300350 天津市网络与数据安全技术重点实验室天津300350
出 版 物:《信息网络安全》 (Netinfo Security)
年 卷 期:2024年第10期
页 面:1537-1543页
学科分类:08[工学] 0839[工学-网络空间安全] 081201[工学-计算机系统结构] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家重点研发计划[2022YFB3103202] 天津市重点研发计划[20YFZCGX00680]
主 题:数据安全 电子病历 对比学习 命名实体识别 少样本学习
摘 要:随着《中华人民共和国个人信息保护法》《中华人民共和国数据安全法》等有关法律法规的颁布实施,电子病历数据保护引起大家的重视。快速高效识别电子病历是数据保护的第一环节,也是数据安全领域的重要研究课题之一。文章提出一种基于少样本命名实体识别技术的电子病历指纹特征提取方法,首先通过公共数据集训练编码器,获得广阔的文本特征空间;然后使用电子病历数据集微调编码器,并利用原型网络表征实体类型标签;最后通过提取电子病历特征,得到“实体类型+实体集的指纹特征。实验结果表明,与对比模型相比,该方法在I2B2数据集上性能更优异,有效提升了对电子病历数据的隐私保护能力。