基于BERT的临床术语标准化
Clinical Term Normalization Based on BERT作者机构:大连理工大学计算机科学与技术学院辽宁大连116024
出 版 物:《中文信息学报》 (Journal of Chinese Information Processing)
年 卷 期:2021年第35卷第4期
页 面:75-82页
核心收录:
学科分类:08[工学] 081203[工学-计算机应用技术] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家十三五重点研发计划(2016YFC0901902)。
摘 要:电子病历中的临床术语描述形式具有多样性和不规范性,阻碍了医疗数据的分析和利用,因此对临床术语标准化的研究具有重要的现实意义。当前国内医疗机构临床术语标准化主要由人工完成,效率低,成本高。该文提出了一种基于BERT的临床术语标准化方法。该方法使用Jaccard相似度算法从标准术语集中挑选出候选词,基于BERT模型对原始词和候选词进行匹配得到标准化的结果。在CHIP2019临床术语标准化评测任务的数据集上准确率为90.04%。实验结果表明,该方法对于临床术语标准化任务是有效的。