咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于句子级Lattice-长短记忆神经网络的中文电子病历命名... 收藏

基于句子级Lattice-长短记忆神经网络的中文电子病历命名实体识别

Chinese electronic medical record named entity recognition based on sentence-level Lattice-long short-term memory neural network

作     者:潘璀然 王青华 汤步洲 姜磊 黄勋 王理 PAN Cui-ran;WANG Qing-hua;TANG Bu-zhou;JIANG Lei;HUANG Xun;WANG Li

作者机构:南通大学医学院医学信息学教研室南通226001 哈尔滨工业大学(深圳)计算机科学与技术学院深圳518055 海军军医大学(第二军医大学)长征医院风湿免疫科上海200433 南通大学信息科学技术学院通讯工程教研室南通226001 

出 版 物:《第二军医大学学报》 (Academic Journal of Second Military Medical University)

年 卷 期:2019年第40卷第5期

页      面:497-506页

核心收录:

学科分类:1007[医学-药学(可授医学、理学学位)] 100705[医学-微生物与生化药学] 1002[医学-临床医学] 1001[医学-基础医学(可授医学、理学学位)] 100103[医学-病原生物学] 10[医学] 

基  金:国家重点研发计划(2018YFC0116902) 国家自然科学基金(81873915) 江苏省研究生科研与实践创新计划项目(KYCX17-1932)~~ 

主  题:计算机化病案系统 中文电子病历 实体识别 条件随机场 双向长短记忆神经网络 点阵长短记忆神经网络 

摘      要:目的提出一种基于Re-entity新分词方法的条件随机场(CRF)模型,并与双向长短记忆神经网络(BiLSTM)-CRF和Lattice-长短记忆神经网络(LSTM)进行比较。方法比较了现有实体识别方法和模型后,针对2018年全国知识图谱与语义计算大会(CCKS2018)任务一“电子病历命名实体识别,提出基于Re-entity的CRF、BiLSTM-CRF、Lattice-LSTM方法,并在不同语料库训练不同参数级别的字符向量集。分别将各方法引入神经网络模型中进行模型性能对比实验,最后分别基于句子级和篇级输入句长进行对比研究。结果CRF模型在最优特征工程的结果下引入Re-entity方法后性能得到提高,句子级的Lattice-LSTM模型在该任务上取得了89.75%的严格F1-measure,优于CCKS2018任务一的最高结果(89.25%)。结论基于Re-entity新分词方法的CRF模型可利用中文临床药物知识库有效提高电子病历中药物的识别率,Re-entity方法可改善数据预处理阶段分词导致的错误累加,Lattice结构可以更好地结合字符和词序列的潜在语义信息,同时句子级输入能有效提高神经网络模型的识别准确率。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分