寻常痤疮中医药知识图谱构建的关键技术研究
作者单位:中国中医科学院
学位级别:硕士
导师姓名:李宗友;于彤
授予年度:2021年
学科分类:1006[医学-中西医结合] 100602[医学-中西医结合临床] 10[医学]
主 题:寻常痤疮 中医药 知识图谱 本体 事实知识 语义搜索 名医经验
摘 要:研究背景寻常痤疮是一种好发于青春期、主要累及面部的慢性皮肤病,发病率高,影响患者身心健康。中医学虽无这一病名,但根据其临床特点,可属中医学中“粉刺、“痤等范畴。从古至今,中医学对寻常痤疮的认识,从病因病机到理法方药已形成了相对系统的理论体系,并在临床实践中形成了诊疗共识和大量各具特色的诊疗经验数据。既往研究多通过文献整理、经验总结、数据挖掘等方式,对个别医家、流派的寻常痤疮诊疗经验加以总结、对比。但限于诊疗经验的分散性,寻常痤疮相关中医药诊疗经验数据中的大量隐性知识难以被挖掘与利用。研究目的探索中医药疾病知识图谱构建的关键技术,以寻常痤疮中医药领域文献为数据源,复用中医药及相关领域的顶层知识分类标准与术语表,根据领域知识特点,构建包含理论、实践两部分知识的寻常痤疮中医药知识图谱,借助知识图谱在关联、表达、利用知识上的优势,表达寻常痤疮中医药知识间的关联,以期提升寻常痤疮中医药知识的获取效果,实现寻常痤疮名医诊疗经验的整合和知识发现。研究方法(1)根据寻常痤疮中医药知识图谱的构建目标,制定知识图谱涉及的知识层次。梳理寻常痤疮中医药诊疗知识体系,参考中医药领域现有知识分类标准,制定知识图谱的知识框架。(2)分析寻常痤疮中医药诊疗知识特点与侧重方向,根据领域本体构建的七步法,确定本体的覆盖范围与术语粒度,收集领域术语,复用、组合领域本体、中医药领域通用术语表、中医证候术语表以及中西医疾病、治法和药物术语表等,整合特色分类体系,构建本体的分类体系,定义满足寻常痤疮中医药知识表达的特征性数据属性,完成领域本体构建。(3)选择高质量的寻常痤疮中医药事实知识,利用知识抽取技术结合人工审校标注的方法,获取结构化数据,进行事实知识之间、事实与本体知识之间的知识融合,构建寻常痤疮中医药知识图谱,选择图数据库加以存储,实现语义搜索等应用示例。研究结果(1)构建了互操作性与名医经验知识表达良好的知识图谱知识结构。寻常痤疮中医药知识图谱以名医经验的表达和使用为目标,制定了包含模式和事实两部分的知识图谱知识层次。该知识层次支持理论知识与诊疗经验的表达,既能发挥领域本体的语义优势,又能促进医案中隐性知识的的完整保存与分析利用。通过对寻常痤疮中医药诊疗知识体系的梳理、对中医药领域现有知识分类标准的分析,制定了包含疾病、证候、分期与传变、生理特征、症状体征、治则治法、药物、机体形态、中医操作/方法、医家共10种语义类型,治疗、分析、使用、包含、进程、现象表达、特性、实例化、subClassOf共9种语义关系的知识图谱知识框架,能够支持领域协作的互操作需求。(2)构建了符合寻常痤疮中医药知识表达特色的本体。寻常痤疮中医药知识图谱的本体部分以单义术语为最小术语粒度,梳理核心概念的中西医正名“寻常痤疮和“粉刺,选择具有中医特色的术语定义,据此收集相关术语,着重构建了分类体系的疾病、证候、治则治法部分,定义了数据属性ID、名、异名、来源、来源文献、相关性、疾病诊断、专长、部位、频率、时长、时刻、次序、剂量、疗程、特殊煎法和诊疗经验,在protege中加以编辑,完成本体构建。(3)构建了提升寻常痤疮中医药知识获取效果的的知识图谱。以专科医家的医案作为事实知识来源,通过基于规则的知识抽取和标准统一的人工审校标注,获得结构化数据。通过知识消歧,将知识图谱的本体部分与名医经验部分关联起来;通过知识对齐,融合医案知识。选择图数据库Neo4j,使用Py2neo导入数据,构建了包含5911个实体、15193条关系的寻常痤疮中医药知识图谱,能够支持寻常痤疮中医药知识的语义搜索和知识发现,提升了领域知识的可获取性。研究结论(1)寻常痤疮中医药知识图谱的知识层次应当至少具有事实和模式2层,使得领域公认知识和医家个人经验都能够得到良好表达;知识框架中除中医药领域知识图谱通用的知识类型外,还需根据疾病知识的表达需求设置特色的知识类型。(2)寻常痤疮中医药知识图谱领域本体部分不应强调细粒度术语的构建。构建分类体系全面的本体结构,为临床应用提供拓展组合的空间,能够更好地支持寻常痤疮中医药个性化诊疗中,对术语的灵活组合使用。(3)中医药疾病知识图谱可按照知识结构、领域本体和事实知识的顺序加以构建,构建过程中需关注中医药领域对疾病中各类知识的描述侧重、知识图谱的应用目标以及领域现有工作的复用,重视领域专家的需求与指导。