海量医疗信息系统推荐技术研究
作者单位:华中科技大学
学位级别:硕士
导师姓名:李春花
授予年度:2015年
学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
主 题:医疗常识 处方信息 数据聚类 Elasticsearch 推荐
摘 要:在信息爆炸式增长的背景下,医疗信息同样处于快速增长的阶段,为了获取信息,人们可以通过搜索引擎来满足自身的要求。但是,搜索引擎会返回符合要求的所有信息,通常来说信息量也很大,用户往往要翻阅大量的网页之后才能找到自己真正想要的信息,显然,这与用户快速获取信息的要求相悖。设计并实现一个集存储、搜索和推荐于一体的海量医疗信息系统,本系统的医疗信息包括药品、医生、常识和处方信息。其中,存储和搜索部分利用开源搜索引擎Elasticsearch机制定义医疗信息的数据结构,以实现高性能和高可扩展性的要求;对于推荐部分,药品信息的推荐从其“适应症文本的相似性、药品总使用量以及药品使用热度三方面综合考虑;医生信息的推荐从医生自身的流行程度、患者对医生评价相似性这两个策略来考虑;医疗常识信息则主要考虑常识的内容相似性和用户的历史兴趣点,为减少计算的时间开销,引入信息聚类技术;处方信息的推荐需要分析用户输入的诊断症状描述、检查结果和检验结果,并从处方数据库中找到跟用户输入最匹配的处方,匹配的原则首先是症状匹配,找到相同症状的案例,然后根据检查结果和检验结果匹配,检查结果是文字描述,可根据文本相似度来衡量匹配程度,检验结果是各项指标的定性定量表示,根据匹配项的数目来衡量匹配程度,然后根据用户的对药物的过敏情况进行过滤。测试结果表明,本系统在存储、索引和搜索方面能够满足高性能、高可扩展性的要求,引入推荐功能和不引入推荐功能系统响应时间在同一个数量级上,不会显著增加响应时间。