咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于中国医院药物警戒系统数据的药品不良反应主动监测探索 收藏
基于中国医院药物警戒系统数据的药品不良反应主动监测探索

基于中国医院药物警戒系统数据的药品不良反应主动监测探索

作     者:郑轶 

作者单位:中国人民解放军海军军医大学 

学位级别:硕士

导师姓名:贺佳;叶小飞

授予年度:2023年

学科分类:1007[医学-药学(可授医学、理学学位)] 10[医学] 

主      题:药品不良反应 主动监测 中国医院药物警戒系统 提取-转化-加载 机器学习 PD-1/PD-L1抑制剂 

摘      要:研究背景:为保障人民用药安全,药品的安全性监测应贯穿于药品的全生命周期,除了药品上市前的安全性监测以外,药品上市后的安全性监测也同样重要。药品上市后的安全性监测主要分为药品不良反应的主动监测和被动监测两种。目前,开展的不良反应监测中,被动监测研究开展的更为广泛。但是被动监测是基于自发呈报系统的数据,不可避免地存在漏报、重报、上报信息不准确等问题,导致被动监测得到的信号证据等级不高。主动监测将每一个项目设立为一个独立的项目,有计划并严格执行的研究,所以其证据等级高,也适用于被动监测发现的信号证实,但是由于其需要大量的人力物力,导致其开展受限。随着计算机处理大数据技术的发展以及药品不良反应监测系统的建立,使得基于真实世界数据开展主动监测成为了可能。我国于2016年建设中国医院药物警戒系统(Chinese Hospital Pdharmacovigilance System,CHPS)和国家药品不良反应监测哨点联盟(China ADR sentinel surveillance alliance,CASSA),这是我国开展药品不良反应主动监测的重要举措。CHPS系统将哨点医院的数据通过系统内置的通用数据模型进行转换成CHPS的数据,进而开展药品不良反应的主动监测。然而,CHPS系统目前的通用数据模型较为基础,仅仅能将数据进行整合,尚不能提供统计分析的标准化数据,导致目前基于CHPS数据开展的研究多利用一家医院数据进行,尚未打破各家医院的数据壁垒,实现基于大数据开展药品不良反应监测。同时,在CHPS数据中缺少药品不良反应结局的针对性标识,导致开展的研究缺少明确的不良反应结局变量,只能依靠指向目标不良反应的症状、实验室检查和治疗药物制定触发器对目标不良反应进行识别,未能达到对药品不良反应精准识别的目标。研究目的:针对CHPS数据导出及标准化的问题,本研究探索一套将多源异构数据整合成可用于统计分析的标准化数据的方法及流程。针对CHPS数据缺少不良反应特征性标识的问题,探索基于机器学习算法构建不良反应触发器识别的方法及可行性。最后基于一家哨点医院的肿瘤患者数据,依据上述方法对PD-1/PD-L1抑制剂的不良反应进行探索,为我国开展药品不良反应主动监测提供一种新思路。研究内容:1.针对CHPS数据的提取-转化-加载成标准化数据的流程这一问题,本研究参考借鉴了观察性健康数据科学和信息学组织(Observational Health Data Sciences and Informational,OHDIS)开展多源异构数据整合成标准化数据的流程。首先借助OHDIS开发的White Rabbit和Rabbit in a hat两款小软件对CHPS数据进行扫描并构建CHPS的逻辑映射,根据研究目的构建CHPS的ETL,同时下载OHDIS组织构建的专业术语字典库,对导出数据中的专业术语向标准化术语集进行转化,实现CHPS数据的导出并转化成标准化数据。2.针对缺少药品不良反应针对性标识这一问题,本研究除了构建经典不良反应的触发器,尝试基于机器学习构建触发器对不良反应进行识别,并与经典触发器的预测效能相比,查看是否表现更为优异。构建机器学习触发器的具体方法及流程如下:首先基于抽样验证法构建目标不良反应的金标准数据库;随后结合文献查阅和专家咨询的方法,对纳入目标不良反应触发器的变量条目进行筛选;最后基于金标准数据库对随机森林、支持向量机、XGBoost、Light GBM以及Logistic回归5种模型进行训练,以预测效能最好的模型作为目标不良反应基于机器学习构建的触发器。将基于机器学习构建的触发器与经典触发器的预测效能进行对比,验证基于机器学习算法构建的触发器预测效能有无提升。3.在实例研究中,本研究首先清洗了2015年第一季度至2022年第一季度的FAERS(the United States Food and Drug Administration Adverse Event Reporting System database)数据库,对PD-1/PD-L1抑制剂的潜在不良反应信号进行了探索,最后选定甲状腺功能不良(IC/ROR=3.61/12.18)、甲状腺功能亢进(IC/ROR=3.88/14.68)以及心肌炎(IC/ROR=4.58/23.97)3种信号较高且临床医生较为关注的不良反应作为本研究主动监测的目标不良反应。随后采用抽样验证法对金标准数据库进行构建,通过文献阅读以及两轮专家咨询对基于机器学习构建的触发器纳入变量进行确定。基于金标准数据库对各种机器学习方法进行训练,并选取预测效能最好的模型作为目标不良反应的触发器。本研究从一家重庆哨点医院的CHPS系统中抽取2018年6月1日到2022年8月1日的住院肿瘤患者相关数据,按患者有无使用PD-1/PD-L1抑制剂分为PD-1/PD-L1抑制剂组和对照组,并按倾向性评分匹配的方法将两组的基线进行平衡,最后应用目标不良反应的预测模型对匹配后的两组病例进行目标不良反应的预测,通过比较两组间目标不良反应发生率的差异,探索PD-1/PD-L1抑制剂是否增加三种目标不良反应的发生风险。研究结果:1.本研究根据前期构建的CHPS数据导出的ETL,提取了哨点医院2018年6月1日到2022年8月1日的住院肿瘤患者数据,共计29417名患者。基于OHDIS字典库将所需数据的术语向标准化术语进行转化,构建一个可以进行统计分析的药品不良反应主动监测数据库。本研究根据患者有无使用PD-1/PD-L1抑制剂分为PD-1/PDL1抑制剂组和对照组,依据患者的基本信息,基础疾病,以及所患肿瘤种类按倾向性评分匹配1:4的方法对PD-1/PD-L1抑制剂组和对照组的基线进行了平衡,经过匹配后,PD-1/PD-L1抑制剂组3496例患者,对照组12083例患者,两组之间各变量的绝对标准均值差(Absolute Standardized Mean Difference,ASMD)均小于0.1,两组间各变量均衡。2.本研究基于抽样验证法构建目标不良反应的金标准数据库,在数据核查排除18例重复病例后,金标准数据库共纳入482例患者。本研究通过阅读文献和两轮专家咨询法对机器学习触发器纳入的变量进行筛选。随后基于构建的金标准数据库和纳入触发器的变量对随机森林、支持向量机、XGBoost、Light GBM以及Logistic回归5种预测模型进行训练学习,最后根据预测效能选择各目标不良反应最终基于机器学习构建的触发器。目标不良反应最终选择的机器学习模型为:甲状腺功能不全选择Light GBM(AUC/ACC/精准率/召回率/F1分数=0.944/0.885/0.872/0.850/0.861);甲状腺功能亢进选择随机森林(AUC/ACC/精准率/召回率/F1分数=0.988/0.979/0.950/0.950/0.950);心肌炎选择随机森林(AUC/ACC/精准率/召回率/F1分数=0.988/0.948/1.000/0.545/0.706)。本研究同时基于金标准数据库对目标不良反应经典的触发器的预测效能进行了检验,发现机器学习构建的触发器的预测效能优于经典的触发器。3.本研究基于构建的机器学习触发器对匹配后的观测数据是否发生目标不良反应进行识别,最终发现PD-1/PD-L1抑制剂组发生甲状腺功能不全464例,甲状腺功能亢进142例,心肌炎64例,于对照组相比,三个目标不良反应的发生率差异均具有统计学意义,PD-1/PD-L1抑制剂可以增加三种不良反应的发生风险。结论:本研究借助OHDIS组织ETL的小软件、通用数据模型以及字典库构建的CHPS数据导出及标准化方法及流程成功地将CHPS数据提取并转化成标准化可进行统计分析的数据,该方法及流程具备一定的可行性。相较于经典触发器对药品不良反应进行识别,本研究构建的机器学习触发器对药品不良反应进行识别的预测效能更高,更能精准地识别不良反应。本研究为我国基于CHPS数据开展药品主动监测进行了初步探索,主要是对多源异构数据的整合标准化方法及流程,和对基于机器学习构建的触发器进行初步探索,为我国开展药品不良反应主动监测提供一种新思路,更好地保障人民用药安全。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分