咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于机器学习的自发呈报系统中药品不良反应信号检测研究 收藏
基于机器学习的自发呈报系统中药品不良反应信号检测研究

基于机器学习的自发呈报系统中药品不良反应信号检测研究

作     者:陈枭 

作者单位:中国人民解放军海军军医大学 

学位级别:硕士

导师姓名:叶小飞

授予年度:2024年

学科分类:1007[医学-药学(可授医学、理学学位)] 10[医学] 

主      题:药品不良反应 信号检测 自发呈报系统 不相称方法 近邻算法 随机森林算法 极限梯度提升机算法 K折交叉验证 合成类少数过采样方法 

摘      要:一、研究背景 药物警戒是与发现、评价、理解和预防不良反应或其他任何可能与药物有关问题的科学研究与活动,旨在为药品不良反应事件提供安全信号。药品不良反应(Adverse Drug Reaction,ADR)指药品引发的非预期的有害和(或)意外反应。由于药品上市前的临床试验不足以代表整体人群的药物安全,因此药品上市后的不良反应监测至关重要。目前,国内外药品不良反应信号检测的主要方法是使用自发呈报系统(Spontaneous Reporting System,SRS)数据对所研究的药品进行不相称测定分析。目前以报告比值比法(Reporting Odds Ratio,ROR)和信息成分法(Information Component,IC)为代表的不相称分析方法(Disproportionality Analysis,DPA)是药品不良反应信号检测中常用的方法。然而,不相称分析方法只是简单地根据2×2列联表计算指标来确定安全信号,而忽略了数据库中其他变量的影响,可能导致信号有偏倚和准确度欠佳。此外,这类方法将相同的判定标准用于确定不同数据库的安全信号,这可能导致药品不良反应信号检测准确率不高。 二、研究目的 本研究通过模拟研究和实例研究对随机森林算法、近邻算法(K-Nearest Neighbor,KNN)和极限梯度提升机算法(e Xtreme Gradient Boosting,XGB)在药品不良反应信号检测中的预测性能进行评估,以曲线下面积(Area Under Curve,AUC)、灵敏度、特异度、准确率、阳性预测值(Positive Predictive Value,PPV)、阴性预测值(Negative Predictive Value,NPV)和F1分数为评价指标,并与传统的DPA方法进行比较。旨在将机器学习算法应用于药品不良反应信号被动监测领域,克服传统DPA方法的缺点,提升药品不良反应信号检测方法的准确性和检出率,更早地发现潜在的不良反应,更好地服务用药安全和药品管理。 三、研究内容 模拟研究:根据数据库情况通过模拟四种服药率(1%,5%,10%,20%)和4种不良反应发生率(0.5%,1%,5%,10%)生成一个50000条数据的模拟数据集,并根据数据集计算四格表a,b,c,d,进行卡方检验P0.05为标准得出二分类变量label为金标准,四格表数据使用传统不相称方法计算ROR和IC,根据n≥3,025≥1和n≥3,0250的标准,计算2种DPA算法的预测评价指标。在四格表数据和金标准结果的基础上,根据数据库比例添加年龄、性别、报告类型、报告机构、报告时效五个变量,整理出含有19个特征变量的数据集为总集,以50%的比例完全随机抽样得到验证样本,在样本中应用5折交叉验证,计算3种机器学习算法的预测评价指标,随后使用合成类少数过采样方法(Synthetic Minority Oversampling Technique,SMOTE)将训练集中阳性阴性结果比例调整至1:1后再次运行3种机器学习算法,计算7种预测性能评价指标,并与使用SMOTE方法前的指标和DPA算法的对比。样本整体中,根据不同的服药率和不良反应发生率分为16种情景,以上述相同的方法计算不同情景下各种算法的预测评价指标,并进行比较从而得出结论。 实例研究:以FAERS数据库为来源,选取布加替尼和纳武单抗作为目标药品,对应治疗非小细胞肺癌药品和治疗黑素细胞瘤药品分别选取数种相同类型药物为参考,整理出目标药品的数据集。通过查阅药品标签将数据集拆分为金标准数据集和可疑不良反应数据集。金标准数据集包含标签阳性(目标药品标签中存在)和标签阴性(同类药品标签中均不存在)不良反应,可疑不良反应数据集即不包含于目标药品标签但包含于同类药品标签中的不良反应条目。将金标准数据集通过5折交叉验证方法应用3种机器学习方法并计算预测评价指标,与模拟研究一样应用SMOTE方法后,训练集中阳性阴性结果比例调整至1:1后再次运行3种机器学习算法,计算预测评价指标,并与使用SMOTE方法前的指标和DPA算法的对比。随后将所有方法应用于可疑不良反应数据集,并尝试从临床和药理学角度判断潜在阳性信号是否具有临床意义。 四、研究结果 模拟研究:样本整体中,5种算法的综合预测性能由低到高依次为IC算法,ROR算法,KNN算法,RF算法,XGB算法,经SMOTE扩增后3种机器学习算法的预测性能全面提升,各算法预测性能排序不变。16种情景下,所有情景中3种机器学习算法的预测性能评价指标均高于2种DPA算法,绝大部分情景中的最佳算法为XGB算法,经SMOTE扩增后3种机器学习算法的各评价指标均有提升,整体预测性能明显提升。 实例研究:布加替尼和纳武单抗2种药品最终得到的结果均为3种机器学

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分