基于广义AFT模型的纵向数据与区间删失数据的联合分析
作者单位:长春工业大学
学位级别:硕士
导师姓名:宋心远;王纯杰
授予年度:2024年
学科分类:02[经济学] 0202[经济学-应用经济学] 020208[经济学-统计学] 07[理学] 0714[理学-统计学(可授理学、经济学学位)] 070103[理学-概率论与数理统计] 0701[理学-数学]
主 题:区间删失数据 纵向数据 AFT模型 联合模型 MCEM算法
摘 要:生存分析是统计学中关键的一部分,专注于事件发生时间及其影响因素的研究。实际应用中,常面临数据不完整的问题,尤其是删失数据问题。这些数据大致分为右删失、左删失和区间删失三种类型,区间删失数据仅提供事件发生的时间区间。随着研究领域的问题更加复杂,需采用更高级的分析方法,特别是在临床医学研究中,生存数据与纵向数据的结合分析变得至关重要。联合模型应运而生,它整合生存数据模型(如Cox比例风险模型和加速失效时间模型)和纵向模型,通过联合似然同时分析两种数据,有效处理纵向数据的测量误差和时间相关信息。此模型的优势在于能够无偏估计纵向过程与生存过程间的关系,这意味着它能够更准确地揭示这两种数据之间的动态交互,为理解事件的发生时间及其因素提供一个更为全面和精确的视角。本文旨在探索基于区间删失数据的混合效应模型与加速失效时间模型的联合分析方法。 本文第一部分将线性混合效应模型与加速失效时间模型相结合,以更精准地分析数据。这种方法的核心在于引入加速因子,它允许更全面地考虑协变量过程对研究结果的影响。为实现这一目标,采用联合分析的策略,并通过潜变量将线性混合效应模型与加速失效时间模型相结合,并运用蒙特卡洛期望最大化(Monte Carlo Expectation Maximization,MCEM)算法来估计模型参数。为验证这一方法的有效性,进行大量的模拟研究。这些模拟实验不仅证实方法的可靠性,而且展示其在应对复杂数据分析时的优越性。进一步地,将这一方法应用于艾滋病的研究中,以此来展示其在实际医学研究中的应用价值。 本文第二部分探讨一种结合广义线性混合效应模型和加速失效时间模型的分析方法。这一方法扩展传统线性混合效应模型的应用范围,使其能够适用于更多领域。本部分采取联合分析策略,通过潜变量,将广义线性混合效应模型与加速失效时间模型紧密结合,并利用MCEM算法估计所需的模型参数。为检验该方法的效果,进行大量的模拟实验。这些实验不仅验证方法的稳健性,还展现其在分析复杂数据方面的显著优势。此外,将此方法应用于肝硬化的实验性研究中,可以进一步体现其在医学研究领域中的实际效用和重要价值。