负二项回归模型在过度离散车险数据中的应用
作者单位:贵州民族大学
学位级别:硕士
导师姓名:黄介武
授予年度:2016年
学科分类:02[经济学] 0202[经济学-应用经济学] 020208[经济学-统计学] 07[理学] 0714[理学-统计学(可授理学、经济学学位)] 070103[理学-概率论与数理统计] 0701[理学-数学]
摘 要:计数数据常出现在医学、社会学与心理学等领域,是一类重要的取值为非负整数的统计数据类型。分析计数数据常用的模型有泊松回归模型、负二项回归模型、广义泊松回归模型与Hurdle模型等。计数数据中的一类特殊情形是数据的条件方差大于条件均值,即数据存在过度离散现象,因而,过度离散数据的分析就成了一个重要的统计问题。车险数据包括索赔次数、索赔额与赔款总量等,其中索赔次数就属于计数数据。索赔次数数据的分析与模型拟合是车险费率厘定的基础。而负二项回归模型能够很好的解决数据中存在的过度离散问题,因此本文主要研究负二项回归模型在过度离散车险数据中的应用。首先,介绍本文讨论所用到的模型以及过度离散的定义、过度离散产生的原因、可能导致的后果与检验等。并通过一个实例对比研究说明线性回归模型不适用于响应变量取值为计数数据的情形。其次,通过实证分析讨论泊松回归模型与负二项回归模型用于分析过度离散车险数据的优良性。结果表明,无论从模型拟合效果、预测效果还是模型实际意义等都说明负二项回归模型更适用于过度离散车险数据。最后,通过数值模拟的方法比较研究泊松回归模型、负二项回归模型以及广义泊松回归模型对于处理不同程度的过度离散车险数据的优良性。结果表明:当数据存在过度离散时,负二项回归模型拟合效果随着离散程度的变化始终优于泊松回归模型与广义泊松回归模型;当数据不存在过度离散时,泊松回归模型与负二项回归模型拟合效果差异不大,且都优于广义泊松回归模型。总的来说,无论数据是否存在过度离散,负二项回归模型都是一个不错的选择。