咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于组合模型的个人信用评估研究 收藏
基于组合模型的个人信用评估研究

基于组合模型的个人信用评估研究

作     者:郭誉 

作者单位:鲁东大学 

学位级别:硕士

导师姓名:于海生;张勇伟

授予年度:2022年

学科分类:12[管理学] 02[经济学] 0202[经济学-应用经济学] 020208[经济学-统计学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 07[理学] 020202[经济学-区域经济学] 0714[理学-统计学(可授理学、经济学学位)] 070103[理学-概率论与数理统计] 0701[理学-数学] 

主      题:组合模型 信用评估 机器学习 LightGBM模型 

摘      要:由于数字经济中欺诈和网络安全风险的迅速蔓延,违约检测成为互联网金融业发展的首要问题。虽然金融行业已广泛使用数据挖掘技术来克服这个问题,但大多数研究方法无法适应规模庞大且复杂的不平衡数据集,因此建立适合的个人信用评估体系迫在眉睫。本文研究数据来源于Lending Club借贷公司的真实数据集。首先对数据进行系统预处理过程,包含缺失值处理、同值化处理、变量编码等,通过Borderline SMOTE 2方法重构不平衡数据集。其次选择单一模型进行实证分析,以组合模型理论为基础选择随机森林模型、Logistic回归模型和LightGBM模型进行实证分析。最后以准确度、AUC值、Kolmogorov-Smirnov值、召回率和(?)-Score这5个性能评价指标比较单一模型和组合模型在数据集上的表现,选择综合性能最佳的个人信用评估模型。本文的主要工作如下:(1)优化信用风险评估框架。对于当前借贷公司存在的信息收集繁冗复杂且缺少重要性区分等问题,分别运用随机森林模型和Logistic回归模型提取重要变量,通过对比筛选后确定个人信用评估的关键变量,可以此类关键变量为框架结合借贷公司自身特点构建信用评估指标体系,进一步完善信用评估流程。(2)验证多模型组合方法。利用Lending Club借贷公司真实数据,选择稳定性和准确性较好的随机森林模型,可解释性较好的Logistic回归模型和快速高效的LightGBM模型和进行组合,验证了多模型组合方法可以通过信息交互使模型之间优势互补,全面提高模型的区分度、准确率及稳定性。(3)实证分析对比。通过模型性能评价指标对比单一模型与组合模型,分析实验结果选择更适合个人信用风险评估的模型。实验结果表明,LR-LightGBM组合模型在解决借贷数据的不平衡问题时,总体上比其他模型更具竞争力。本文选择的LR-LightGBM组合模型克服了单一模型易产生的欠拟合以及准确率较低的问题,并且有效的控制了假负类预测的产生,在一定程度上降低了借贷公司的坏账率,规避了借贷公司的潜在风险,对于金融机构的日常决策有一定的指导意义。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分