咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >银行客户逾期还款预测的研究及应用 收藏
银行客户逾期还款预测的研究及应用

银行客户逾期还款预测的研究及应用

作     者:陈佳栋 

作者单位:上海财经大学 

学位级别:硕士

导师姓名:卞世博

授予年度:2020年

学科分类:12[管理学] 0202[经济学-应用经济学] 02[经济学] 020208[经济学-统计学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 07[理学] 020204[经济学-金融学(含∶保险学)] 0714[理学-统计学(可授理学、经济学学位)] 

主      题:银行客户 逾期还款 不平衡数据集 随机森林 

摘      要:随着经济全球化和信息技术的蓬勃发展,金融活动产生的数据增长迅速,如何通过数据挖掘来利用这些数据,已成为人们关注的重点。与此同时,人们的消费理念也在发生变化,消费信贷的增加,不仅为金融机构带来了利润,也产生了风险。如何对信贷风险进行有效控制,成为金融机构的主要目标。由于信贷行业数据的特点,数据集容易出现不平衡。在处理不平衡数据集时,传统的分类器性能就会开始出现了不同程度的下降。如何改进处理不平衡数据集的方法以及通过量化客户信息,使得银行信贷审批流程提高效率和准确率,成为各银行主要关注的问题之一。本文主要基于改进后的随机森林算法(后文简称IRF)研究银行客户逾期还款预测的相关问题。先介绍了银行客户逾期还款预测领域的相关发展,然后介绍了随机森林模型的理论基础、不平衡数据集处理方法。其次对随机森林算法在处理不平衡数据集上的问题进行改进,通过在UCI里的Breast Tissue与Glass数据集上做对比,比较改进后的随机森林算法、支持向量机、经典随机森林、传统logistic回归和加权随机森林在处理不平衡数据集上的差异和优劣。最后再将改进后的随机森林算法应用于对银行客户逾期还款预测问题的实证研究,在kaggle网站上筛选获取客户逾期还款变量,对数据进行预处理,根据实际工作经验添加新变量,建立逾期还款预测模型,再对IRF模型进行优化和结果分析,并与其余各个模型进行对比,验证IRF性能。本文的实证结果表明:改进后的随机森林算法在不平衡数据集分类问题的处理过程中具有一定的有效性、可行性。与支持向量机、经典随机森林、传统logistic回归、加权随机森林相比较而言,改进后的随机森林算法在分类性能的良好性、稳定性都具有一定的优势。同时,通过与银行客户逾期还款预测问题相结合,也在一定程度上说明了其具有一定的实践意义与价值。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分