面向不平衡数据的SMOTE-BO-XGBoost集成信用评分模型研究
作者机构:中央财经大学管理科学与工程学院 中国科学院大学管理学院中国科学院虚拟经济与数据科学研究中心大数据挖掘与知识管理重点实验室
出 版 物:《中国管理科学》 (Chinese Journal of Management Science)
年 卷 期:2024年
核心收录:
学科分类:12[管理学] 02[经济学] 0202[经济学-应用经济学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 020204[经济学-金融学(含∶保险学)] 081104[工学-模式识别与智能系统] 08[工学] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
摘 要:信用评估研究中,有两类问题经常会遇到,一方面数据不平衡会对模型的准确率有很大的影响,另一方面对非平衡数据处理较好但准确率不理想。为了同时解决这两方面的问题,构建了一种新的集成学习模型来解决数据类别不平衡下的信用风险评估问题——基于SMOTE-BO-XGBoost集成算法的类别非平衡信用评分模型,模型通过SMOTE方法处理样本不平衡问题,使用贝叶斯优化方法获取最优模型参数,进而构建优化后的集成分类模型。实验分析中以准确率、AUC值、F1得分和第一类错误为评估指标,先后训练XGBoost、BO-XGBoost、SMOTE-XGBoost、SMOTE-BO-XGBoost四种集成模型,同时将SMOTE-BO-XGBoost模型与传统信用评分模型比较,实验结果表明集成是有效的,其中SMOTE-BO-XGBoost模型具有最佳的模型性能,优于一般的集成学习模型与传统分类算法,能够有效克服非平衡样本问题,为银行部门提供了一种有效的个人信用风险评估方法。