基于特征选择算法的个人信用预测模型
Personal credit prediction model based on feature selection algorithm作者机构:南京工业大学电气工程与控制科学学院江苏南京211816
出 版 物:《计算机工程与设计》 (Computer Engineering and Design)
年 卷 期:2022年第43卷第6期
页 面:1678-1685页
学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
主 题:信用风险评估 皮尔森相关系数 互信息 梯度提升决策树 搜索策略
摘 要:针对传统机器学习分类算法处理高维个人信用数据时分类准确率较低的问题,提出一种基于皮尔森相关系数(PCC)和互信息法结合梯度提升决策树(MI-GBDT)的最优特征子集的选择方法,并应用在决策树、朴素贝叶斯分类器、支持向量机上。利用皮尔森相关系数去除强相关特征,利用互信息法和GBDT计算剩余特征的综合重要度,结合改进的基于特征排序的搜索策略,分别生成3种分类器模型所需的最优特征子集。实验结果表明,该方法在3种分类模型上筛选出的特征子集对应的分类精度分别提高了4.33%、13.29%和20.27%。