基于CMCP-LMCL的多分类深度神经网络及其应用
Deep Neural Network for Multi-Classification Based on CMCP-LMCL and Its Application作者机构:湖南大学金融与统计学院
出 版 物:《统计研究》 (Statistical Research)
年 卷 期:2024年第41卷第7期
页 面:148-160页
核心收录:
学科分类:0202[经济学-应用经济学] 02[经济学] 020208[经济学-统计学] 07[理学] 0714[理学-统计学(可授理学、经济学学位)]
基 金:国家自然科学基金面上项目“多源数据融合的高维整合分析分类模型及其信用风险应用”(72271088) 教育部人文社会科学基金规划项目“基于多源数据的高维分类模型及其信用风险预警研究”(22YJC910012) 湖南省自然科学基金青年项目“基于多源数据融合的高维分类模型及其违约风险管理应用研究”(2022JJ40107) 湖南省研究生科研创新项目“多源数据的深度神经网络及其应用”(CX20230418)
摘 要:多分类问题涉及信用风险管理、股票走势预测等多个领域。深度神经网络(DNN)是常用于多分类预测的机器学习模型,然而输入特征维度较高且存在冗余信号时,将加重其可解释性不强和结构冗余等缺陷;同时,常用的Softmax损失也可能面临分类边界模糊导致预测效果不佳等问题。为此,本文针对多分类问题,提出一个新的深度神经网络CMCP-LMCL,利用CMCP变量选择方法压缩输入特征到第1隐藏层的权重。该方法融合权重的组结构,能够剔除无关特征以及不重要的连接;同时,对特征层之外的权重施加权重衰减L;2;惩罚,有利于改进过拟合问题。新方法的增强边缘余弦损失(LMCL)在Softmax基础上引入扩大参数和距离参数,增大分类决策边界的间隔以期提高分类预测性能。模拟分析表明,对比已有DNN和传统分类方法,无论特征以简单线性形式还是复杂非线性形式映射到因变量,本文所提出的方法均具有良好的特征选择性能和预测表现。基于信用贷款数据的实证分析表明,该方法能够有效选择风险指标并进行违约风险预警。