基于超参数优化集成学习的出行方式选择研究
作者机构:大连海事大学综合交通运输协同创新中心
出 版 物:《交通运输系统工程与信息》 (Journal of Transportation Systems Engineering and Information Technology)
年 卷 期:2024年
核心收录:
学科分类:08[工学] 082303[工学-交通运输规划与管理] 082302[工学-交通信息工程及控制] 0823[工学-交通运输工程]
基 金:国家重点研发计划 (2023YFB4302200) 国家自然科学基金 (72174035) 国家资助博士后研究人员计划(GZC20230343)
主 题:城市交通 出行方式选择 集成学习 超参数优化 可解释机器学习
摘 要:为解决传统出行方式选择模型和机器学习模型存在的识别精度不高、超参数优化复杂以及模型可解释性弱等问题,分别采用遗传算法和贝叶斯优化对极限梯度提升机模型进行超参数寻优,进一步融合SHAP (SHapley Additive exPlanations) 模型可视化出行方式属性和个体特征对选择概率的非线性关系,采用5折交叉验证的方式训练避免过拟合,最终结合瑞士地铁数据验证了所提议模型的优越性。结果表明,增强离散选择模型中效用函数的非线性表达可以提高模型预测性能,但仍然不如机器学习模型;采用遗传算法和贝叶斯优化后的极限梯度提升机模型在出行选择预测准确率、召回率和F1分数都高于传统的多项Logit、混合Logit模型以及普通的随机森林、极限梯度提升机;采用遗传算法优化的极限梯度提升机模型的预测准确性最高,为0.781,优于基于多次网格搜索的常规模型;采用遗传算法优化超参数比多次网格搜索的方式训练时间降低了81.4%;不同出行方式的成本和时间是影响选择的重要因素,火车和汽车对于时间的敏感性更高,瑞士地铁对于成本的敏感性更高。