基于鲁棒最优控制的在线机器学习方法
An adaptive online machine learning method based on a robust optimal control approach作者机构:中南财经政法大学统计与数学学院武汉430073
出 版 物:《中国科学:数学》 (Scientia Sinica:Mathematica)
年 卷 期:2018年第48卷第9期
页 面:1181-1202页
核心收录:
学科分类:12[管理学] 07[理学] 08[工学] 070105[理学-运筹学与控制论] 071101[理学-系统理论] 0711[理学-系统科学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 0835[工学-软件工程] 081101[工学-控制理论与控制工程] 0701[理学-数学] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家自然科学基金(批准号:11301544和61773401) 国家留学基金委(批准号:201707085011)资助项目
主 题:统计学习 在线学习 再生核空间 随机动力学系统 鲁棒最优控制 模型预测控制
摘 要:基于再生核Hilbert空间(reproducing kernel Hilbert space,RKHS)的统计学习模型被广泛应用于函数逼近、图像处理、模式识别和回归分析等领域,并且也在非线性随机动力学系统的辨识问题中有着很好的表现.本文提出一个基于鲁棒最优控制的RKHS模型学习方法,来实现对非线性随机动力学系统的高效在线建模.利用本文得到的关于再生核空间的一些理论结果,本文将随机动力学系统的在线学习问题转化为一组具有有界随机扰动的离散时变线性系统的输出反馈镇定问题,并利用模型预测控制技术来设计相应的控制算法和学习算法.与现有的RKHS模型学习方法相比,在不引入任何数据窗口原理、剪枝技术、学习步长的调整机制以及对噪声统计性质的假设的情形下,新方法可以在保证模型参数快速且鲁棒收敛的同时,实现对动力学系统的自适应高精度建模.此外,本文首次从最优控制的视角出发,研究动力学系统的在线核学习问题.在本文提出的研究框架下,现有各种控制技术可以被利用起来开发新的鲁棒学习方法,这也为核学习理论的研究和算法的开发提供一些新的思路.本文亦给出了数值算例和对比结果,用来说明新方法的有效性.