基于LightGBM-VIF-MIC-SFS的风电机组故障诊断输入特征选择方法
Input feature selection method for wind turbine fault diagnosis based on LightGBM-VIF-MIC-SFS作者机构:华北电力大学自动化系河北保定071003 保定华仿科技股份有限公司河北保定071000
出 版 物:《热力发电》 (Thermal Power Generation)
年 卷 期:2024年第53卷第1期
页 面:154-164页
核心收录:
学科分类:12[管理学] 080801[工学-电机与电器] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 0808[工学-电气工程] 081104[工学-模式识别与智能系统] 08[工学] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:河北省中央引导地方科技发展资金项目(226Z2103G)
主 题:风电机组 特征选择 LightGBM 方差膨胀因子 最大信息系数 序列前向搜索
摘 要:针对风电机组数据采集与监视控制(SCADA)系统数据维数较高、特征冗余、特征相关性高导致风电机组的故障诊断过程存在误差大、分类正确率低的问题,提出一种基于LightGBM-VIF-MIC-SFS的三段式特征选择方法。首先,根据LightGBM实现对所有特征的重要性计算,确定初步特征空间;其次,根据方差膨胀因子(VIF)和最大信息系数(MIC)构建相关性判别阵,据此评估一次筛选中重要性相近的特征,舍弃相似性高的输入特征;最后,使用序列前向搜索法对特征进行第3次处理,逐个输入前2次特征选择获得的特征,保留能提升系统性能的特征,从而实现最终特征的选取。在完成了模型的建立后,使用风电场真实SCADA系统数据进行性能评估,将所提方法与2种对比算法在6个数据集上进行对比,结果显示所提出的LightGBM-VIF-MIC-SFS相较2种对比特征选择算法有显著优势。对所提方法内部的3个模块进行了消融实验,有效验证了所提特征选取方法内部各个模块的有效性以及基于所提方法得到的最优特征空间的合理性及准确性。