融合Lasso的近似马尔科夫毯特征选择方法
Approximate Markov Blanket Feature Selection Method Based on Lasso Fusion作者机构:江西师范大学信息化办公室 江西中医药大学计算机学院
出 版 物:《计算机工程与应用》 (Computer Engineering and Applications)
年 卷 期:2023年
学科分类:1006[医学-中西医结合] 08[工学] 081104[工学-模式识别与智能系统] 0811[工学-控制科学与工程] 10[医学] 100602[医学-中西医结合临床]
基 金:国家自然科学基金项目(NO.62141202 NO.82160955 NO.82260988) 国家重点研发计划项目(NO.2019YFC1712301) 江西省自然科学基金面上项目(NO.20202BAB202019) 江西省教育厅科学技术研究项目(No.GJJ190683) 江西中医药大学校级科技创新团队发展计划(团队编号:CXTD22015)
主 题:近似马尔科夫毯 Lasso 特征选择 高维小样本 中医药信息
摘 要:在特征选择问题中,近似马尔科夫毯常用于判断冗余特征,但所得到的冗余特征并不完全相同,因此,在直接使用近似马尔科夫毯删除冗余特征时,存在可能导致信息丢失的情况,影响模型精度。为此,提出一种用于中药代谢组学高维小样本数据的融合Lasso的近似马尔科夫毯特征选择方法。方法分为两个阶段,第一阶段,通过最大信息系数对特征的相关度分析过滤无关特征;第二阶段,采用近似马尔科夫毯构建相似特征组,使用Lasso评估相似特征组中特征影响力,迭代去除冗余特征。通过实验对比表明:该算法可以在一定程度上可以减少有用信息丢失,去除无关特征和冗余特征,提高模型精度和稳定性。