基于气味物化特征空间的嗅感评价模型研究
作者单位:广东工业大学
学位级别:硕士
导师姓名:骆德汉
授予年度:2020年
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 08[工学] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
主 题:嗅感评价 特征选择 特征提取 SVM XGBoost
摘 要:在视觉听觉数字化迅速发展的今天,人们对于嗅觉数字化的要求也日益强烈。嗅感评价是描述嗅觉感知的一种重要方式,它通过对不同气味进行予以描述来表示嗅觉感知。但由于嗅觉系统复杂的生理机制,始终没能在气味的性质和嗅感评价之间建立良好的映射模型。本文并收集了相关物化特征数据,结合多种已知的特征工程技术,提取有效的气味信息表征,构建气味的物化特征空间。利用机器学习方法构建从物化特征空间到嗅觉感知空间的映射模型,提高了气味的嗅感评价模型的预测效果。首先,本文介绍了构建气味物化特征空间的分子描述符数据集的构成与采集流程,再重点介绍了多种特征选择和特征提取方法,基于不同的方法构建了气味的物化特征空间。对于特征选择方法,主要讨论了遗传算法(GA)、弹性网络、随机森林。其中在随机森林进行特征选择方法中,加入递归特征消除(RFE)来确认最终选择的变量维度;对于特征提取方法,考虑到数据的线性和非线性关系,采用了主成分分析(PCA)和流形学习中的局部线性嵌入算法,对高维描述符数据集进行降维处理。各种变量筛选的方法都约简了特征空间,为后面的嗅感评价模型做准备。其次,介绍了在构建嗅感评价模型中广泛应用的SVM,与前面得到的特征空间进行组合,对比分析得到基于特征提取的SVM模型比基于特征选择的SVM模型的预测效果更好,而且基于主成分分析构建的特征空间学习的SVM模型效果更好;同时介绍了先进的机器学习方法XGBoost,再运用该方法对得到的特征空间进行学习,得到最适用于该机器学习方法的特征空间,是由遗传算法得到的特征空间。最后,将SVM和XGBoost两种机器学习方法分别对五类特征空间学习的结果进行对比分析,结果表明,整体上SVM模型和各种特征筛选方法的组合结果较为稳定,但XGBoost和遗传算法方法结合,会明显改善嗅感评价的预测结果。本文不仅运用嗅感评价模型中广泛使用的SVM,更引入较为先进的XGBoost,分别对基于特征选择和特征提取的特征空间进行建模,对比分析得到不同特征筛选技术与两种模型的作用关系,为构建更好的嗅感评价模型奠定基础,是构建真正智能的人工嗅觉系统的一次有益探索。