咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于异常值处理的随机森林和kNN模型在EEG数据中的应用 收藏
基于异常值处理的随机森林和kNN模型在EEG数据中的应用

基于异常值处理的随机森林和kNN模型在EEG数据中的应用

作     者:王灿强 

作者单位:兰州大学 

学位级别:硕士

导师姓名:李维德

授予年度:2017年

学科分类:0831[工学-生物医学工程(可授工学、理学、医学学位)] 12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 08[工学] 081104[工学-模式识别与智能系统] 0835[工学-软件工程] 0836[工学-生物工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

主      题:脑电图 分类 异常值处理 k最近邻 随机森林 

摘      要:最近以来,随着深度学习和人工智能技术的快速进步,研究人员开始借助于这些新技术来研究关于脑电图的问题。使用脑电图,医生能够更好地诊断脑部疾病;研究人员也能够更好地了解脑电波与行为活动之间的关系,从而研发更加智能的设备。本文通过将脑电图测量仪器采集的脑电图数据作为输入,将对应的人的眼睛的状态作为输出来进行脑电图的研究。为有效提高脑电图数据眼睛状态分类的可靠性及精确度,本文根据脑电图数据的规律及脑电图在人睁眼闭眼时数据变化的特征,提出了基于数据异常值处理的随机森林和kNN模型。本文首先对原始数据进行数据预处理:这部分主要包含对数据的缺失值处理、异常值处理和一致性分析;对于本文使用的数据,我们使用统计量分析和分维可视化图来处理数据集中的异常值。然后,在数据进行异常值处理后,使用随机森林和kNN建立具体的模型。对于随机森林,主要对模型的OOB误差率和变量的重要性进行讨论;对于kNN模型,由于k值对模型比较关键,本文通过在训练集上采用交叉验证的方法来确定k值,进而使用确定后的k值来进行测试集的评价。最后为了显示随机森林和kNN算法这两个模型在该数据集上的有效性,本文使用决策树、Bagging和SVM模型作为对比方法,进行模型的比较,同时也讨论了数据集中样本的不均衡性对模型的影响。结果表明:本文提出的基于异常值处理的随机森林和kNN模型具有更好的预测准确度,随机森林的预测精确度达到92.9392%,kNN算法的预测精确度达到97.0946%。由此,随机森林和kNN算法都是有效的该脑电图数据的预测模型,尤其是kNN算法,相比本文中的其他方法,其具有最好的预测效果。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分