咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于降维的面板数据聚类方法研究 收藏
基于降维的面板数据聚类方法研究

基于降维的面板数据聚类方法研究

作     者:唐婷婷 

作者单位:桂林理工大学 

学位级别:硕士

导师姓名:邓光明;曾鹏

授予年度:2021年

学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 

主      题:面板数据 稳健统计量 特征提取 贝叶斯定理 聚类分析 

摘      要:降维是面板数据聚类中较为常用的一种方法,通过降维方法将面板数据降维成截面数据或时间序列数据,再选择合适的聚类算法进行聚类分析,这类方法便于理解,且适用性较强,能够根据聚类目的来选择适合的聚类方法。主成分分析法和特征提取法是面板数据聚类中常用的两种降维方法,但当数据中存在离群值时,主成分分析法不能够有效的对离群值进行识别和处理,进而影响时间序列提取的准确性,特征提取法虽能够有效避免离群值带来的影响,但对特征进行赋权时采用层次分析法则会对专家赋权较为敏感,缺乏客观合理性,导致降维效果不理想。基于此,本文在现有的降维方法的基础上,针对主成分分析法和特征提取法存在的不足进行分析和研究,提出了两种改进的基于降维的面板数据聚类方法。首先,针对动态时间规整的面板数据聚类中,对面板数据进行主成分降维时未考虑离群值对动态时间规整结果的影响,获取的时间序列不稳健这一问题,提出了稳健动态时间规整的面板数据聚类方法,通过引入稳健统计量来消除离群值对动态时间规整结果的影响,进而提升面板数据聚类的效果。采用31个省市自治区的人口情况数据对稳健动态时间规整的面板数据聚类方法进行实证分析,得出各省市自治区的人口情况聚类结果,并与改进前的方法进行对比分析。其次,针对基于特征提取的面板数据聚类中,采用特征提取的方法对面板数据进行降维时,运用层次分析法对提取的特征进行赋权易受专家赋权的影响,导致聚类效果偏离实际情况的问题,结合了贝叶斯思想,将层次分析法求权重问题转化成求概率问题对权重进行修正,提出了基于贝叶斯修正的特征提取的面板数据聚类方法。这个方法在满足研究者可以对实际问题的偏好选择权重的同时,又能够提升赋权的合理性和有效性。通过实证分析证明了贝叶斯修正下的特征提取的面板数据聚类效果更好。最后,通过不同数据的交叉对照试验检验两种改进后的聚类方法的适用性。实证结果表明,稳健动态时间规整的面板数据聚类法更适用于数据量较小,波动性较弱的面板数据,贝叶斯修正的特征提取的面板数据聚类法适用于数据量较大,波动性较强的面板数据。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分