咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于信息熵的高维稀疏大数据降维算法研究 收藏

基于信息熵的高维稀疏大数据降维算法研究

Research on Dimensional Reduction of Sparse Matrix Data Based on Information Entropy

作     者:何兴高 李蝉娟 王瑞锦 邓伏虎 刘行 HE Xing-gao;LI Chan-juan;WANG Rui-jin;DENG Fu-hu;LIU Xing

作者机构:电子科技大学信息与软件工程学院成都610054 

出 版 物:《电子科技大学学报》 (Journal of University of Electronic Science and Technology of China)

年 卷 期:2018年第47卷第2期

页      面:235-241页

核心收录:

学科分类:0839[工学-网络空间安全] 08[工学] 081201[工学-计算机系统结构] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

基  金:国家自然科学基金(61472064 61602096) 四川省科技计划项目(2016FZ0002 2015JY0178 2016ZC2575) 四川省教育厅重点项目(17ZA0322) 中央高校基本科研基金(ZYGX2014J051 ZYGX2014J066) 网络与数据安全四川省重点实验室开放课题(NDSMS201606) 

主  题:分块处理 降维处理 高维稀疏大数据 信息熵 主成分分析 

摘      要:数据降维是从高维数据中挖掘有效信息的必要步骤。传统的主成分分析(PCA)算法应用于超高维稀疏数据降维时,存在着无法将所有数据特征一次性读入内存以进行分析计算的问题,而之后提出的分块处理PCA算法由于耗时太长,并不能满足实际需求。本文引入信息熵的思想对PCA算法进行改进,提出E-PCA算法,先利用信息熵对数据进行特征筛选,剔除大部分无用特征,再使用PCA算法对处理后的超高维稀疏数据进行降维。通过实验结果表明,在保留相同比例原数据信息的情况下,本文提出的基于信息熵的E-PCA算法在内存占用、运行时间以及降维结果都优于分块处理PCA算法。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分