基于决策树模型的非结构化云数据分块存储方法
Unstructured Cloud Data Block Storage Method Based on Decision Tree Model作者机构:上海邮电设计咨询研究院有限公司北京100070
出 版 物:《微型电脑应用》 (Microcomputer Applications)
年 卷 期:2024年第40卷第9期
页 面:197-201页
学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
主 题:决策树模型 非结构化 云数据 分块存储 预处理 范德蒙矩阵
摘 要:以降低非结构化云数据存储压力、提升非结构化云数据存储能力为目的,研究基于决策树模型的非结构化云数据分块存储方法。采用数据清洗、数据选择、数据变换、归一化处理等过程预处理非结构化云数据,降低非结构化云数据维度。采用选择随机性特征分析方法,明确预处理后非结构化云数据间关联维度分布特征量与相似度的相关性,并以此为基础,通过样本扩展和密度融合的方法提取非结构化云数据特征。采用改进决策树算法对提取的非结构化云数据特征集进行模糊分类处理,将各类别非结构化云数据划分为相同规格的数据块,通过范德蒙矩阵编码、解码处理,在多个适配度较高的节点上完成非结构化云数据分块存储。实验结果表明,该方法有效计算比值达到0.8,具有较优的存储能力;压缩因子均值达到6.7,可显著降低非结构化云数据存储压力。