基于时间序列模型的文本数据压缩存储算法
Text data compression and storage algorithm based on time series model作者机构:南京航空航天大学经济与管理学院南京211000 南京工业大学理学院南京211800
出 版 物:《吉林大学学报(工学版)》 (Journal of Jilin University:Engineering and Technology Edition)
年 卷 期:2023年第53卷第7期
页 面:2109-2114页
核心收录:
学科分类:08[工学] 081201[工学-计算机系统结构] 0812[工学-计算机科学与技术(可授工学、理学学位)]
主 题:时间序列模型 文本数据 压缩存储算法 小波阈值去噪方法 非线性函数 预处理
摘 要:为了降低文本数据历史数据量,提升文本数据压缩存储效率,提出一种基于时间序列模型的文本数据压缩存储算法。采用小波阈值去噪方法估计并消除文本数据的误差和噪声;从文本数据特征角度,通过细节描述特征,设定特征类型之间的组合和继承关系,组建时间序列模型。将经过预处理的文本数据采用时间序列模型转换为结构近似的二进制编码字节,通过异或操作对结果中的冗余部分进行压缩处理,同时将压缩的数据存储到对应的数据库中,最终完成文本数据压缩存储。仿真实验结果表明,本文算法可以有效提升压缩性能,获取更优的文本数据压缩存储结果。