咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >数据流预测管理技术研究 收藏
数据流预测管理技术研究

数据流预测管理技术研究

作     者:秦林新 

作者单位:南京大学 

学位级别:硕士

导师姓名:刘奇志

授予年度:2012年

学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 

主      题:数据流 预测 一体化模型 GEP 概率 双时间戳 历史存储 查询解析 

摘      要:数据流作为一种新的数据形式,普遍存在于众多信息系统中。利用现有信息预测客观事物的未来趋势,是数据流相关实际应用中的重要需求之一。目前数据流管理技术缺乏对数据流预测管理功能的支持。本文从数据流预测管理一体化模型角度出发,研究数据流预测算法及其相关技术。 首先,基于现有数据流管理系统架构,本文建立了数据流预测管理一体化模型,该模型包括数据流预处理、数据流存储管理和数据流预测查询解析三个组成部分。其中,预处理和存储管理部分不仅支持数据流常规查询,还为数据流预测查询提供数据服务,预测查询解析部分可以解析用户注册的带有预测查询算子的持续查询语句,并与相应的预测函数关联。 其次,在GEP遗传算法研究基础上,本文设计了高效的具有演化能力的数据流预测算法,以便动态生成预测函数。标准GEP算法包括初始化种群、选择遗传种群、对父代个体进行操作三个主要步骤。本文分别对这三个步骤进行了改进:(1)提出基于概率的策略确定初始种群,使得种群的基因趋向多样化;(2)综合考虑个体间的隐性和显性海明距离,选择遗传信息,不仅进一步保证种群基因多样化,还能避免算法陷入局部最优;(3)按照各基因在各个位置的适合程度,确定各个基因在各个位置的变异概率,并指引基因变异的方向,从而提高种群的进化效率。 最后,在模型实现时,本文分别采用以下技术:(1)提出了基于双时间戳偏倚抽样方法对原始数据流(包括乱序数据流)进行预处理,以便快速给预测函数生成模块提供具有代表性的训练数据;(2)设计了HSDI-Tree结构存储历史数据,以便在预测函数需要调整时,能够快速访问历史数据;(3)在STREAM系统CQL语言的基础.上,设计了预测查询算子;(4)以股票数据为实验数据集的实验结果表明,本文的预测模型的预测误差随着训练数据量不断增大而不断减小,改进的GEP预测算法搜索速度更快。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分