咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于密度的分布式聚类算法研究 收藏
基于密度的分布式聚类算法研究

基于密度的分布式聚类算法研究

作     者:温海峰 

作者单位:哈尔滨工程大学 

学位级别:硕士

导师姓名:刘杰

授予年度:2007年

学科分类:08[工学] 0812[工学-计算机科学与技术(可授工学、理学学位)] 081202[工学-计算机软件与理论] 

主      题:数据库 分布式数据挖掘 聚类 Java Data Mining 

摘      要:随着现代企业的信息化快速发展,信息系统产生的数据量日益增大,从大量的数据中提取有用信息并非易事。如何有效地利用海量的原始数据分析现状、预测未来,已成为人类面临的一大挑战,数据挖掘就是为了满足这种需要而产生的。 Java Data Mining框架是Java平台下的标准数据挖掘应用程序规范,本文介绍了JDM的三个核心组成部分及三者之间的关系,详细讨论了JDM API的部分接口、方法。 聚类分析是数据挖掘中的一个重要研究领域,目前聚类在销售、多媒体和生物学等方面的应用越来越广泛。在这些应用领域中,数据都分布在不同的站点上,如果使用传统的聚类算法从这些分布式数据中提取信息,就必须把这些数据合并到一个中心站点上。由于传输速度和安全因素的限制,把各个站点的数据都集中到中心站点上是十分困难的,在某些领域中把数据集中到一个站点几乎是不可能的,额外开销很大。 DBDC算法是一种基于密度的分布式聚类算法,本文针对DBDC算法在局部聚类和全局聚类上的不足进行了改进。改进后的算法能够有效地处理局部站点的噪声数据,在不明显降低效率的前提下有效地提高了分布式聚类的准确性。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分