咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于信息熵蚁群聚类的模糊C-均值算法的研究 收藏
基于信息熵蚁群聚类的模糊C-均值算法的研究

基于信息熵蚁群聚类的模糊C-均值算法的研究

作     者:荣巧梅 

作者单位:青岛理工大学 

学位级别:硕士

导师姓名:李兰

授予年度:2010年

学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 

主      题:聚类算法 模糊C-均值算法 信息熵 蚁群算法 Voronoi距离 

摘      要:聚类是数据挖掘的重要分支之一。近年来随着数据挖掘研究的深入,涌现出大量新的聚类算法,每种聚类算法都是针对某一应用领域,也各有其优缺点。在众多的聚类算法中,模糊C-均值算法是目前使用最为广泛的基于目标函数的模糊聚类算法。但是该算法仍然存在一些不足之处,例如其聚类结果受初始化影响较大,在迭代时容易陷入局部极小等。针对这种研究现状,本文主要从三个角度对模糊C-均值算法做了改进: (1)模糊C-均值算法与基于信息熵的蚁群算法的结合使用。先执行基于信息熵的蚁群算法得到聚类数目C和聚类中心。然后以此作为模糊C-均值算法的初始参数,进行迭代优化,既克服了模糊C-均值算法对初始化参数极为敏感的缺陷,又避免了陷入局部极小值。创新之处在于引入的不是标准的蚁群算法而是基于信息熵的蚁群算法。这一改进,改变了蚂蚁拾起或放下的规则,比较的是信息熵值的改变而不是概率,减少了算法执行的随机性。 (2)提出了属性加权的思想。鉴于在实际应用中发现,对于含有多维属性的数据集,往往有些属性对数据的聚类影响较大,而有些属性则影响较小。属性的分布特征与数据的聚类有着不可忽视的作用,因此本文为每个属性赋予一个权重。随后基于这种思想,本文重新推导了模糊C-均值算法的目标函数、聚类中心和隶属度函数的迭代公式。 (3)本文提出用一种Voronoi距离代替欧氏距离的方法来调整隶属度的计算公式,以此克服模糊C-均值算法的聚类结果易受噪声数据干扰的缺陷。采用欧氏距离只能发现球状的簇,改用Voronoi距离就可以形成任意形状的簇,更加符合实际效果。隶属度计算公式改用Voronoi距离以调节隶属度的值,使隶属度的值大的数据对象对聚类中心位置的影响增大,对于隶属度小的数据对象(噪声数据)则降低它们对聚类中心的影响,从而也减小了孤立点对聚类结果的影响。 实验结果表明,改进后的算法无论是在时间性能,还是聚类结果的准确性、稳定性方面都取得了较好的效果。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分