基于信息熵蚁群聚类的模糊C-均值算法的研究-南通市图书馆

文献详情 >基于信息熵蚁群聚类的模糊C-均值算法的研究收藏

基于信息熵蚁群聚类的模糊C-均值算法的研究

作者：荣巧梅

作者单位：青岛理工大学

学位级别：硕士

导师姓名：李兰

授予年度：2010年

学科分类：12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)]

主题：聚类算法模糊C-均值算法信息熵蚁群算法 Voronoi距离

摘要：聚类是数据挖掘的重要分支之一。近年来随着数据挖掘研究的深入,涌现出大量新的聚类算法,每种聚类算法都是针对某一应用领域,也各有其优缺点。在众多的聚类算法中,模糊C-均值算法是目前使用最为广泛的基于目标函数的模糊聚类算法。但是该算法仍然存在一些不足之处,例如其聚类结果受初始化影响较大,在迭代时容易陷入局部极小等。针对这种研究现状,本文主要从三个角度对模糊C-均值算法做了改进: (1)模糊C-均值算法与基于信息熵的蚁群算法的结合使用。先执行基于信息熵的蚁群算法得到聚类数目C和聚类中心。然后以此作为模糊C-均值算法的初始参数,进行迭代优化,既克服了模糊C-均值算法对初始化参数极为敏感的缺陷,又避免了陷入局部极小值。创新之处在于引入的不是标准的蚁群算法而是基于信息熵的蚁群算法。这一改进,改变了蚂蚁拾起或放下的规则,比较的是信息熵值的改变而不是概率,减少了算法执行的随机性。 (2)提出了属性加权的思想。鉴于在实际应用中发现,对于含有多维属性的数据集,往往有些属性对数据的聚类影响较大,而有些属性则影响较小。属性的分布特征与数据的聚类有着不可忽视的作用,因此本文为每个属性赋予一个权重。随后基于这种思想,本文重新推导了模糊C-均值算法的目标函数、聚类中心和隶属度函数的迭代公式。 (3)本文提出用一种Voronoi距离代替欧氏距离的方法来调整隶属度的计算公式,以此克服模糊C-均值算法的聚类结果易受噪声数据干扰的缺陷。采用欧氏距离只能发现球状的簇,改用Voronoi距离就可以形成任意形状的簇,更加符合实际效果。隶属度计算公式改用Voronoi距离以调节隶属度的值,使隶属度的值大的数据对象对聚类中心位置的影响增大,对于隶属度小的数据对象(噪声数据)则降低它们对聚类中心的影响,从而也减小了孤立点对聚类结果的影响。实验结果表明,改进后的算法无论是在时间性能,还是聚类结果的准确性、稳定性方面都取得了较好的效果。

本地馆藏 |

1、借阅数量：每证可借书6册，期刊2册，团体读者证可借书刊300册。 2、借阅时间：个人借期为30天，每本书可续借1次，借期为30天；团体借期为90天。 3、归还地点：3楼服务台、自助借还设备、还书箱、各分馆 4、馆际互借：读者未能在本馆获取所需文献资料，可至参考咨询阅览室服务台填写《南通市图书馆馆际互借读者申请表》，根据馆际互借协议，我馆将为读者向其他馆代借文献。馆际互借过程中所产生的费用（资料复印、邮寄费等），由读者个人承担。 5、服务电话续借：59003605 59003606 咨询：81100100 59003600

电子资源

同方学位论文库

目录详情 | 试阅读 |

读者评论与其他读者分享你的观点

学校读者

用户名:未登录

我的评分

欢迎您,

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

看过本文的还看了

相关文献

该作者的其他文献

基于信息熵蚁群聚类的模糊C-均值算法的研究

读者评论与其他读者分享你的观点

请选择收藏分类：

欢迎您,

建议与咨询 留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

看过本文的还看了

相关文献

该作者的其他文献

基于信息熵蚁群聚类的模糊C-均值算法的研究

读者评论 与其他读者分享你的观点

请选择收藏分类： 新增自定义分类 确定 取消

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

读者评论与其他读者分享你的观点

请选择收藏分类：