咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于频繁子树模式的GML文档结构聚类算法 收藏

基于频繁子树模式的GML文档结构聚类算法

GML document structural clustering algorithm based on frequent subtree patterns

作     者:朱颖雯 吉根林 孙勤红 ZHU Yingwen;JI Genlin;SUN Qinhong

作者机构:三江学院计算机基础部南京210012 南京师范大学计算机学院南京210097 

出 版 物:《计算机工程与应用》 (Computer Engineering and Applications)

年 卷 期:2011年第47卷第1期

页      面:144-146,149页

核心收录:

学科分类:08[工学] 0835[工学-软件工程] 081202[工学-计算机软件与理论] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

基  金:国家自然科学基金No.40871176~~ 

主  题:地理标识语言(GML)结构聚类 最大频繁Induced子树 闭合频繁Induced子树 

摘      要:提出了一种基于频繁子树模式的GML文档结构聚类算法GCFS(GML Clustering based on Frequent Subtree patterns),与其他相关算法不同,该算法首先挖掘GML文档集合中的最大与闭合频繁Induced子树,并将其作为聚类特征,根据频繁子树的大小赋予不同的权值,采用余弦函数定义相似度,利用K-Means算法对聚类特征进行聚类。实验结果表明算法GCFS是有效的,具有较高的聚类效率,性能优于其他同类算法。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分