一种基于GN算法的文本概念聚类新方法
New method for text concept clustering based on GN algorithm作者机构:辽宁师范大学计算机与信息技术学院辽宁大连116029
出 版 物:《计算机工程与应用》 (Computer Engineering and Applications)
年 卷 期:2008年第44卷第14期
页 面:142-144,180页
核心收录:
学科分类:08[工学] 081203[工学-计算机应用技术] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家自然科学基金(the National Natural Science Foundation of China under Grant No.10771092) 国家重点基础研究发展规划(973)(the National Grand Fundamental Research973Program of China under Grant No.2004CB318000)
摘 要:文本聚类是当前文本信息挖掘的基础和研究的重点。给出一种新的文本聚类方法,它将概念格和复杂网络有机地结合起来,以达到更优的聚类效果。首先计算关键词特征权值并对特征向量进行降维处理,然后根据关键词权值大小映射到形式背景中,通过本文所给出的新的相似度公式,计算出形式背景中概念相似度的大小,从而构造GN网络并应用GN算法进行文本概念聚类。最后通过实例,验证了方法的可行性。