路径聚类:在Web站点中的知识发现
PATH CLUSTERING: DISCOVERING THE KNOWLEDGE IN THE WEB SITE作者机构:中国科学院计算技术研究所北京100080
出 版 物:《计算机研究与发展》 (Journal of Computer Research and Development)
年 卷 期:2001年第38卷第4期
页 面:482-486页
核心收录:
学科分类:0810[工学-信息与通信工程] 12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 0808[工学-电气工程] 0839[工学-网络空间安全] 08[工学] 0835[工学-软件工程] 0811[工学-控制科学与工程] 081201[工学-计算机系统结构] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家"八六三"高技术研究发展计划基金资助!(86 3-30 6 -JD0 6 -0 3-4 )
主 题:数据挖掘 Web站点 知识发现 路径聚类 WWW Internet
摘 要:用户对 Web站点的访问代表了用户对 Web站点上页面的访问兴趣 .这种兴趣程度可以通过用户对 Web站点上页面的浏览顺序表现出来 .在对 Web站点的访问日志进行事务识别后 ,可以根据群体用户对 Web站点的访问顺序进行聚类 ,即路径聚类 ,那么最终每一个聚类集就反映出该聚类集中的全体用户具有相似的访问兴趣 .为了得到这种根据用户访问兴趣而对用户集的划分 ,提出了 K- paths路径聚类方法 .在这种方法中 ,根据用户的访问兴趣定义了新的相似性测量手段和聚类中心 。