优化的Web日志会话识别方法
Improved method of session identification in web log mining作者机构:池州学院计算机系安徽池州247000 南京邮电大学计算机科学与技术系江苏南京210000
出 版 物:《计算机工程与设计》 (Computer Engineering and Design)
年 卷 期:2009年第30卷第7期
页 面:1688-1690页
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 08[工学] 081201[工学-计算机系统结构] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家自然科学基金项目(60573141 70271050) 江苏省计算机信息处理技术重点实验室基金项目(kjs050001) 池州学院自然科学基金项目(2007XJ015)
摘 要:关于Web使用挖掘中的会话识别问题,提出了一种改进的会话识别方法。统计每个页面的访问时间,并结合页面内容及站点结构生成页面访问时间阈值,再用页面访问时间阈值划分会话,然后对产生的会话集使用会话重组,即合并与断开的方法,对生成的会话集进行进一步地优化。通过实验结果表明,该方法所得到的会话集更具有真实性。