基于广义序列方法的科学平台用户浏览方式挖掘
Web usage mining of science platform by frequent generalized subsequence s method作者机构:清华大学自动化系北京100084
出 版 物:《清华大学学报(自然科学版)》 (Journal of Tsinghua University(Science and Technology))
年 卷 期:2003年第43卷第7期
页 面:873-875页
核心收录:
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 08[工学] 080402[工学-测试计量技术及仪器] 0804[工学-仪器科学与技术]
基 金:国家自然科学基金重点资助项目(69934010) 国家教育振兴计划项目
主 题:数据挖掘 数据库 科学平台 Web服务器日志 广义序列 用户浏览 广义频繁子序列
摘 要:为了分析网络用户的浏览行为特征,实现科学平台的网络个性化服务,用广义频繁子序列挖掘算法,该算法挖掘Web服务器日志中的用户浏览路径,设计科学平台用户的浏览模式,为用户提供主动式信息服务。经过对日志文件的预处理,得到用户会话文件,然后采用广义频繁子序列挖掘算法对用户浏览模式进行识别。实际应用表明,这种广义频繁子序列识别方法能够有效地发现用户的兴趣所在,从而更好地为用户在线浏览提供帮助。