基于Web Log的数据预处理研究
Research of Data Preparation Based on Web Log作者机构:湖南师范大学计算机教学部中国长沙410081 中南大学商学院信息管理系中国长沙410083
出 版 物:《湖南师范大学自然科学学报》 (Journal of Natural Science of Hunan Normal University)
年 卷 期:2004年第27卷第4期
页 面:33-36,54页
核心收录:
学科分类:0810[工学-信息与通信工程] 12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 08[工学] 0805[工学-材料科学与工程(可授工学、理学学位)] 0835[工学-软件工程] 081201[工学-计算机系统结构] 0812[工学-计算机科学与技术(可授工学、理学学位)] 081202[工学-计算机软件与理论]
主 题:Web日志挖掘 数据预处理 基于Web Web挖掘 日志文件 数据抽取 数据净化 过程 实际 实现方法
摘 要:Web日志文件是进行Web挖掘的重要数据来源,对Web日志的数据预处理是Web挖掘过程中关键的一步.首先介绍了Web日志挖掘的体系结构,然后详细地分析了Web日志文件,并对基于Web日志文件的数据预处理进行了较深入的研究,提出了包括数据净化、数据抽取、数据转换和数据集成等过程的具有实际应用价值的数据预处理的实现方法.