咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于CRM的数据挖掘技术研究及应用 收藏
基于CRM的数据挖掘技术研究及应用

基于CRM的数据挖掘技术研究及应用

作     者:崔海莉 

作者单位:合肥工业大学 

学位级别:硕士

导师姓名:袁兆山

授予年度:2006年

学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 

主      题:数据挖掘 关联规则 最大频繁项集 客户关系管理 

摘      要:海量数据的存在,从海量数据中提取信息的应用需求,以及信息对企业战略决策的影响,使得数据挖掘无论是理论研究还是应用实践都是有意义的。本文研究了数据挖掘技术在客户关系管理(CRM)中的应用。 关联规则在数据挖掘中是一个重要的研究领域,它具有通俗易懂、可理解性强、简洁性好、应用范围广等优点,主要任务是发现大量数据中项集之间的关联或相关关系。频繁项集的发现是产生关联规则的最为关键的一步,主要的方法是采用Apriori算法来寻找频繁项集,但是该算法的时间效率有待提高。 由于最大频繁项目集中已经隐含了所有频繁项目集,CRM中某些数据挖掘应用仅需要发现最大频繁项集,所以研究最大频繁项集的挖掘具有重要价值。本文针对CRM系统中数据的特点,提出了一个挖掘最大频繁项集的算法—MFIATL算法。该算法采用垂直事务标识列表(Vertical Tid-List,VTL)结构的数据库表示形式,按照自底向上深度优先的策略对项集空间进行搜索,采用基于前缀的搜索空间划分技术,将搜索空间划分为较小的子空间,每个子空间就是一个潜在的最大频繁集,这样发现最大频繁项集的工作即在一个尽可能小的、包含最大频繁集的超集上进行,因此将明显降低I/O开销。VTL结构的数据库表示形式使得项集的支持度计算可以通过简单的集合交集运算来完成,从而避免了对数据库的多次扫描。实验分析表明,MFIATL算法性能稳定,可扩展性好,效率高。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分