基于关联挖掘的学生成绩分析系统的研究
作者单位:浙江工业大学
学位级别:硕士
导师姓名:郝平;张涛
授予年度:2011年
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)]
主 题:数据挖掘 关联规则 FPT B-Apriori 成绩分析
摘 要:随着高等教育的普及,各个高校不断开始扩招,使得在校学生的数量急剧增加。在普及教育的同时,也造成了信息量的飞速增长,给学校管理者和教师的管理教育工作带了不少严峻问题。传统的教育管理手段已经不能满足新形势下的教育管理工作,面对大量的数据已显得力不从心。其中,如何对学生的考试成绩进行科学有效的管理就是众多问题中一个急需解决的问题。数据挖掘能够有效解决这一问题。 目前大多数高校都建有学生成绩数据库,但只是进行简单的查询和统计操作,而隐藏在这些成绩数据背后更有价值的信息没有被挖掘并利用。针对这一问题,本文提出利用数据挖掘中的关联挖掘方法对学生成绩进行更深层次的挖掘,得到不同课程之间的关联信息,以便于学校管理者决策分析、教师的授课计划以及学生的学习安排。本文主要工作和成果如下: 1、针对传统的关联挖掘算法FP-growth效率不高问题,本文在此基础上提出FPT算法。FPT算法对其数据结构进行改进,增加了一个tail域,将所有的项组织起来生成FPT-tree。在新增一个节点时,传统的方法需从链表的第一个节点开始查找,然后顺着各个节点的next指针,直到找到最后一个节点,再将新节点插入链表尾部。FPT算法通过查找FPT-tree中的tail域,直接可找到链表的最后一个节点,直接将新节点插入即可,提高了效率。实验表明改进后的FPT算法在性能上有较大提高,尤其在处理大数据量时,这种优势更明显。 2、由于学生的成绩是离散数值型,为方便应用关联挖掘算法对其挖掘,需要将学生成绩进行区间划分。然而,划分区间长度的大小直接影响关联规则的产生。为了尽可能降低这种影响,本文将模糊集引入关联挖掘中,提出模糊关联挖掘算法B-Apriori。将需挖掘的属性集分成若干模糊集,计算数据项对其模糊集的隶属度,通过隶属度计算出项集的支持度和置信度。实验验证表明B-Apriori算法具有较高的准确性和实用性。 3、设计并实现了基于FPT算法和B-Apriori算法的学生成绩管理系统,对学生成绩进行分析,发现不同课程之间的关联,为教师教学管理工作和学生学习提供决策。