基于关联规则的成绩预警模型研究

时间:2022-10-12 10:46:28

基于关联规则的成绩预警模型研究

摘 要:近年来,随着我国高校招生规模的不断扩大以及不断提高的信息化程度,在各学校的教务系统中普遍存储了大量的资料、数据等信息。在这些资料和数据等信息中,内在隐藏了大量的、有价值的内在规律。数据挖掘技术是从大量的、随机的数据中找出隐藏在其中的、有价值的信息的过程。该文提出了一种基于关联规则挖掘的成绩预警模型。

关键词:关联规则 Apriori算法 成绩预警模型

中图分类号:TP301 文献标识码:A 文章编号:1674-098X(2013)03(c)-00-01

数据挖掘技术可以在教学管理过程中应用,会在教学效果考察、课程设置安排等方面起到帮助作用。举一个例子来说,学校开设的专业课之间,如何合理安排课程的先后顺序,也就是怎样安排学生在学校中学习和知识增长的过程。合理的安排可以有效提高学校管理的提前预知、教法的合理选择以及教学的科学指导,对高校教育管理、人才创新能力培养,具有十分重要的意义。因成绩预警信息针对性很强,简单利用以关联规则为基础的数据挖掘技术很难解决成绩预警问题。该文将关联规则应用于学生的成绩之中,提出有针对性的课程成绩预警模型,为实践提供理论依据。

1 核心原理

在研究和利用关联规则之前,必须先理清相关概念。关联规则定义是在交易数据以及信息载体中,对存在于项目集合或对象集合之间的频繁模式、关联、相关性或因果结构进行查找,通过分析数据之间的相关关系,找出内在的联系。说得更具体一些,关联规则就是类似XY的表达式,X、Y分别代表关联规则的先导、后继。假设I是项的集合。一个给定的交易数据库,标记为D,每个数据t都是集合I的非空子集,也就是每个交易都与唯一的标识符相对应,记为TID。

两个重要的概念:D中的支持度是D中事务同时包含X、Y的百分比,也就是概率;包含X的同时又包含Y的百分比,即条件概率叫做置信度。关联规则的挖掘过程包含两个重要阶段:第一阶段,从资料集合中找出所有的高频项目组;第二阶段,由找到的高频项目组中产生关联规则。

该文提出的理论模型基于关联规则的Apriori算法。Apriori算法是一种基于挖掘关联规则的频繁项集算法,通过对数据关联性进行分析、挖掘,找出数据在决策制定过程中重要的参考价值。

Apriori算法目前也被应用于高校管理中。例如:学校的管理部门对于贫困学生的资助问题,由于贫困生数量的增多导致工作的难度也逐渐加大。针对这一问题,Apriori算法可以提出解决方法。该文借鉴了Apriori算法在教学管理中的具体应用,建立了成绩预警模型。

2 基于关联规则的成绩预警模型

在高校的教学管理中,对学生进行科学的学习评价是十分重要的工作职责,不但能对学生起到信息反馈、激发学习动力的作用,又能检查学校整体的课程安排计划是否合理,还能发现学生间的个体差异达到因材施教。

在我国目前的教学管理体系中,成绩是评价学生的最主要指标。学生在学校学习的过程中,各门课程都会产生成绩数据,每门课又会根据实际情况,产生诸如平时成绩、考勤成绩、期末成绩等多项成绩数据。面对如此大量的数据,利用数据挖掘技术,对学生的学习成绩数据库进行科学的分析处理,可以及时掌握学生的评价结果,对学生成绩出现的问题及时预警、及时解决,更好的开展教学工作。

该文提出了以下一种基于关联规则的成绩预警的理论模型,目的是对成绩进行系统地预警分析。本预警模型试图通过兴趣度约束、预警项集约束以及项顺序关系约束三种约束关系,实现对数据的定向挖掘,使分析结果具有更强的针对性。该模型完全可以基于现实数据来源来开展实验研究,具有很强的可操作性。

模型中,预警工作可以划分成两个阶段:训练阶段、预警阶段。在训练阶段,预警系统接收学生成绩的训练数据,从接收到的数据中自动形成系统所需的成绩预警规则;在预警阶段,系统依照训练阶段生成的预警规则,结合输入的学生成绩和预警课程信息,产生预警信息。

基于关联规则的成绩预警模型由以下五部分组成:(1)成绩输入(输出)口;(2)预处理模块;(3)预警规则挖掘模块;(4)成绩预警规则(5)预警模块。

预警规则的挖掘是成绩预警系统中最为核心的部分。预警模块根据输入的学生成绩数据和预警课程信息,从成绩预警规则中提取相应的预警规则集,根据所设计的预警策略决定是否生成预警信息。在实际的预警过程中,具体过程如下:

(1)系统处理一个接收到的学生成绩数据;

(2)通过预处理模块将数据转变成系统规定的标准格式;

(3)预警模块中的预警课程信息从预警规则库中提取预警规则集,分析成绩数据,进行匹配分析;

(4)匹配预警时,首先在成绩数据中寻找当前规则的前项。如果找不到,则认为此条规则不适用于这条记录,放弃匹配,转向规则集中的下一条规则;如果能够找到,则认为此条规则适用于这条记录,通过预警信息输出口输出预警信息,并退出预警过程。

通过上述过程,学生成绩数据的预警工作就可以自动完成。通过系统输出的预警信息,教师、学生都可以根据具体情况,不断改进自身的教学或学习工作,提高整体的学习成绩。

3 结语

该文提出了一种基于关联规则挖掘的成绩预警的理论模型,以预警规则集为基础,根据预警算法生成预警信息。该理论模型的实际可操作性极强,可直接应用于目前的教学管理中。通过实际的实践过程,还可以不断充实、完善该模型,达到更好的效果。

参考文献

[1] 张玉林.数据挖掘技术在教学过程中的指导作用[J].西安通信学院学报,2006,5(2):38-40.

[2] 蒋秀英.关联规则在课堂教学评价中的应用[J].山东师范大学学报(自然科学版),2003,18(3):25-28.

[3] 赵丹群.数据挖掘:原理、方法及其应用[J].现代图书情报技术,2000(6):1.

[4] 陶兰,王保迎,吕建军.数据挖掘技术在高等学校决策支持中的应用[J].中国农业大学学报,2003,8(2):39-41.

[5] 芦洁,刘志镜.挖掘关联规则中对Apriori算法的一个改进[J].微电子学与计算机,2006,23(2):10-12.

[6] 胡吉明,鲜学丰.挖掘关联规则中Apriori算法的研究与改进[J].计算机技术与发展,2006,16(4):99-104.

[7] 卢炎生,杨芬,赵栋.带单调约束的关联规则挖掘[J].计算机工程,2004,30(15):78-80.

上一篇:高压变频调速节能控制技术在水电厂水泵系统中... 下一篇:谈如何提高技工学校机械加工课程的教学效果