C4.5决策树算法在素质教育学分成绩分析与评价中的应用

时间:2022-10-01 11:03:48

C4.5决策树算法在素质教育学分成绩分析与评价中的应用

摘 要:为了探究素质教育的管理模式并将其运用到高职院校的素质教育工作中,本文引入了数据挖掘技术,将素质教育学分化和数据化,从而实现对素质教育学分的分析与评价,为学生的素质教育提供更宽阔的发展空间和制度保障,使素质教育成为高职院校教育教学工作的有机组成部分。

关键词:素质教育;学分制系统;决策树算法;数据挖掘

1 概述

素质教育教学过程中,尤其是将学分制引入素质教育中后,相关数据具有数据容量大、不完全、有噪声、随机性、模糊性等特点。传统的数据处理方法根本无法胜任如此复杂的数据处理工作,因此必须采用数据挖掘相关技术,提取对素质教育发展有价值的数据信息,然后再进行更深层次的研究。

2 C4.5决策树算法在素质教育学分成绩评价与分析中的适用性分析

决策树(Decision Tree)是运用于分类的一种树型结构,可以对未知的数据通过分析进行分类或预测。在数据挖掘的研究与应用中,决策树是一种经常要用到的技术,在数据分析和预测中发挥着重要作用,决策树算法是目前应用非常广泛的一种学习方法,其中C4.5算法应用最广泛,其既能处理分类问题,又能处理回归问题,它产生的规则容易理解,准确率高。分析学生素质教育成绩优良与哪些因素有关,属于预测中的分类数据挖掘。

3 基于C4.5决策树算法的素质教育学分评价模型的构建

3.1 数据收集 本文的数据由某高职院校学工部提供,分别取自“会计”与“商务管理”两个专业,数据源包括学生的基本信息(来自学生学籍管理系统)、教师信息(来自教务管理系统)、素质教育学分成绩等,然后最终用到的数据就是以这三者为基础的关系数据库。

3.2 数据预处理 ①数据属性删除。通过对某高职院校的素质教育学分制应用情况进行调研,结果发现,学生信息库中几张数据库表格中的很多属性,与其他的数据显然存在着较大的区别,存在很大的不一致性,是不相关的,因此必须删除,以减少后期数据挖掘不必要的时间、精力以及财力的浪费。②数据属性泛化:通过对某高职院校的素质教育学分制应用情况进行调研,应用数据泛化原理,对大学生信息中的“学分成绩”进行了泛化处理,3.0分以上为“优秀”;2-2.9分之间为“中”;其他为“一般”。到课率泛化为:到课率>=95的为“高”,90%至95%之间的为“中”,<90%的为“低”。教师教学经验泛化为:具有五年以上教学经历的为“丰富”,五年以下的为“不丰富”。特长爱好根据学生的登记信息对比相关课程,泛化为“爱好”和“不爱好”。③数据清理:通过对某高职院校的素质教育学分制应用情况进行调研,结果发现,虽然学生信息、教师信息等数据相对比较完整,但仍然存在某些记录不完整、没有填写或者填写错误等问题,需要进行数据清理,针对不同的数据类型,采用不同的数据清理技术来处理。

3.3 创建决策树模型

3.3.1 信息增益率的计算(略)。

根据公式GainRatio(S,A)=,依次计算出所有属性的信息增益率:

Gainratio(性别)==0.0024

Gainratio(专业)==0.00006

Gainratio(音乐爱好)=)=0.00005

Gainratio(到课率)=)=0.0794

Gainratio(教师经验)=)=0.0438

3.3.2 递归创建决策树。从以上计算结果得知,“到课率”属性的信息增益率最高,因此,“到课率”被选为第一个测试属性。创建根节点,用“到课率”标记,并根据它的三个属性值,引出三个分枝,样本以此划分,然后再分别计算各个分枝节点的划分,根据算法继续计算,得出当“到课率”=“高”时的划分,如图1所示。

重复以上步骤,完成各个分枝的划分,递归得到学生音乐课学分成绩决策树模型。如图2所示。

<D:\123456\中小企业管理与科技・下旬刊201511\1-297\232-2.jpg>

图2 素质教育音乐学分成绩决策树模型

4 素质教育学分成绩评价模型的评估与分析

依据上述素质教育音乐学分成绩决策树模型,对音乐成绩保留的160个样本进行测试,通过测试其准确率达到88.75%,通过测试来判断它的合理性,以检验分类规则的准确率,由此我们可以看到,经过测试,采用C4.5决策树算法生成的分类规则的准确率大于85%,基本符合要求,如果再进行适当的修剪,正确率会更高。因此该模型较为合理,可以加以应用。通过对学生音乐课成绩的分析,得到以下建议:一是到课率对学生学习成绩的影响较大,学生应该在学习过程中严格遵守学校的学习纪律,按时上课,端正学习态度,按时完成老师要求完成的学习任务。二是学生的专业对学习成绩也有一定的影响,不同专业的学生的性格、爱好都不一样。三是教师的教学经验对学生的学习成绩影较大,教师应该通过各种途径不断地丰富自己的教学经验,提高音乐专业技能和音乐教学水平,以此来进一步提高学生的到课率。

综上所述,C4.5决策树算法对于素质教育学分成绩的分析与评价的应用研究具有较好的适用性,通过对成绩的分析与评价,可以了解影响学生成绩的主要因素,从而帮助学生改进学习方法,辅助教师提高教学水平,为教学管理者提供决策依据,从而提高高职院校素质教育的整体水平。

参考文献:

[1]杜玉波.全面推进素质教育,培养高素质创新人才[J].中国高教研究,2012,01:1-4.

[2]哈申花,张春生.基于C4.5决策树学生成绩数据挖掘方法[J].内蒙古民族大学学报(自然科学版),2010,02:151-152+158.

上一篇:提升大学生毕业论文质量的几点思考 下一篇:复杂条件综采工作面安全高效开采技术