数据挖掘技术在高职教学评估中的应用研究

时间:2022-10-17 04:21:07

数据挖掘技术在高职教学评估中的应用研究

【摘 要】 信息时代的到来,给人们带来了很多方便,与此同时,过多的复杂的信息本身也存在着相应的隐患。第一是信息过多难以消化理解;第二是信息真假难以分辨;第三是信息的错综复杂使得安全难以保证;第四是信息形式不一致难以统一处理。另一方面,随着数据库技术的迅速发展以及数据库管理系统的广泛应用,人们积累的数据越来越多,增加的数据背后隐藏着许多重要的信息,如何将这些信息合理地利用起来为大家更好地服务,是一个值得研究的课题。

【关键词】 数据挖掘 高职 教学评估

随着教育信息化建设,教育界认识到教育数据的重要性,并积累了大量的教育数据,如何通过对这些庞大的数据进行分析,从而得到更多的有助于决策的信息,对于教育者来说是非常重要的。面对庞大的数据,传统的数据分析技术无法发现数据中隐藏的相互联系,导致教育数据并没有充分地、有效地发挥其在教育决策和教学测评中的作用,这个任务就落在数据挖掘者的身上。

1 问题研究的可行性

随着学校教育的发展,教学质量已成为一个学校的生命和灵魂。好的教学质量是学校发展的基础,它直接关系到学校人材的培养,影响到学校的声誉。每个学校都在努力加强教学质量的监控力度,确保课堂教学质量,以提高学校的综合实力。教学测评的主要目的是对教学过程和结果进行监控,以了解课程执行情况和教师的教学效果,以改进教学实施,从而进一步提高教育教学水平。

一般来说,教师评分情况中往往积累了大量的数据,但目前对这些数据的处理还停留在初级的数据备份、查询及简单统计阶段,使得这些数据还不能发挥它应有的作用。如何开发这些“宝藏”,利用这些数据理性地分析教学中各方面的成效得失是广大教师们共同关心的问题。从解决以上几个问题入手,认真分析原因,找到决定教师评分结果的真正原因势在必行。

2 总体设计方案

本文采用的决策树算法是一个能够适应多种情况的强壮算法,通过调节各种参数可以产生较好的分类和预测效果。数据挖掘技术的处理过程大致可以分为三个主要的阶段:数据准备、数据挖掘、结果表达和解释。

总体思想就是使用ID3改进算法对由部分数据形成的训练集进行划分,生成分类规则,然后利用剩余部分数据对结果进行测试,来检验生成的分类规则的正确性。

以教师评价为例,选取与教师评价相关的两个属性年龄和学位,生成一组训练数据,用决策树分类算法分析训练数据,生成分类规则,如图1所示;用一组测试数据来进行模型评估,如果准确率是可以接受的,则分类规则将用于新的数据分类,如图2所示,进行分类预测。

图1 利用训练集进行学习

图2 利用测试集进行验证

3 决策树算法在教学评估中的具体应用

3.1 数据的准备。

3.1.1 教师基本信息。本学院教师基本信息包括:姓名、年龄、学历、职称、专业、参加工作年限等属性,这些信息可通过本院教务处师资科获取详细信息。

3.1.2 学生提供的信息。本学院每学期期末采取学生对本学期授课教师授课情况进行打分的方法,采取不记名的方式,通过课堂上给学生分发评价表,学生按照评价表细则对教师作出授课评价。

学院督导组根据学生的不记名打分情况,将学生对教师课堂教学质量的综合评定(A代表优秀、B代表合格、C代表不合格)作为期末教师教学得分情况的一个重要参数。由于学生给教师打分采用不记名的方式,并且是在课堂上当堂打分,不会出现一人填写多份的现象,这就在一定程度上避免了不真实数据的产生。

3.1.3 学院领导提供的信息。学院领导和督导组也会按照课程计划,每学期对各个任课教师进行听课记录,发现教师的优点和不足,同时按照各项评价指标,对教师作出客观的评价。

督导组同样将领导专家的听课记录表中的评分作为考查教师教学质量情况的重要参数。因为学院领导以及专家的评价可以比较客观的体现教师实际授课水平,驾驭课堂的能力。

以上是几个方面数据的确定,本人认为,教师授课质量的优秀与否除了上述数据外,教师的教学加分、科研能力、授课对象、授课课程类型等因素在一定程度上也影响着教师教学质量评估的结果。

由于准备用于挖掘的评价教师教学质量的属性个数很多,为了便于通过决策树模型的建立掌握分类规则,选择其中与评价教师教学质量属性相关性较大的几个属性作为建立评估分类决策树模型的依据,生成新的教师教学质量评估分析基本数据表,转换后的数据训练元组见表1所示。

表1转换的数据训练元组

3.2 使用决策树算法生成分类规则。决策树算法主要根据训练数据生成以树状结构表示的分类器,其每个内部节点都是对某个属性的判断,所有的叶节点则代表最终的分类。这种表示接近于现实世界的分类,易于普通用户的理解。决策树的算法可以被描述成一个递归的过程:首先,选择训练样本的一个属性作为节点,对该属性的每种可能的取值创建一个分枝,并据此将训练样本划分为几个子集。然后,对每个分枝采取相同的方法,训练样本是其父节点划分的若干子集中的对应于该分枝取值的那个样本子集。当以下情况出现时停止该节点分枝的分裂,并使其成为叶节点:①该节点的所有训练样本属于同一分类;②没有剩余属性可以用来进一步划分样本;③该分枝没有样本。此时,一棵完整的决策树便形成了。

使用ID3算法计算信息熵并生成如下分类规则:如果学生综合评价为优秀的教师,那么最终期末教学质量得分为优秀;如果学生评价结果为合格,但是驾驭课堂能力达标的教师,教学质量得分亦为优秀;学生评价不合格的教师,如果教授的是专业课程,那么教学质量得分不是优秀;若是基础课程,教学加分小于6.0的不是优秀,而为8.0的是优秀。

If学生评价=“优秀”then“优秀”

If学生评价=“合格”and驾驭课堂能力=“达标”then“优秀”

If学生评价=“不合格”and课程类型=“专业课”then“不优秀”

If学生评价=“不合格”and课程类型=“基础课”and教学加分

If 生评价=“不合格”and课程类型=“基础课”and教学加分=“8.0”then“优秀”

从生成的规则结果看,由于样本数据集太少,所以生成的规则中会有一些与实际情况不符,如果增大训练集并对数据进行预处理消除噪音干扰则结果可能会更好。

3.3 使用ID3改进算法生成分类规则。在实际的教师期末教学质量评估中,学生对教师的综合评价受到多方面因素的影响,如年轻教师和学生的沟通能力可能会比老教师高;学生对专业课的重视程度可能会比非专业课的高,这样也会影响学生对教师的评价。所以,学生评价属性能在一定程度上反映出教师教学质量是否为优秀,而并非为决定优秀与否的客观条件,即它不是一个很重要的分类属性。因此,使用ID3算法对该示例进行分析,生成决策树以及规则,往往偏向于选取值较多的属性,即按照使熵值最小和信息增益最大的原则,这样,被ID3算法列为应该首先判断的属性在现实情况中却并不那么重要,这就需要使用ID3改进算法来进行完善。

由以上分析可知,需要降低学生评价属性在分类中的重要性,相对地提高课堂驾驭能力、课程类型和教学加分属性在分类中的重要性,通过改进后的ID3算法可以得到这样的规则:如果教师驾驭课堂的能力未达标,但是学生评价为优秀的教师,期末教学质量评估为优秀;教师驾驭课堂能力达标并且学生评价不是不合格,那么,教师教学质量评估为优秀;若学生评价为不合格,课程类型为专业课,教学质量评估不是优秀;若课程类型为基础课,并且教学加分为8.0,则教学质量评估为优秀。生成的规则:

If驾驭课堂能力=“未达标”and学生评价=“优秀”then“优秀”

If驾驭课堂能力=“达标”and学生评价=“合格或优秀”then“优秀”

If驾驭课堂能力=“达标”and学生评价=“不合格”and课程类型=“专业课”then “不优秀”

If驾驭课堂能力=“达标”and学生评价=“不合格”and课程类型=“基础课”and教学加分=“8.0”then“优秀”

ID3改进算法与ID3算法所生成的决策树有很大的区别,得到的分类规则也有所不同,有一些亦与实际不一致,这也与数据包含噪音且数据集又太小有关。但算法在一定程度上降低了学生评价对教师期末教学质量评估是否为优秀的影响的重要性,相应地提高了驾驭课堂能力等属性在分类中的重要性,基本上达到了预期的目的。

4 评估实验结果与分析

本文抽取本院教师(不包括信息工程系计算机专业教师)共340条信息记录作为训练语料,信息工程系计算机专业的教师信息共24条记录作为测试集。通过训练语料进行训练并得到决策规则用于测试。测试结果为24条自动评估结论有22条与教学评估结论一致,算法评估准确率为91.67%。

通过实验性验证测试,结果表明了基于数据挖掘技术的决策树的方法对教学评估是有效的,实验结果也比较令人满意,可以达到应用效果。但通过对实验的分析,也存在一些问题。首先,由于数据资源的缺乏,用于训练的数据和用于测试的数据规模很小,可能存在片面性;其次,数据来源于同一学校的评估记录,数据分布代表性差,这也是可能造成准确率较高的因素;最后,本次用于实验的数据仅包含几个条件属性,而决策属性为二值(即是或否),本实验所解决的问题属于二分类问题,是比较简单的分类问题,这也是形成高准确率的主要因素之一。

因此,本方法要想成为可以应用于实际的自动教学评估系统,还需要在以下几个方面进一步开展工作。第一,尽量通过多种渠道获取尽可能多的数据资源,扩大训练规模和测试范围;第二,数据资源来源于多种渠道,使得数据分布具有一定的代表性;最后,在算法上要进一步考虑多维属性,甚至高维属性数据的决策,以及多决策类别(如评估结果为优、良、中、差,四个级别)的决策问题。(课题名称:职业院校教师教学水平的评价研究,课题编号:GG0194)

上一篇:新课程标准下的数学课堂教学设计 下一篇:浅谈贫困地区职校饭店服务与管理专业课程改革