基于学生成绩评价分析的数据预处理

时间:2022-05-26 02:27:18

【前言】基于学生成绩评价分析的数据预处理由文秘帮小编整理而成,但愿对你的学习工作带来帮助。二、成绩分析的数据预处理 学生成绩信息一般包括:学院、专业、班级、年级、学期、性别、籍贯、课程、学号,可从中研究课程之间相关性、考试难度区分度等信息。在评价分析之前,要对成绩做数据预处理,一方面要针对职能部门的需求做预处理,另一方面要从统计分析的方...

基于学生成绩评价分析的数据预处理

摘要:完整的教育教学必须要包含评价分析环节。在对学生成绩评价分析之前,要对成绩数据做数据预处理,一方面要针对职能部门的需求做预处理,另一方面要从统计分析的方便性、后续研究入手。本文从成绩格式转换、成绩分布、需求三个角度进行研究。

关键词:成绩评价;数据预处理 ;成绩分布

一、引言

“多元智能理论”之父加德纳说过:“过去和现在我们都应该相信评估是对于教育发展最有力的手段”,一个完整的教育教学环节必须要包含评价分析这一环节。考试成绩是对教育教学成果的量化,运用正确合适的方法对学生成绩进行评价分析,可以使学生洞悉自己的位置,使教师和学校决策者洞悉教学中存在的问题,优化教育资源。国外有专门的国际教育评价协会(IAEA)、国际教育成就评价协会(IEA)、学生考试研究中心(CRESST)、研究学习过程性指标(NSSE)的机构一直在研究教育规律和评价标准。

教育统计学的研究历史很早[1],研究的方法从描述统计---推断统计--多元统计分析,美国的桑代克(E・L・Thordike)为了达到“极力以心理学与统计学为工具而研究教育学,使教育科学化”的目的,于1904年撰写了社会统计学应用手册《心理与社会测量导论》,这是世界上第一本有关教育与心理统计学的专著。

二、成绩分析的数据预处理

学生成绩信息一般包括:学院、专业、班级、年级、学期、性别、籍贯、课程、学号,可从中研究课程之间相关性、考试难度区分度等信息。在评价分析之前,要对成绩做数据预处理,一方面要针对职能部门的需求做预处理,另一方面要从统计分析的方便性、后续研究考虑。

(一)、成绩格式转化

(二)、成绩分布

目前针对成绩分布特点的讨论不断,统计上的分布最常见的是正态分布,有人认为成绩分布不是正态分布,是负偏态分布(即高分较多),正好说明教育产生了效果。我们针对高等数学课程进行研究,利用2007-2008年的数据,发现成绩分布呈现双峰特点,是负偏态分布(即高分较多),不是正态分布。

根据考试的目的不同可将考试分为选拔性考试和合格水平考试。选拔性考试是一种难度竞赛考试,它期望学生的考试成绩呈现正态分布,出现比较极端的分数分布,从而有利于甄别和选拔。各种竞赛和升学考试等都属于选拔性考试。合格水平考试是一种成就考试,旨在考核学生是否达到预定的教学目标和要求。并不要求学生的分数呈现正态分布,反而希望学生成绩的分布能呈现负偏态分布。期中考试、期末考试、清考等都属于合格水平考试。从学校教育目的的角度看,合格水平考试是更具有普遍意义的学校考试。因此,学生考试成绩呈现负偏态分布时,说明教学恰恰是成功的[2]。

(三)、针对需求的数据处理

通过与教务处老师的交流,了解到他们感兴趣的内容有:重要课程主要特征(均值、优秀率、不及格率)年度变化、重要课程汇总(均值、等级成绩率、样本容量)。

我们分析了重要课程的各个年度均值、优秀率、不及格率,此处为节省篇幅仅列出4门课程的相关数据表,从中发现:

1、《高等数学》课程的平均分和优秀率呈逐年下降趋势,需要尽早稳定下来。

2、《大学物理》的不及格率偏高,这是学生因素还是教师因素,需要继续分析。

2、《电路分析基础》起伏较大,需总体控制。

3、《电子电路基础》的不及格率偏高,平均分偏低.

三、结束语

考试成绩是对教育教学成果的量化,运用正确合适的方法对学生成绩进行评价分析,可以使学生洞悉自己的位置,使教师和学校决策者洞悉教学中存在的问题,优化教育资源。有些细节的研究工作很重要,但是在学术界至今仍是空白,例如:基于成绩分布,发现普遍不是正态分布,那么到底是什么统计分布呢?这一问题,我们做了探索性分析,发现极值(Ev)分布和韦伯(Weibull)分布是最接近的两个。

参考文献:

[1] 互动百科:教育统计学 http://

[2] 张国才,学生学习成绩负偏态分布的合理性,江苏高教[J],2002 (2):74-76

[3] 吴喜之,统计学:从数据到结论[M],中国统计出版社,2004.8

作者简介:

李亚杰,北京邮电大学理学院,讲师,主要从事教育统计研究。

上一篇:北行列车(组诗) 下一篇:试论音乐美学自律与他律的结合