试卷评估分析与试题改进的研究

时间:2022-07-27 02:39:45

试卷评估分析与试题改进的研究

摘 要:完善的试题、试卷评估分析软件不仅能够全面、准确、客观地对考生掌握知识情况进行正确的评价,而且可以通过对试题的取舍、修改和完善,不断提高试题的质量,以达到准确考查教学情况和正确、公平遴选优秀人才的目的。本文改进和开发了windows系统下的试题、试卷评估分析软件,实例分析,图文并茂,简单直观,有助于改进试题、试卷质量,对提高正确评估考试有重要参考价值。

关键词:试题、试卷评估分析软件;难度;区分度;信度;效度

中图分类号:G642.4 文献标识码:A DOI:10.3969/j.issn.1003-6970.2013.06.048

1引言

考试是遴选人才的重要手段,也是教育评估中不可缺少的重要评价环节,既要考察出考生掌握知识的程度,区分出各种层次的学生,又要反映出学生的真实水平。因此,每次出题考试都应非常慎重,特别是高考、研究生招生考试和公务员考试等国考,更是关系到国家的利益,关系到考生一生的命运,尤为重要。所以,我们有必要对每次考试的试题、试卷进行综合分析,得出哪些试题适合作为考题,放入试题库中;对不太适合作为考题的试题进行舍弃或修改,提高考试试题的质量,通过不断的积累,建立完善的试题库系统。

试题、试卷的评价体系主要分为难度、区分度、信度和效度分析[1]。通过对试题、试卷这四方面的分析来判断出试题、试卷质量的好坏。为客观评价考生和遴选各种人才提供准确的参考。

1.1难度

难度为试题的难易程度,是考生应试水平和试题深度相对而言的。用以计算的公式为:

式中:为难度值;为该试题的满分值;为该题得分的平均值。

由此可知,若,则表示无一人得分,该题极难;若,则表示每个人都答对,该题极易。这两种情况对区分度来说都没有意义的。对于一般性教学试题,难度应控制在0.3~0.4之间。

1.2区分度

区分度为试题对每位考生水平的鉴别能力。若某试题能将不同水平学生的成绩区分开来,则表示该题的区分度高;反之,若某试题考生都能答对或无一答对,则无区分度可言。常见的区分度算法为:将考生的该题成绩从高到低排列,各取总人数27%的学生分成高分组和低分组,将高分组的总得分减去低分组的总分,除以各组的人数与该题的满分值的乘积,则区分度表示为:

式中:值越大表示该题区分度越高,最大值为1,表示高分组的所有同学答该题全对,低分组则全错;则说明该题没有区分能力;一般认为区分度为很好;0.3~0.4是良好,0.2~0.3为合格,

1.3信度

信度为考查考试结果是否稳定和可靠的一种指标,反应学生成绩的一致性,表明一次考试反映学生真实水平的程度。一份信度较高的试卷,在大致相同的班级进行测试,所得成绩应基本一致。成绩中偶然因素少,可靠性较大。若两次考试成绩差异很大,则说明信度低。

常采用的算法为半分法。即把某次考试的考生分成奇、偶两部分,并看作为水平相同的两次考试,按下式计算两次考试的相关系数:

式中:—学号为奇数的第位学生的成绩;—学号为奇数的学生的总平均成绩;

—学号为偶数的第位学生的成绩;—学号为偶数的学生的总平均成绩。

当时,则表示奇、偶两部分学生所得总成绩相当,考试结果与学生的实际水平没有任何误差,考分是稳定可靠的;若,则表示该题根本不能反映学生实际水平,分数毫无意义;若和时,表示试卷信度好。一般信度应高于0.5或低于-0.5。

1.4效度

效度指试卷结果能否正确地、有效地反映学生真实水平,它是教育评估中的一个难点。教育学专家的观点也各不同,目前常用的效度指标为试卷平均区分度的值。效度为:

式中:为效度,一般效度应大于0.2;为试题个数;

为第题的区分度。

以上四个指标虽然从单方面量化了试题与试卷质量,但他们是相互联系的。通过几个指标的综合分析才能正确、全面评价试题与试卷质量。

2 试题、试卷评估分析软件

软件的界面最顶部为菜单栏;左边灰色区域为显示数据界面;右边为操作界面。

具体操作步骤如下:

2.1将考生的学号、每个题所得分数和总成绩依次输入文本文档中。

2.2从菜单栏文件中打开文本文档。

2.3在界面右侧输入试卷名称、考试题数、命题人、考试人数、考试日期、试题满分值和每个题的满分值。

2.4点击信度按钮可得到信度值;点击效度按钮可得效度值;本题难度值里,首先选择题目数,再点击本题难度值按钮可得该题难度值;同理,本题区分度里,先选择题目数,再点击按钮可得该题区分度值;点击总平均分按钮可得总平均分。

2.5依次点击对比列表、分数统计表、成绩排序、分数段统计、区分度图示和难度图示按钮,数据或图形会依次显示在界面左侧的灰色区域。

2.6打开菜单文件,可逐一保存分析结果、成绩排序、分数统计图、区分度图示和难度图示。

3实例分析

我们应用该试题、试卷评估分析软件对我校机械专业2010-2011第二学期的理论力学课程考试情况进行了评估分析,分析结果见试题、试卷分析软件主界面图1,各试题的难度、区分度对比列表见图2,难度、区分度柱状图见图3、图4,各分数段的统计分析见图5。

通过以上图表分析可以得出,该套试卷这次考试信度:-0.25138212,信度较低;效度:0.61214290,效度较好;平均分:66.92208000。从图2、图3和图4中得出第一题的难度系数太小(为0.0941558441558441),区分度一般(为0.3625),区分不出各层次的学生。应将其完善和修改,同时教师应从考试中找到学生对知识掌握中存在的问题,改进自己的教学。

4 结论

通过对试题、试卷的评估分析,可改进考题、考卷的质量,提高试卷的可信度和效度。为教育教学评估向着正确性和准确性发展提供了改进办法,为命题、考试提供了重要的参考。

参考文献

[1] 王永岩.题库建设中的四度分析[J].力学与实践,1993,15(1) :61-62

WANG Y Y. Statistical Analysis of four Degrees in item Banking[J].Mechanics in Engineering,1993,15(1):61-62.(in Chinese)

上一篇:技术情报系统过滤与加工功能的设计与构建 下一篇:谈计算机网络环境下的网络教学