关于高级英语期中测试效度的个案研究

时间:2022-05-30 12:26:03

关于高级英语期中测试效度的个案研究

摘要:英语期中测试是反映半学期以来学生的学习情况,学习中还存在的漏洞及考察学生的能力,是一个重要的信息来源。因此,测试对于教师以后的教学活动具有指导作用。而要真正有效地反馈这些信息,需要一份高质量的试卷。评价一份试卷,效度是一个重要的指标。本文将对07级英语专业的一份期中试卷做效度分析,旨在指出试卷的成功之处和有待改进的地方,以期对以后试卷设计有所启示。

关键词:期中测试 效度 试卷分析

1、引言

语言测试有四种类型:水平测试、成绩测试、诊断性测试和编班测试。成绩测试考查学生对所学知识的掌握,它一般要参照某种教学大纲,甚至考虑到教学方法。随堂测试、期中考试和期末考试都属于成绩测试,因为它们都是针对以前所学的内容而设计的(刘润清,2004) 。本文是针对学生期中测试做的分析,因此,本文要分析的试卷是属于成绩测试,是根据半学期以来的教学内容而设计的。

Bachman 提出,语言测试的有用性包括六个方面的特性:信度,效度,真实性,交互性,影响和可实践性。效度是评价一份试卷有效性的重要指标,所谓效度,就是指一份试卷是否测出了它所要测的东西,是否达到了它所预定的测试目的。效度表明的是一种相关性,即测试与测试目标的关联程度。

2、效度研究

2.1效度研究的种类

效度研究包括内部效度和外部效度,其中内部效度又包含了表面效度、内容效度、反应效度、构念效度。外部效度包含了同时效度和预测效度。

2.2 影响效度研究的因素

影响效度研究的因素有很多,如考试内容选择不恰当和样本代表性不够会影响到试卷的表面效度和内容效度,模棱两可的题目、考试指令的不清、试题难度的不当、考生对考试任务和模式的不熟悉和考生对考试的不配合都会影响到表面效度,考试任务设计不当和试题区分度不当则会影响到构念效度。在这次试卷分析中,有的因素如考生对考试任务和模式熟不熟悉我们无从得知,其他的因素我们可以从试卷的设计和考生答题的结果中分析出来,在这次的试卷分析中,就从影响试卷效度的因素如考试内容选择、试卷难度和区分度等着手来分析试卷的效度。

3、具体分析

3.1 测试对象

参加考试的学生为2007级26名英语专业大三学生,均属全日制本科生。因此,本研究有效试卷是26份。

3.2试卷构成

3.3 考试结果

如图所示,学生得分普遍较低,62%的学生得分在70分以下,只有一个学生得分在80分以上,高分段人数太少。通过计算得知,学生的平均分为67.2,本试题难度值为0.33,学生的普遍低分影响了学生之间的区分度,拉不开他们的距离,另外试题的难度偏大,影响了学生的答题。为了方便后面各组区分度的计算,把这26个成绩分成了3组,71~85.5为高分组,共8人,63.5~70.5为中间分数组,共11人,56~62.5为低分组,共7人。

3.4 各个题目的分析

孙成岗(2000)指出,试卷分析中最重要的就是题目分析, 即对试卷中的每一道题目的答题情况进行分析。一般的题目分析软件(主要是对客观题进行分析的软件对每道题目主要提供个指标难易度、通过率答对率和区分度。对每道题的每个选择项也提供个指标人数、标准分、区分度,在这个指标中,区分度最重要。下面就将对各道题目的答对率、难度、区分度一一做出分析。在分析之前首先就区分度与项目质量的关系做一展示。

项目区分度指数与项目的质量评价

译自(Ebel & Frisbie, 1986:234)(邹申, 2005)转引自董立泉等

第一大题是由两道题型组成,题型A是选择词组填空,题型B是根据提供的词汇做词形变换填空,考察的是学生的词汇和语法知识,还有理解能力。在题型A中,A1,A2,A4都不需要考虑语法的问题,只要理解了句子和词组的含义都能做对,所以这是很基础的题,这3道题正确率是100%。A3考察了学生的过去完成时时态,由于这道题前面有had作了提示,所以也没有人答错。而A5答对率是0.04,只有一个学生回答正确,We would like the opportunity to ____________ on our latest work and the possibilities available for our upcoming custom projects.要用选项中的keep sb. posted做变形填空,大部分学生用keep us posted来填,这样表明大部分学生都没有理解到题目的含义,可能看到题目中有we、our,于是受到了干扰。正确答案是keep you posted,大意是“有了新的工作信息我们会通知你”。

题型B中,B1和B4完成的较好,各有一个学生做错,做得最差的是B5,Miss Moylan accused them of leaking _________ information about her private life. (confide) 泄露的是“confidential information”而不是“confident information”。

第二大题是paraphrasing,难度值是0.29,难易比较适度,一共10道小题,全是选自教材中的原文,让学生在理解的基础上用比较简单的说法表达出来,考察的是的理解能力和表达能力。高分组和低分组的平均分相差3.5分,且低分组平均分明显低于整个大题的平均分,因此这道题的价值还是体现出来了,能够区分出学生的水平。

从上表可见,第三大题即短文改错题,在区分度上面,第5题区分度为0.61,这是最理想的值。第2题和第4题的值在0.2左右勉强可以接受,第1、3、8、9都是小于0.19这个值的,这些题的区分度很低,不利于区分出学生的水平。第10题,没有一个学生回答正确,第6、7题区分度为负值,这更是不可取的,严重地影响了整套试题的效度。

第四大题是阅读理解题,共4篇文章,每篇文章有5~7道小题,第一篇文章是一篇说明文体裁,向大家解释了笑的发生,本篇文章设置了7个小题,从该题的答对率和难度来看,第1、4和5都是比较简单的题,88%的学生都回答对了。从区分度来看,第2、4和6题都是区分度高的题,这对测试效度是有利的,而第3和5题区分度却是负值,表明很多高水平的学生的作答没有低水平的学生好,这类题在选题中是不可取的。在从干扰项来看,第7题正确率是0.42,这表明58%的学生在这道题上丢了分

从区分度来看,第8、9和10题都是区分度比较高的题,12和13题区分度低于了0.19,需要对选项做一些调整。而11和14题区分度均为负值,这两道题在试题中是不可取的。

第五大题是考察学生的常识,出题的范围来自教材,如果学生的知识面广又对教材知识有所延伸,那么这道题做起来是相对轻松的,这考察的不是学生的语言能力而是知识面的宽度。而第六大题考察的确是学生的理解能力和语言的运用能力了,从表中可以看出,高分组的学生平均分在20分以上,高出了全班的平均分3分,说明这部分学生语言能力确实很强,而低分组的学生在理解和表达方面都有所欠缺,这道题考出了学生的水平,总的来说是很有价值的。

4、小结

一份效度好的试卷要充分考虑到很多因素,在试卷的设计方面,题型要满足所要考察的内容,而且难度也要适度,太难的试卷不仅不利于区分学生的水平而且容易打击学生学习的信心。在试题的选择上,区分度高的题可以提高试卷的效度。从上面的分析中可以看出,这套试卷题型是丰富的,考试内容一部分来自教材,一部分来自课外,让学生在理解所学的基础上再提升水平。在个别题目的区分度上,有些区分度很低甚至是负值,有的选项干扰度过大,导致答题正确率很低,所以这些题还需要进一步改进。

参考文献:

[1]Bachman L F ,A S Palmer. Language Testing in PracticeOxford :OUP ,1996.

[2]董立泉,肖惜,杨林. 一份英语竞赛试卷分析[J].科技信息,2009

[3]戴炜栋.外语教育求索[M].上海外语教育出版社,2007

[4]刘润清,韩宝成. 语言测试和它的方法[M]. 北京:外语教学与研究出版社,2004.

[5]孙成岗 现代语言测试与试卷分析[J].外国语学院学报,2000

上一篇:新课程标准框架下发现学习法在高中英语教学中... 下一篇:浅谈音乐情境教学