论英语测试题的质量标准

时间:2022-09-13 09:49:42

论英语测试题的质量标准

摘 要 英语作为我国基础教育的重要学科,每年仅其终端性测试题(中考、高考)便产生近百套。由于我国英语试题质量认证标准的缺失,我们一直未能对各级各类英语试题进行有效检验和评估。本文提出的关于英语测试题质量七条标准的思考,旨在对这一命题搭建初步的理论架构。

关键词 英语;测试题;质量;标准

[中图分类号] G424.79 [文献标识码] A [文章编号] 1008-004X(2013)02-008-04

收稿日期 2012-10-14

[作者简介] 邓北平,男,湖北人,博士,北京《学生双语报》《双语学习报》执行主编,主要从事英语课型、有效课堂管理以及考生制度与考试文化等研究。

近年来,我国各地每年要命制近百套中、高考试题,如果再加上各地的模拟试题与阶段性测试题,试题之多,难以胜数。然而,试题一旦投入使用后,有人说好,有人说不好。可是,什么是“好”?什么是“不好”?什么是“好题”?怎样命制“好题”?英语测试题的质量标准是什么等等,这一系列的问题一直困扰着我们。我们知道,“好”是一个模糊的前科学概念,是对客观事物动态的、相对的和主观的认识描述。既无上下限,也无参照物。从逻辑关系上讲,我们必须首先讨论“好题”的标准问题。因为,没有标准,我们对试题的判断就没有依据,也就没有说服力。因此,必须为“好题”的判断建立一个客观的、科学的、合理的标准。这个标准既能在学理意义上站得住脚,又能在实践中发挥科学判断“好题”的功能,并能直接指导命题。这无疑是一个有着重大理论与实践意义的课题,值得我们认真研究探讨。本文试就英语测试的质量标准这一命题提出几点个人的看法。

一、“好题”应该符合该学科的学理逻辑

什么是一门学科的重点知识(俗称重点)?什么是一门学科的难点知识(俗称难点)?什么是一门学科的必要考点?考点与知识点的关系是什么?对这些问题的厘清有助于了解一门学科的学理逻辑。关于这些问题的讨论,请参见拙文《高考英语学科的知识点与考点研究》,本文不再赘述。

我们知道,建构一门学科知识结构的重要知识是重要的知识点(重点),反过来,学习者通过对该学科知识结构的内化而形成的必须能力则是重要的能力点,但二者未必全是必要的考点。一门学科的(知识点与能力点)重点未必是难点,因为,有很多知识点或能力点虽然重要,但对学习者而言并不难接受。同样,一门学科的(知识点与能力点)难点也未必就是重点,因为,该知识点或能力点可能只是不易为学习者所理解,未必就能确切地反映该点在整个学科知识结构中的地位有多么重要。何况,重点与难点(知识点与能力点)也不一定能反映它们在该学科的测试结构中的地位有多么重要。因为,往往学科知识点中的重难点未必就一定是测试中的重难点。考点中的重难点和知识点中的重难点并没有必然的一一对应的关系。有鉴于此,重点未必是难点,难点未必是重点。难点未必是考点,重点也未必全是考点。

如果不是重要的知识点和能力点,该点就难以成为必要的考点,其入考的可能性就小。但有一点是可以肯定的,即考点应该是该学科的重点,或应该能反映该门学科的主体知识结构,并且也应该能检测考生的素质结构状况。只有重要的而且可能成为考点的知识点才是真正测试学意义上的重点。

我们现在所讨论的重点(考点中的重、难点)应该体现在两个方面:其一,在学科中的地位;其二,在测试中的地位。如果某点在二者中都重要,那么该点就是真正的重点,也就会成为我们选题的对象。如果只占一项或在二者中都无甚地位,其重点的意义便相应而减。由此可见,无论是中、高考命题,还是复习备考的选题,或者是编书的筛题,重要的考点才是我们关注的对象。

我们知道,考点是知识点的抽样,而试题是考点的载体,考点通常以试题的形式来呈现。可见,“好题”应该符合一门学科的学理逻辑正是基于这一事实提出来的。

二、“好题”应该符合语言发展的逻辑

英语学科不仅具有一切学科的特点,同时,还兼有语言本身的特点。两者相加,其试题命制的难度与“好题”判断的难度更甚于其他学科。语言是随着时代的发展而发展的,新的语言现象的诞生必然导致旧的语言现象的灭亡,新的语言特点的诞生必以牺牲原有的语言特点为代价。比如像疑问尾句、虚拟语气等语法现象在现、当代英语中已越来越不受重视,甚至在语法学家的眼中也只是次要的研究项目。从语言发展的逻辑来看,语言学科的知识结构也是随着语言的发展而发生变化或不断丰富的。因此,这些更新生的、更鲜活的、更具时代特色的语言必然要反映到语言的测试中来,如果现行的英语测试不能反映当代的语言发展和语言研究的成果,这个测试本身的信度就值得怀疑。

而且,英语学科首先是以语言的形式出现的,然后才有学科的形式。所以我们说,以语言为对象的英语学科的知识点应该不全是、不总是和不必是我们测试中的当然考点。首先,知识点不全是考点。因为,知识点只具备成为考点的可能性。年度考试不可能亦无此必要将知识点全部纳入一份试卷。其次,知识点并不总是考点。由于“知识点是动态的和发展的,在一定的阶段有些知识点可能成为考点,但随着人们认识水平的逐步加深,这些考点就会淡出甚至完全丧失其充当考点的资格,不再具备可考性。”[1]最后,知识点不必是考点。因为,有些知识点虽然看来颇具可考性,但由于它们自身的特点,人们的认识水平以及命题人的知识视野、判断标准、思维定势、命题口味、习惯与识见等等因素的影响,有些知识点就不一定能成为考点,至少不一定能成为相对稳定的考点。

前文述及的考点通常是以试题作为呈现方式,而试题又是以试卷作为载体的,因此,从这个意义上讲,语言学科的重要知识点上升为语言测试的考点而进入试题形态并不仅仅是测试学的必然观照,同时也是语言发展的必然观照和产物。

三、“好题”应该符合文化的发展规律

语言是文化的载体,同时,语言自身又表现为文化。从某种意义上讲,语言是最大的文化,语言也是一个民族最大的传统。一个民族失去语言就一无所有。我们现在学习外国语言的主要目的无非是两条,一是要学习外国先进的文化技术,二是要能和不同文化背景的文化传承者和创造者进行交流以促进理解与融合。所以,我们是抱着把语言当作工具,把语言当作桥梁的心态来学习外语的。正因为这样,我们对国外文化的发展就必须高度关注。

从大处着眼,世界文化是在冲突中发展,在交流中促进,在理解中深刻,在融合中丰富的。英语文化是当今世界的先进文化和强势文化,还处于不断的发展与不断的丰富之中。因此,国外新的文化思潮和新的文化成就理所当然地应该反映到我们的英语测试题中来。这不仅仅是一种主动的对接,更重要的是我们要有意识地培养我国外语学习者的国际视野和全球关怀,同时将文化意识“润物细无声”地平行渗透到外语学习者的素质结构中来。

如果目的语的文化发展变化不能在我们的测试题中鲜明地显现,我们的语言测试肯定是落伍的、缺乏信度的、也是没有根的东西。因此,我们判断“好题”不能不考虑文化的发展规律。

四、“好题”应该符合测试学的一般规律(应反映新的测试理论成果)

当下我国英语学科的命题理论主要有三个来源,一个是改革开放后我国本土的考试学研究的成果,另一个是近三十年我国中、高考英语改革的理论与实践的成果,第三个则是来自国外语言测试研究的最新成果。

现在大家都有了一个共识,认为语言是活的东西,因此,必要也必须将语言的测试尽量放在更多不同场景的真实的语言环境中去,换言之,我们要将试题命制的核心――语境化――在试题中充分地体现出来。

试题的语境化使得语言真正复活了考试的“死”的语言。试题的语境设置可分为有效语境与无效语境。就多项选择题而言,题干和选项共同构成语境。但是,只有题干或选项能启发或干扰考生的正确认读、辨读与辨析才能称之为有效题干或有效选项,否则就是无效题干或无效选项。只有有效题干和有效选项共同作用才能生成有效语境,反之,只能生成无效语境[2]。语境化这个概念的提出,其意义在于,人们终于可以在活的语言中去学习语言,运用语言,感受语言,体味语言,甚至去享受语言了。

由此看来,作为语言测试学的一个成果,试题编制的语境化是我们判断“好题”的一个重要参照。

五、“好题”应该符合试题命制的一般规律

试题的命制必然有其自身的规律,而规律又往往表现为诸多具体的原则。我们研究这种规律的目的是为了使我们的命题实践获得理论的支撑与操作的参照。因此,试题命制的科学性、合理性、时代性、有效性等特性必然以原则或要求的形式进一步细化为命题者的操作准则。比如,像完型填空的首句不设题,考点的分布主要以语义语用、常识、上下文的理解和固定搭配等来整体布局等等。又比如多项选择题的二重性要求,即题干与选项既要具备启发性又要具备干扰性的双重特点;又比如所有备选项(含主考项和辅考项)都必须是真实考点等等。这些原则或操作规程已经为广大英语教师和命题者所广泛接受并能运用自如,甚至业已内化成了命题者的一种心理趋向或定势。

但应该指出,命题原则并不能越俎代庖,直接充当甚至取代“好题”的判断标准。考试学中就有明确的命题原则规定,反映人们对测试的一般规律的认识。例如,廖平胜先生等著的《考试学》就提出了在试题编制过程中命题人员应该遵守的十二条原则[3]。后来,廖平胜先生又在《考试是一门科学》中进一步明确提出了试题编制的三项基本原则与编制包括多项选择题(双层结构多选题)在内的主、客观性试题的基本原则和技巧。这里的所谓技巧,实际上也是指编制试题的常规要求或原则。

就英语学科的命题原则而言,其原则就更加细化和精确了,这些原则或技巧已成为人们命题时的必要参照。以多项选择题(multiple choice)为例,教育部考试中心“高考内容、形式与能力考查”课题组就列举了九条应遵循的命题原则,专门指导命题人员的实际操作。

但这些原则只是原则层面的东西,或可称之为规律的外化,并不能代替“好题”的判断标准,甚至也不是命题的操作标准。因为“好题”的判断标准是更高层、更抽象、更宏观、更一般的指导。也可以说,判断标准是在学科与测试的大背景上,体现命题理论与操作技术的深度、广度和高度的参照物,远非一般意义上的命题原则那么简单。

六、“好题”应该符合试题自身的功能目的

题型有题型的功能,试题有试题的功能。前者检测考生的能力状况,后者检测考生知识与能力的掌握情况,题型通过具体的试题来实现自身的功能,反之,试题通过一定的题型实现自身的功能。不同的题型又表现为不同的功能。比如,命题者可以通过双层结构多选题(multiple choice)来检测学习者对语言掌握的情况。这实质上是对低层认知能力水平的考查,因为这种题型不能对重难点的知识进行有效的和深度的检测,有其不可超越的局限性,至于在检测学习者对哪个点的掌握情况的判断时却非常灵活而有效,而且,由于题量可以很大,因此考点的覆盖面也就可以很广。

命题者也可通过其他形式的客观性试题或主观性试题来考查学习者的综合能力。像阅读理解、完型填空、书面表达等等题型都能很好地检测学习者的实际能力。如果我们要检测考生什么能力,或检测考生在哪一个知识方面的掌握情况,我们就可依据实际情况来设计不同的题型及试题,而且试题应该能反映该门学科的特征并能有效检测考生知识与能力的掌握情况。

由于语言学科更多的是反映在能力的检测上,因而一定的题型与一定的试题还具备两种方向的目的:既检测考生过往的知识与能力的掌握情况,又启迪考生今后的知识与能力的发展方向。

不仅如此,试题欲实现自身的功能目的,我们还要观察试题的四度:信度、效度、难度和区分度。历年《英语考试大纲》对高考试题的四度都有明确的表述,即“较高的信度、效度、必要的区分度和适当的难度”。2007年的《英语考试大纲》做了一点修改:“较高的信度、效度、适当的难度和必要的区分作用。”四度的值是衡量好的试题的一个重要标准。仅举一端,便知要略。试题的难度必须符合试卷的功能目的,而试卷的难度又必须符合测试目的。试题过难或过易必然导致区分作用的丧失。设想,一个失去了区分作用的试题,其检测意义还能剩下什么?所以,我们在命制“好题”或判断“好题”的过程中,应该观察并检验试题是否实现了其自身的功能目的。

七、“好题”应该符合统计学意义上的考点变化规律

在拙文《高考英语学科的知识点与考点研究》中,笔者曾讨论过考点的四大特性,即代表性、综合性、发展性和可考性。其中,考点的发展性意义深远。我们知道,有些考点可能过去是考点,但经过一段时间的检验,其测试意义逐渐淡化,遂淡出考试;如果有些知识点已经不能反映本门学科的特点,其作为考点的意义也就不复存在。而有些知识点是随着语言的发展变化而逐渐成为重要的知识点,尔后跻身考点的。

这种现象我们只需通过对历年各地中、高考英语考点分布做一统计分析就可以得出一个相对准确的判断结果。尽管这种结果是基于统计学意义上的,但其指导意义也是不言而喻的。比如对很多语法项目的考查已经越来越淡化或弱化,另外,通过统计,我们还发现完全的纯粹语法倾向的试题逐渐在退出主流。

根据近年(尤其是高考英语分省命题以来)的统计,很多考点已经逐渐地淡出人们的视线。但这也并不等于这些知识就是伪知识,而只是说这些知识已经不再是这门学科的重要知识点,也不是这门学科的重要考点了。但它们仍然可能是学生学习的难点或重点。从素质培养的角度看,可以学,可以教,但不必深究。而一些新的考点进入了人们的视线,比如词汇的考查作为一个重要的考点类别已经逐渐在和语法试题分庭抗礼了。

以上我们讨论了“好题”判断的七个标准,同时这七个标准又有着内在的逻辑关系。应该说,这是我们判断所谓“好题”的总的理论与实践导向。在实际选题或命题的操作过程中,其实我们往往只用三条简单的标准即可:第一,试题要符合语言的规律(学理的规律与实用的规律);第二,试题要符合命题的规律(试题编制的原则、要求与技巧);第三,试题要与历年高考英语测试统计结果所反映出的规律基本一致(考点中的热点与冷点分布符合历年统计结果,试题符合“四度”的基本标准)。

[参考文献]

[1]邓北平.高考英语学科的知识点与考点研究[N].学生双语报教师版,2006.

[2]邓北平.高考英语自由应答试题功能及其二重性分析[N].学生双语报教师版,2006.

[3]廖平胜,何雄智,梁其健.考试学[M].武汉:华中师范大学出版社,1988.

上一篇:高考命题如何承载公平使命 下一篇:中国国家男排队员的功能训练实践解析