浅析国内外语测评效度研究现状

时间:2022-06-10 11:31:46

浅析国内外语测评效度研究现状

摘要:本文对过去10年中(2001~2010)刊登在国内8种主要外语类核心期刊上的有关外语测评效度研究的文章进行了检索统计,结果显示,在过去10年间,外语测评效度研究总体呈上升趋势,这些研究包含了实证性和非实证性两个方面,涵盖了纸笔测试、计算机辅助测试以及多元化评估等多种类型的测评方式。但是通过分析,我们也发现目前的研究在研究对象、研究方法等方面仍然有一些局限性。

关键词:外语测评 效度研究 研究概况 分析 反思

1 前言

Messick在2001年认为效度是一种综合性的评估,它验证了基于对测试分数或其他形式的评估结论所做的推断以及所采取的后续行动在多大程度上具有实际以及理论上的合理性与恰当性。2006年,李清华认为,作为“语言测试及其他教育与心理测量质量评价的根本要求”,在过去的半个世纪里,语言测试的效度研究在国外受到格外地关注,研究从理论到实证涵盖了效度的各个方面。我国学者对外语测试效度的研究起步较晚,但发展较快。近十年来,对在我国教育环境下语言测试与评估的效度的研究源源不断,研究的广度和深度都得到了长足的发展。为了使研究者能够进一步地了解我国语言测试与评估效度研究的现状,发展趋势以及所存在的问题,从而促进语言测试与评估效度研究的进一步提高与深化,本文作者对近十年来(2001年~2010年)我国外语类主要核心期刊上刊载的相关文章做了文献检索研究。

2 文献检索范围

本文检索的八种核心期刊是:《外语教学与研究》,《外国语》,《现代外语》,《外语界》,《外国语学院学报》,《外语教学》,《外语与外语教学》,《外语研究》。

3 语言测试与评估效度研究的现状及分析

在2001年到2010年间,八种核心期刊共有53篇关于语言测试与评估效度研究的文章。

3.1 研究的基本情况与趋势

过去十年文献的检索统计显示(见图1和表2),在前五年中(2001年至2005年),有7种刊物刊登了20篇相关文章,占总文章数的38%;而后五年(2006年~2010年),有8种刊物刊登了33篇相关的文章,占了总数的62%。这一结果表明:我国语言测试与评估效度的研究总体呈上升趋势。

在此项研究呈总的上升的趋势之下,我们也可以看出这种上升呈起伏状态。在2002年对测评效度研究成果有6篇,占总比例的11%,但2003、2004年,这种关注有所下降;2005、2006年,效度研究达到了一个小高潮,分别有7篇和8篇研究成果,占总比例的28%,而2007、2008年这种关注再次下降,特别是2008年,仅有2篇成果发表;近两年,这种关注再次上升,占到总比例的37%。

从表2还可以看出,各种核心期刊对测评效度研究的关注程度也不同。虽然八种期刊都曾经发表过相关的文章,但《外语界》中发表的文章数目要明显多与其他刊物,达到了21篇,占总数的40%;相反的,《外国语》中近十年来仅有一篇相关文章发表。这样的现象可能和各个核心期刊不同的办刊指导思想相关。

3.2 研究方法

随着外语教学研究的深入,国内外许多专家学者都对外语教学研究的方法给予了极大地关注。高一虹在1999年将外语教学研究的方法分为了实证性研究(empirical study)和非实证性研究(non-empirical study)两大类。实证性研究用实验方法来获取数据,非实证性研究则包括个人感想、操作描述及理论反思等。本文参照高一虹的分类,整理归类了以上对语言测评效度研究的53篇文章。(见表2、图2)

从图表中可以看出,近十年来,国内对语言测评效度的研究以实证性研究为主(35篇,占66%),而以非实证性研究为辅(18篇,占34%),尤其是最近的3年(2008年~2010年)间,专家学者们对实证性方法的应用远远超过了非实证性的方法。这体现了在测评效度研究中实证性研究所具备的说明力优势。

3.3 研究内容

3.3.1 研究内容概况

在实证性语言测评效度研究的35篇文章中,一篇涉及日语考试,另有34篇关于英语测评,其中20篇以大学英语测评作为研究对象,10篇关注于专业英语测评,3篇高考英语,另有一篇社会口译考试。

在对我国英语测评效度研究的34篇文章中,涉及对英语技能测试的方方面面,其中包括口语测试(9篇),写作测试(9篇),听力测试(5篇),词汇与语法测试(3篇),口译(1篇),英语综合技能测试(4篇),英语综合技能测评(2篇)。在非实证性研究的18篇文章中,有13篇关于效度概念及其在中国的应用,3篇书评和2篇对比性研究的文章。

对语言测试效度研究的51篇文章从不同的角度对我国语言测试的效度进行了验证,作者将这些角度列入了表3。

3.3.2 研究内容分析

3.3.2.1 非实证性研究

对语言测评的非实证性研究涵盖了效度理论及效度验证的多个方面。首先,一部分专家学者对效度的概念进行了分析。例如,李清华2006年撰文对效度从20世纪50年代的单一效度观到20世纪80年代中期的整体效度观的发展做了系统的介绍,同时对比了20世纪90年代前的效度观与当代效度观的异同,这对研究者系统的把握效度观起到的积极的作用。而陈晓扣在2006年则介绍了语言测试的结构效度,提出了用结构效度取代整体效度以使效度概念更具有整体性与恰当性。其次,一些专家学者对我国效验的研究做了一些总结和评论,如庞继贤,陈婵在2005年对我国外语口语考试的效度信度研究进行了评述,提出了改进的建议;而王晓彤在2009年也总结了我国的话语补全测试的有效性研究,肯定了话语补全测试的积极作用。再一方面,随着测试手段由纸考向计算机辅助考试的发展,越来越多的关注被投入了这一领域。2006年,李清华、分别探讨机考的效验以及机考与纸笔测试的效度对等性问题,2009年,李清华,孔文,陈慧麟对这一问题进行了进一步的研究。

3.3.2.2 实证研究

测评效度的实证研究近十年得到了长足的发展。一方面,对同一问题的研究得到了逐步的深化。如在口语测试的效度研究方面,黄永红在2006年的研究关注与口语测试的信度,而对效度只做了逻辑上的分析;2007年,王海珍虽然对口语测试的效度做了实证验证,但是她的研究仅仅局限于评分过程;而2009年,文秋芳与王凌的研究实现了实证研究与逻辑分析的结合,从内容效度,标准效度多个方面对专业四级口试的效度做了验证。另一方面,效度验证的范围得到了不断地扩充。随着测试与评估方法的多样化发展,效度验证从最开始局限于纸笔测试的领域,如纸笔测试的结构效度,影响纸笔测试的因素,纸笔测试的后效等,逐渐扩充到了网考及计算机辅助考试领域上。2010年,效验更是扩展到了多元化评价方式上来,如邓鹂鸣与岑粤探讨了同伴互评反馈机制,肯定了它对二语写作的构建能力的积极促进作用;詹先军研究了外语教学中主体多元化评价的正面效应及其问题。

4 对国内语言测评效度研究现状的思考

近十年来,我国效度验证虽然获得了很大的发展,但仍然存在着一些不足。

在纸笔测试方面,虽然很多专家学者从不同的角度对测试的效度进行了验证,但一方面,这些验证主要关注于一些大规模高风险的全国性考试,例如大学英语四、六级考试,专业英语四、八级考试,高考等,而对于学生和老师来说,更重要的是日常的考试。在目前的研究成果中,这一领域的研究仅仅占到极小的百分比(8%),需要得到加强;另一方面,在目前的研究中,对效度证据的收集还比较单一,每项研究基本上都只涉及一类效度证据,而事实上,效度的验证单靠单项效度证据是远远不够的,必须从多方面对其进行验证。

在机助测试与多元化评价方面,目前所进行的研究主要是理论性的研究,还需要更多实证性的研究来曾强其说服力。

在研究的对象上,目前的研究主要关注于对试卷的内容效度,结构效度,标注效度的分析研究上,而受试者主体对测试效度的影响也是一个不可忽视的因素,在未来的研究中,这一方面也需要得到加强。

5 结语

通过以上对我国外语测评效度研究的分析可以看出,我国外语测评效度研究正在受到越来越广泛的关注,研究方法趋于多元化、理性化与规范化,随着学科的发展,研究的内容也越来越广泛,因此还将有更多的问题等待我们进一步去探究。

参考文献

[1]Michael T. Kane . Current concerns in validity theory, Journal of Educational Measurement, 2001,vol.38, No.4.

[2]陈慧麟.基于纸笔的语言测试和基于计算机的语言测试之间效度对等性验证模式初探.〔J〕外语界.2009,3

[3]陈晓扣.谈语言测试的结构效度〔J〕.外国语学院学报.2006,3.

[4]邓鹂鸣,岑粤.同伴互评反馈机制对中国学生二语写作能力发展的功效研究〔J〕.外语教学.2010,1

[5]高一虹.中西应用语言学研究方法趋势〔J〕.外语教学与研究.1999,2.

[6]黄永红.英语专业四级口语测试的信度和效度〔J〕.外语研究.2006,3.

[7]李清华.语言测试之效度理论发展五十年〔J〕.现代外语.2006,1.

[8]李清华.基于纸笔的语言测试与基于计算机的语言测试的等效研究综述〔J〕.外语界.2006,4.

[9]李清华,孔文.基于计算机的语言测试及其效度验证〔J〕.外语界.2009,3.

[10]马丽雅,白静.浅析国内英语测试研究现状―对8种外语类核心期刊5年的统计分析〔J〕.外语教学与研究.2007,2.

[11]庞继贤,陈婵.外语口语考试的效度和信度研究述评〔J〕.外语与外语教学.2005,7.

[12]王海珍.基于评分过程证据的英语专业四级口试效度研究〔J〕.外国语学院学报.2007,4.

[13]王晓彤.话语补全测试的有效性研究述评〔J〕.外语与外语教学.2009,3.

[14]文秋芳,王凌.英语专业四级口试的效度研究〔J〕.外国语学院学报.2009,5.

[15]詹先军.外语学习主体多元化评价的效应研究―以大学英语学习评价为例〔J〕.外语界.2010,3.

上一篇:高校加强大学生德育教育之我见 下一篇:中学英语学习者对两种形式语法教学的喜好研究