试题难度的客观标准探索

时间：2022-07-01 12:25:52

试题难度的客观标准探索

一次考试的试题难度如何，通常的衡量标准是以考生考试之后的得分情况，即得分高低来衡量的，也就是以所谓的试题“难度系数”来衡量。但是，这样的衡量标准在笔者看来是不恰当的。因为，考生的得分情况，往往只是考生自身的解题能力和知识掌握程度等的一个反应，它虽然也跟试题的难度有关，但是却绝对不等于试题本身的难度。而且，很多时候由于被试者或被试群体的学习素养和学习效率太低，不管试题的本身的客观难度多小，被试者考试结果显示的得分“难度系数”总是很小的，总是达不到有关的测试管理部门所预期出现的“难度系数”结果。譬如，现在很多的教育会考，如初中毕业会考，一般的教育行政管理部门总是要求各学科的考试命题要保证乡镇一级初中毕业生的考试所得总平分显示出“难度系数”在0.70以上，或者要让90%以上的乡镇学生考试及格。然而，由于我国教育资源的实际分布特别是学生资源分布的严重不均，一般的优秀学生都向城镇重点初中和私立中学集中，乡镇中学的学生素质普遍偏低，加之学校管理者素质的低下，于是乡镇一级的学生在数学、外语等学科的考试中，总是无法达到上级的规定要求。造成这种情况的原因其实根本不是命题者的试题难度过大，而是测试群体的学习素质和学习效果太低。

换句话说，长期流行的“试题难度系数”只是一种主观的试题难度系数，其本质只是考生的考试“得分系数”，而不是试题本身的难度系数，它基本是由被测群体的得分结果决定。按照这种“难度系数”的思路，同一套题目，如果使用于不同的测试群体，它的难度系数就会表现出不同的结果。譬如，拿一套相同的数学试题，分别去测试省级重点中学的初中生、市级重点中学的初中生、县级重点中学的初中生、一般乡镇中学的初中生，再分别计算它们的难度系数，其“难度系数”就会表现出天壤之别。它们极可能出现分别是0.90、0.80、0.70、0.20这样四个差距悬殊的难度系数。那么面对这样四个差距悬殊的难度系数，我们如何认定这套试题本身到底是难是易呢？当然，如果有人愿意将这四个不同的测试群体所获得的“难度系数”进行平均，则其结果为0.65。但是，这样的结果本质上仍然只是由测试对象的答题结果来决定试题的难度。笔者认为，它是不科学的，是主观的和偶然的。

这种主观的、不科学的“难度系数”法，对于考试，尤其是对于衡量一个国家的教育和文化发展水平与潜力，对于衡量一个国家和民族的智力发展态势，是极其不利的，甚至是十分有害的。因为，它抹杀了考试试题难度本身的客观性，从而就会导致我们从小处说是没法衡量一个学生是否达到基本的教育培养目标要求，没法衡量一个学校是否达到了基本的办学效益要求；从大处说，是没法把握一个国家的教育质量是在走向不断提高还是走向不断低落，没法准确地衡量和把握一个国家和民族智力发展的历史趋势。因此，探索一套客观的试题难度系数衡量标准和检测办法，是十分必要和重要的教育科研课题。它对于我们科学地把握受教育者个人、学校、民族和人类的教育文化水平和质量以及智力发展水平、趋势及其成效，具有重大理论意义和现实意义。

笔者认为，任何试题，在其尚未交给考生考试及阅卷之前，我们应该可以判断其难度大小，也就是可以判断其客观的难度系数。

当然，要确定各种文化考试试题的客观难度系数，这本身是一个巨大的课题，它本身需要做许多繁复的研究、论证和实验。本文不可能得出一个简单思路或公式来确定各种文化考试试题的客观难度系数。本文只是将个人在这方面多年的思考做些初步的整理，以期引起教育界、学术界对这个问题的重视，并为这方面的研究提供一些初浅的思路。

由于文化考试一般都是以一套试题的形式出现，而一套试题一般又是由许多单独的试题组成的。因此，一套试题总的客观难度将由所有组成该套试题的单个试题的客观难度共同决定。因此，要衡量一套试题的客观难度，实际上关键就是要衡量出这套试题每个独立试题的难度。本文因此只讨论单个试题难度的确定问题。

要确定每个试题的客观难度，我认为主要应从如下这些方面去思考。

一、试题的逻辑层次愈多则试题的难度愈大

每个试题都包含几个逻辑层次，一般来说，包含逻辑层次越多的试题，它的难度就愈大。而不同的试题涉及的逻辑层次往往不同。

譬如，很多试题中的部分填空题、选择题、简答题往往只涉及学生的记忆问题，只要学生能记忆相关内容，就可以根据前后文，或者根据题干，想到答案，不用作任何其它的思考。譬如，语文题目中的根据课文内容填空，补充空缺部分的课文内容，历史题中的我国人物、年代、历史事件的填空题，数学中的两个个位数直接相加等。当然，记忆也是一种某个层次的思考，但这种思考是十分机械的思考，甚至从某种意义上说不是思考，而是简单的心理学中的“再现”。在这里姑且把它认定为一种只包含一个层次的“思考”习题。

再如，数学中“a+b=？”这样的试题可以看作是只有1个逻辑层次的试题；“（a+b）×c=？”可以看成2个逻辑层次的试题；而“[（a+b）×c]n=？”则可以看作是3个逻辑层次的试题。

如果我们假定一个逻辑层次试题的客观难度系数是0.1，那么包含两个逻辑层次的试题客观难度系数就是0.2（注：此处试题的客观难度系数跟流行的主观难度系数的计数方法相反，客观难度系数值越大则试题难度越大，以下同）。包含三个逻辑层次的试题难度系数就是0.3……以此类推，一个试题包含的逻辑层次愈多，则其试题的难度系数愈大。

二、试题构成的并列意义单元越多则试题难度愈大

有些试题的题干内容或题目内容是由单一的意义单元组成，而有些试题的内容或题干是由几个意义单元组成，那么由几个意义单元组成的试题其难度就高于单一意义单元组成的试题。譬如，材料阅读分析题材料，有些试题的材料只是由一个比较单纯的意义材料组成，而有些题目则出现“材料一”、“材料二”两个独立的意义材料。那么这样的两个试题，在其它条件相当的情况下，后者的难度显然大于前者的难度。因为，构成试题的意义单元或组成部分越多，则考生要统筹思考的内容越多，难度就越大。假定试题的组成意义单元只有1个，其难度系数为0.1，那么组成试题的意义单元有2个的难度系数就是0.2……试题的难度系数可以以此类推，试题组成意义单元越多，则难度系数越大。

三、试题的语言特色也是决定难度系数的因素之一

在试题的逻辑层次和组成意义单元等其它各种因素不变的情况下，如果使用不同特色的语言来表述试题，其试题难度会因此发生变化。

例如，对于同样一个材料阅读分析题，如果将材料部分用古文的形式来表述和用现代文的形式来表述，其难度显然区别很大；再如，同样是用现代文来表述，用直白浅显的说明方式来表述的材料，跟用幽默风趣的文学语言来表述的材料，后者的难度系数又要大于前者的难度系数；又如，同样是用文学语言来表达的材料，用一般的通俗文学语言来表达的材料，跟用一些不常见的文学修辞手法来表达的材料，后者的难度又大于前者的难度。

四、试题的篇幅长短也是决定试题难度的因素之一

一般来讲，在其他因素相当的前提下，试题的篇幅或试题所涉及内容的篇幅越长，则试题的难度系数越大。

五、试题内容涉及的知识面也是试题难度的重要决定因素

如果一个试题只涉及单独一个学科，在其它因素不变的条件下当然难度系数最少。如果它涉及两个以上的学科，则难度系数随涉及学科数目的增加而增大，因为它要求被试者所掌握的知识更多。同样，即使只是涉及同一学科，如果它涉及同一学科的不同知识领域的内容越多，则难度系数也越大。譬如，同样是物理试题，如果一个物理试题的内容既涉及力学又涉及光学，那么这个题目较之仅涉及力学或光学的试题难度显然要大。

六、试题是否存在表述上的差错和问题也是决定试题客观难度系数的重要因素

在长期的学习、教育和研究实践中，笔者发现，任何学科的考试试题和平时的作业，都存在一定比例的问题试题或差错试题。这类试题，由于表述上的语句错误，或者由于试题本身设计的缺陷，导致试题本身无法解答，或者造成理解上的歧义，这样的试题难度系数也就自然增大了。这种情况是属于试题难度系数的错误性增大或不正常增大，在命题中是应该避免的。但是，在命题和审题的程序不够民主、科学、严谨的情形下，是容易出现的。

七、各个学科要根据自身学科的特点制定自身试题客观难度系数的衡量标准与细则

由于各学科有着各自本身的许多特点，这就需要将之前所讲的六点标准具体落实到各个学科中去，结合各个学科内容的特点制定一个详尽的难度系数衡量标准。要按年级、按学段、按不同的考试性质等制定不同的难度系数标准。然后拿这套细致的标准去衡量每个试题、每套试题的客观难度系数。

总之，我们可以根据以上几个标准，对任何学科命制出的试题在尚未用于考试前，就进行试题难度的定量分析和定位，确认每个试题的难度系数，并进而确定全卷的难度系数。

试题难度的客观标准探索

文档上传者

热门标签更多>

热门推荐更多>

精品范文更多>

试题难度的客观标准探索

文档上传者

热门标签 更多>

热门推荐 更多>

精品范文更多>

热门标签更多>

热门推荐更多>