经典测试理论中试题难度分析及计算方法

时间:2022-10-13 05:44:42

经典测试理论中试题难度分析及计算方法

摘要:该文提供了经典测试理论下客观性试题和主观性试题难度的计算方法,针对试卷的难度展开论述,为评估教师的教学能力和学生的学习能力提供科学的依据。

关键词:经典测试理论;难度

中图分类号:TP311文献标识码:A 文章编号:1009-3044(2009)34-9773-02

The Difficulty Analyzes and Calculate Method on Classical Test Theory

DU Peng-dong

(Inner Mongolia University of Technology, Engineering Training Center, Baotou 014010, China)

Abstract: The text provides one calculate method on objectivity and subjectivity question ofClassical Test Theory. At the same time, the text supplies a scientific gist for teachers' capability and students' learning capability.

Key words: Classical Test Theory; Difficulty

考试不仅可以检查学生的学习质量,反映教师的教学水平和教学效果,而且能使教师正确地了解学生的学习情况,了解自己的教学效果。一套理想的试卷应达到教学目标的六个层次:知识、领会、应用、分析、综合和评价,一套试卷能否达到预期的效果,除了对试卷质量进行控制以外,还需要对试卷进行科学的分析与评价。目前,高校考试对试卷的质量没有定量客观的评判标准,由于命题者的素质不同以及存在着主观性和随意性使试卷的质量不稳定,因此对试卷质量的控制一般是采用定性的方法,较少用定量方法,而且对考试的分析也仅仅是学生的及格率、优秀率和分数的分布情况,这种分析只能用于检验学生的学习效果,却不能提供教学效果的信息反馈。为了更好的对测试和试卷做出评价,指标应是多方面的,除了上述指标外,还应对试卷的平均分、难度、区分度、效度、信度、分数分布的曲线形态进行分析[1]。对此,该文主要针对试卷的难度展开论述,通过试卷分析对考试的命题、施测、阅卷、评分等环节进行科学的评价,为评估教师的教学能力和学生的学习能力提供科学的依据。

1 经典测试理论中试题难度的定义方法

试题难度的概率意义指的是被试群体在某题的真实得分的数学期望与该题满分之比。在现行学科测验中,通常采用主观性试题和客观性试题两种题型。由于试题类型的不同,那么难度定义的方法也随之而变化,对于客观性试题的记分模式通常采用0、1记分,正答得1分,误答得0分,对于主观性试题的记分模式通常采用0、k记分,误答得0分,根据不同回答情况分配k分。

1.1 客观性试题的难度定义方法

对于选择题,由于备选项个数通常多于两项,那么被试选择正确答案的比率可能由于猜测机遇因素的影响,而使答对该题的人数比率增加,可供选择的答案数目越少,这种机遇影响越大[2]。为此,笔者给出两种客观试题难度的计算方法。

1.1.1 0、1记分测验难度的计算

对于这种类型的测验,假设被试作答时猜测机遇水平为零,即被试作答不受猜测因素的影响。下面给出两种难度的计算方法:第一种是用被试群体答对该题人数比率表示,数学模型为:

p=R/n (1)

p为测题的难度,R为被试群体在该测题上答对人数比率,n为被试群体人数。由式1可以看出,难度值越大,正答人数越多,则测题的难度越小;难度值越小,正答人数越少,则测题的难度越大,二者的意义恰好相反。通常在计算难度时,被试的样本容量不得少于32人。该文为了计算的方便,样本取10人。例如某小学五年级数学测验中,10名被试在其中的6道0、1记分题上的正答情况如下:

第二种计算方法是将每个被试的测验总分由高到低排列,分别从高分和低分各取总人数的27%构成高分租和低分组,按照这两组在某测题答对时的得分率作为该测题的难度值,其计算公式为:

p=(pH+pL)/2 (2)

pH表示高分组在某测题的得分率,pL表示低分组在某测题的得分率。

1.1.2 0、1记分多项选择题难度的计算

如前所述,对于多项选择题,由于备选项个数多于两项,会出现猜测的可能,这样难度值会随猜测的变化而变化,下面提出一种矫正此类测题难度的方法,计算公式如下:

Cp=(k*p-1)/(k-1) (3)

Cp表示矫正猜测机遇之后的难度值,p表示矫正前计算出的难度值,k表示测题中供选择答案数。

例如,对于表1中的第3题,假设该题是四选一的选择题,则其矫正后的难度值得计算为:

Cp=(4*0.7-1)/(4-1)=0.6,此时可以看出该题的难度值发生了变化,如果我们对具有不同选项个数的选择题的难度进行比较时,就不可以直接利用式1计算,而必须通过式3的矫正再进行比较。例如,某选择题未矫正的难度值为0.8,供选项有5个,另一选择题未矫正的难度值为0.81,供选项有4个,试比较两题的难度。由于两题备选项个数不同,所以需根据式3进行矫正,矫正后第1题的难度为Cp=(5*0.8-1)/(5-1)=0.75,第2题的难度为Cp=(4*0.81-1)/(4-1)=0.747。根据矫正后的难度相比,第1题比第2题稍容易些,但如果根据矫正前比较两题的难度,恰好得到相反的结果,可见,当对具有不同选项个数的选择题比较难度值得大小时必须先将其矫正才可比较。

1.2 主观性试题的难度定义方法

对于主观性试题,被试的应答情况不全是正答和误答两种,而是0分到满分之间多种可能结果。这种类型的测题难度定义方法为:

p=x/x (4)

P表示测题的难度, x表示被试群体在该测题上的平均得分,x为该测题的满分。为了计算的方便,假设被试10人,某测题满分为9分,这10人在该题上的得分分别是8分,6分,4分,8分,9分,2分,0分,6分,5分,7分,则被试群体在该题的平均得分为(8+6+4+8+9+2+0+6+5+7)/10=5.5分,那么该题的难度值p=5.5/9=0.61。

通过2.1和2.2对不同类型试题难度的定义可以得出一个共同的结论,测题难度值大,则在该题上正答的人数多,那么被试群体在该题的数学期望值大,说明试题较容易;测题难度值小,则在该题上正答的人数少,被试群体在该题的数学期望值小,说明试题较难,因而难度值的大小与试题难易程度的高低是反向的。

2 评价测题的难度

难度的理论评价测题的难度,是评价测题拟定好坏的指标之一,也是筛选测题的依据之一。那么测题的难度指数多少为多少合适,经计算,当测题的难度指数p=0.5时,测题的方差为0.25最大[3],测题方差的大小,标志着测题对于被试作答反应的鉴别能力。测题方差越大,它对被试作答反应的鉴别力越大,也就是说,越能区分出学习好和学习差的被试;测题方差越小,它对被试作答反应的鉴别能力越小,也就是说,对于学习好和学习差的被试的区分能力越差。因此,中等难度,即难度指数在0.5左右的测题鉴别能力最好。

参考文献:

[1] 王孝玲.教育测量[M].吉林:东北师范大学出版社,2006.

[2] 薛理银.教育信息处理原理[M].辽宁:辽宁大学出版社,2008.

[3] 张厚粲.现代心理与教育统计学[M].北京:北京师范大学出版社,2007.

上一篇:财经类专业计算机基础课程教学改革探讨 下一篇:数据挖掘技术在钢材仓储管理中的应用研究