基于主成分分析的学生综合成绩评定

时间:2022-09-12 02:59:34

基于主成分分析的学生综合成绩评定

摘 要 平均分排名法评定学生不科学,有失公平。本文在考虑试卷难度,课程性质情况下进行无量纲化处理,小样本情况下引入难度系数,采用主成分分析法进行综合评定。

关键词 平均分 无量纲化 难度系数 主成分

学生综合成绩评定是对学生学习情况的客观反应,科学、公平的评价学生综合成绩是营造良好的学习氛围的必然要求,同时对学校评定奖学金,评优评先具有指导意义。但是大多数学校在评定中采用简单的总分或平均分排名法具有严重的不科学性,不合理性,不能真正反应学生的真实水平。特别是对于同一年级,不同专业,不同课程,不同的考卷,不同的阅卷老师及不同的评卷标准等。本文在克服上述问题的情况下采用主成分分析方法建立综合评价模型。

1成绩评定面临的问题

每门课程学时的差异,如高等数学180学时,法律基础40学时,同样得90分,学习高等数学一定比学法律基础要付出的多,评价时要考虑每门课程的学分;每门课程难易程度差异,如高等数学平均分60分,最高分100,法律基础平均分80,最高分也是100,同样是100分,高数的100分比法律基础100分,更难获得,评价时要考虑试卷难易程度,同时克服试卷的难易程度也就克服了专业的不同,考试科目的不同;考查科目的优、良、及格,带有更多的教师感彩及主观意志。不能简单的给与95、85、60来加入综合成绩评定,评价时要考虑考查科目与考试科目区别。

一门全院性的公共课,参考人数多,样本大,在大样本的情况下,考试成绩的分布趋近于正态分布,而主成分分析法的一个前提条件是各指标数据的分布应服从正态分布,同时主成分分析进行多指标评价时,常用到标准分来进行无量纲化处理。因此有必要对标准化考试情况下的数据无量纲化,同时数据的无量纲化处理,也消除了因课程性质、试卷难度、不同科目等差异造成的原始成绩不可比较的问题。针对此问题,对考试成绩做如下无量纲化处理。

2标准化考试情况下的数据无量纲化

不同科目间,由于课程性质、课程难度、试卷难度和评分标准的不同,各科分数是具有不同“含金量”,即不同量纲,必须要进行无量纲处理。利用Z标准分变换的计算公式为:

式中,zi为标准分,xi为学生该课程的成绩,n为考生数,xi为课程成绩的平均分,%li为该课程的全部考生的成绩标准差。其中,,计算后各指标数据的平均值为0,方差为1,各变量间有了统一的量纲,消除了由于课程性质不同、试卷难易程度不同和成绩分布不一致带来的问题,且各指标在变化前后的相关程度不变。

3不同课程的数据无量钢化(考虑难度系数)

不同专业的不同课程难易程度不一样,学习效果也不一样,为了规避课程的难易程度,将考试成绩无量纲化,首先引入难度系数。表明平均分越高难度系数越小,试卷越简单,反之难度系数越大,试卷就越难。

不同的专业课 ,学习人数差异大,尤其是学生人数较少的专业,由于样本少,通常不符合标准正态分布,倘若成绩出现两极分化,会使得标准差很大,这时若标准化,数据失真就更大。我们必须考虑难度系数,把成绩标准化

即:=*,然后再利用标准正态的方式无量纲化。

建立相关系数矩阵,求特征值、特征向量和载荷矩阵

(1)在标准化数据矩阵X*=(X1*,X2*,…,Xp*)的基础上,利用公式R=(X*)'X*计算原始指标的相关系数矩阵,其中是指标X1*与Xj*之间的相关系数,则

。根据公式|R%djE|=0,求出前P个特征值%d1>%d2>…>%dp≥0。

(2)根据公式|R%djE|xi=0,求出与特征值%dj相对应的单位正交特征向量Uj=(u1j,u2j,…,upj)。

(3)计算主成分载荷矩阵。根据相关系数矩阵R的特征值%dj和特征向量u1,…,up,则初等载荷矩阵为%l=[,,…,]。

4选取主成分

主成分分析将原来有一定关系的多个原始指标转换成几个互不相关的主成分的方法,其目的就是降低原始指标的维度,所以一般会选m(m

在选取主成分过程中,应参考以下原则:

(1)通常取m使得累计方差贡献率达到较高比例(80%)。

(2)选取特征根大于1的主成分

(3)特征根散点图:将特征值(由大到小)与对应特征根绘制一条曲线,观察是否有明显“突降点”若有则此点前的特征根个数可取M。

按照以上原则选取的主成分个数不仅能使信息损失较少,而且达到减少变量的目的。

5综合评价分析

经过计算选取的主成分互不相关且相互独立,利用原始指标无量纲化后的数据计算各主成分得分即:

Fi=UiX*=u1iX1*+u2iX2*+…+upiXp*

以各主成分的方差贡献率作为权系数,利用各主成分得分的加权平均值计算综合成绩指数,则综合成绩指数为:

Fi=v1F1+v2F2+…+vpFp

参考文献

[1] 李春平.主成分分析法和层次分析法在对综合指标进行定量评价中的比较[J].南京财经大学学报,2005,5(6):54-58.

[2] 张鹏.基于成分分析的综合评价研究[D].江苏:南京理工大学,2004.

[3] 王斌会.多远统计分析及R语言建模(第三版)[M].暨南大学出版社,2014.

[4] 傅德印.主成分分析中的统计检验问题[J].统计教育,2007(9):4-7.

上一篇:新能源汽车大数据库的设计分析 下一篇:高校学生工作开展中学生主体地位的体现