主成分分析法在学生成绩分析中的应用

时间:2022-10-08 05:10:19

主成分分析法在学生成绩分析中的应用

【 摘 要 】 本文从大学四年成绩的真实数据入手,利用主成分分析法,建立了数学模型,然后给出各主成分的得分函数,并结合成绩进行分析,最后得出影响成绩的主要课程,并验证了学校实行的学分绩是合理的。该研究结果为今后的教学研究和管理提供了科学的依据。

【 关键词 】 学生成绩;主成分分析;SPSS软件

1 引言

目前我国大力发展高等教育,使得高等教育获得了突飞猛进的发展。由于大学生在校期间学习的科目众多。学校在评价学生成绩时,大多数院校的普遍做法是用学分绩,这种方法能够体现学时多,即学分高的课程的重要性,但各门课程给定的学分数是否合理,学分绩是否能全面反映原始数据的主要信息以及如何科学、客观、全面地评价学生的综合成绩对学生和学校都特别重要,是值得大家研究的课题。

2 主成分分析的基本思想和步骤

主成分分析是把各变量之间互相关联的复杂关系进行简化分析的方法。在学生成绩的研究中,为了全面系统的分析和研究问题,必须考虑许多课程指标,这些指标能从不同的侧面反映我们所研究的对象的特征,但在某种程度上存在信息的重叠,具有一定的相关性。主成分分析试图在力保数据信息丢失最少的原则下,对这种多变量的截面数据表进行最佳综合简化。

主成分分析的步骤:(1)数据标准化;(2)求相关系数矩阵;(3)一系列正交变换,使非对角线上的数置0,加到主对角上;(4)得特征根(即相应那个主成分引起变异的方差),并按照从大到小的顺序把特征根排列;(5)求各个特征根对应的特征向量;(6)用下式计算每个特征根的贡献率Vi:Vi=xi/(x1+x2+...);(7)根据特征根及其特征向量解释主成分物理意义。

3 运用主成分分析法分析学生成绩

以北京联合大学应用文理学院计算科学系07信息与计算科学的学生大学四年的成绩为例,运用主成分分析法对学生成绩进行综合分析。全班一共有26名学生,将这26名学生作为主题,把2007-2011学年各科考试成绩作为变量,一共是56科,分别是大学英语1、高等数学A1、代数与几何、计算机基础、思想道德和法律基础、体育1、中国近代史纲要、军事理论、大学英语2、思想邓小平理论和“三个代表”重要思想概念1、VB语言程序设计、高等数学A2、体育2、C语言程序设计、VB课程设计、形势与政策、大学英语3、大学物理2、算法与数据结构、离散数学、毛邓三2、体育3、大学物理B实验、C语言程序设计、概率统计、数值计算方法、数据库原理及应用、数学软件、马克思主义基本原理概念、形势与政策、体育4、数值计算和数学建模、专业英语、科技文献检索、理论计算机科学基础、JAVA程序设计、专业集中实践教学4、算法分析与程序设计、网络技术基础、专业实践教学模块3、数字电路、运筹与优化、西方经济学、计算机图形学、软件系统基础、市场营销、网络操作系统、数学模型、专业集中实践教学模块2、三维动画设计、专业集中实践教学模块3、管理信息系统、项目管理、专业集中实践教学模块、就业指导、网站与网页设计。

利用SPSS软件进行主成分分析,将这些科目分别用X1、X2、…、X16来表示,用xij表示第i个同学在第j门课上的得分,则X=(xij)26*56,这样就得到了一个26*56的矩阵。

从相关系数矩阵表的下半部分可以看出,56个指标都是显著相关的。通过SPSS软件用主成分分析法提取主成分,可以看出一共提取了10个主成份,其特征值分别是25.488、10.046、2.974、2.622、1.992、1.677、1.606、1.450、1.209、1.056,分别占总和的45.514、17.939、5.310、4.683、3.556、2.995、2.868、2.589、2.159、1.885。从输出的结果看,提取了10个主成分,累计方差贡献率已经达到89.499%。

根据旋转后的因子载荷矩阵(为了结构简化,使每个变量仅在一个公因子上有较大的载荷,而在其余公因子上的载荷比较小,便于进行主因子解释,)可以看出:算法分析与程序设计、数学模型、专业集中实践3在第一主成分上的载荷很大,主要反映的是计算机专业课程影响成绩方面的信息,因此第一主成分可以命名为计算机专业的综合成分。离散数学、C语言程序设计、高等数学A2、数值计算方法在第二主成分上的载荷比较大,主要反映了同学在专业课与基础课方面的信息,因此第二主成分可以命名为专业基础成分。

大学英语1、概率统计在第三主成分上的载荷比较大,主要反映的也是专业课程与基础课程的信息。大学英语1在第四主成分上的载荷比较大。体育、C语言课程设计第五主成分上的载荷比较大;体育1、体育2第六主成分上的载荷比较大。思修、毛邓三第七主成分上的载荷比较大;毛邓三、形势与政策第八主成分上的载荷比较大。军事理论、毛邓三2第九主成分上的载荷比较大;计算机基础、理论计算机基础第十主成分上的载荷比较大。

由此可以看出,在大学四年的成绩中,影响学生成绩的主要课程是专业课程中的算法分析与程序设计、数学模型、专业集中实践3。

由主成分得分系数,可以得到计算主成分得分的线性方程:

F=β1F1+β2F2+...+βkFk

以上的主成分得分方程可以得到每个样品Case的成分得分,即SPSS中已将十个因子得分存为变量fac1-1、fac2-1、fac3-1、fac4-1、fac5-1、fac6-1、fac7-1、fac8-1、fac9-1、 fac10-1,其值大小就是对应于每个Case的主成分得分。根据每个主成分得分的大小进行排序,可得到在每个主成分上各个同学得分排序情况。如果按照每个主成分的方差贡献率作为权数,可对每个同学的十个主成分得分进行综合,即:综合得分

=fac1-1*45.514+fac2-1*17.939+fac3-1*5.310+fac4-1*4.683+fac5-1*3.556+fac6-1*2.995+fac7-1*2.868+fac8-1*2.589+fac9-1*2.158+fac10-1*1.885

分析得出的各个主成分,并对比学分绩表,发现主要影响学生成绩的课程与学分高的课程基本相同,也就是说学分绩的使用在大学生中是合理的。

4 建议

大学一年级学校应注重对学生基础课程中高等数学、大学英语、计算机基础的学习,在大学二三四年级的时候应加强学生专业课程当中算法分析与程序设计、数学建模和专业集中实践3的学习。同时教师除了在教学中有目的地进行课程的开展外,还可以鼓励大学生组建各种形式的社会实践活动,通过多种形式培养大学生的科研创新能力和探索能力。

参考文献

[1] 范贺方,樊顺厚.主成分分析法在学生成绩分析中的应用[J].中国科教创新导论,2009,12(2):79-80.

[2] 张文颖,张玉,王冉.大学生成绩影响因素的主成分分析[J].科技创新导报,2010,2(20):175.

基金项目:

1.北京市属高等学校高层次人才引进与培养计划项目 项目编号:CIT&TCD201304089。

2.论文得到北京联合大学应用文理学院2012年度院级科研项目的经费资助。

3.北京联合大学应用文理学院2012年度教改委托项目:教学质量提高-教师教学效能提升(21217546905)。

作者简介:

吕书强(1971-)男, 河南泌阳人,硕士,讲师,主要从事应用数学的教学和科研工作;主要研究方向:非线性方程及数学模型。

蔡春(1973-),女,中国农业大学,博士研究生,北京联合大学应用文理学院基础教学部副教授,主要从事数据挖掘算法研究。

马青华(1973-),女,中国人民大学,博士研究生,北京联合大学应用文理学院基础教学部副教授,主要从金融数学反问题研究。

上一篇:基于云计算的资源管理系统的研究 下一篇:郑和七下西洋对安全引航的启示