多元统计分析范文

时间:2023-03-13 18:06:24

多元统计分析

多元统计分析范文第1篇

对81份外引亚麻种质资源主要农艺性状的变异度进行分析,表明存在较大遗传差异,多样性比较丰富。在此基础上,通过因子分析,把能代表7个性状的前3个因子归类为产量因子、单果种子数因子和株形因子,经相关性分析确定了各性状之间的关系。按系统聚类,把81份材料聚成为3大类,为不同育种目标提供依据。

关键词:

外引;亚麻;农艺性状;分析

亚麻属亚麻科(Liace-ae)亚麻属(Linum),栽培亚麻分为纤维用型、油用型以及油纤兼用型,是重要的纤维和油料作物。多元统计分析是运用数理统计方法来解决多指标问题的理论和方法[1-3],在多种作物的资源研究中得到应用[2-4]。近年来,亚麻的种质资源研究有很大进展[5-7],除深入进行农艺性状和品质性状的鉴定和描述外,多元分析也得到广泛应用[8-11]。文章对收集的外引油用亚麻品种资源的7个主要农艺性状,采用变异度分析、因子分析、相关性分析和系统聚类等多元统计分析方法对资源进行分析整理,为加快优良资源的利用和育种提供依据。

1材料与方法

1.1供试材料试验材料选用由云南大学刘飞虎提供的外引材料中的81份种质资源,编号依次为1~81。其中1~36号从荷兰引入,37~81号从加拿大引入。

1.2试验方法本试验采用随机区组播种,不设重复,每品种视种子量的多少播种2~5行,行长1.5m,行距0.3m。试验地四周设保护行(保护行种植其他亚麻品种)。试验期间,详细记载各品种的物候期,收获时每试验小区按不同点随机选取10株进行考种。整个生育期进行常规管理。1.3数据统计分析采用DPS数据处理系统进行数据处理。

2结果与分析

2.1变异度分析从表1看出,各参试材料平均株高69.99cm,蒴果数44.55个/株,着粒数7.57粒/个,千粒重5.77g,单株种子重1.87g。7个主要农艺性状平均变异系数为25.59%,其中单株种子重变异系数最大,为36.36%,变幅为0.85~3.87。其次是单株蒴果数(31.1%)、分枝数(28.96%)、千粒重(27.56%)、茎粗(22.07%),最小的是株高(16.59%)和着粒数(16.51%)。表明81份资源农艺性状存在较大的差异,这些材料是选育油用亚麻品种的优异资源。

2.2因子分析对81份供试材料的主要农艺性状进行因子分析,经过KMO和Bartlett检验,由表2可知,KMO值为0.6344,大于0.5,表明样本基本合适。Bartlett值为304.4524,P小于0.05,相关矩阵不是一个单位矩阵,数据适用于因子分析。利用方差极大正交旋转得到因子特征值和因子特征向量载荷值(表3),其中前3个因子的累积贡献率达到81.0874%,表明这3个农艺性状因子基本保持了7个农艺性状的绝大部分信息。因子1的特征值为2.7711,分枝数、蒴果数、千粒重、单株种子重的载荷值较大,说明这4个性状存在相互促进的关系,这些性状跟产量构成有关,可称为产量因子。因子2的特征值为1.8311,仅着粒数载荷值较大,可称为单果种子数因子。因子3的特征值为1.0739,株高、茎粗的载荷值较大,说明这2个性状存在相互促进的关系,这些性状跟植株形态有关,可称为株形因子。

2.3相关性分析供试材料7个性状中,单株种子重与千粒重、蒴果数、分枝数、茎粗呈极显著正相关,与株高呈负相关,与着粒数呈极显著负相关;千粒重与单株种子重呈极显著正相关,与茎粗、分枝数、蒴果数呈正相关,与株高、着粒数呈极显著负相关;着粒数与株高呈极显著正相关,与千粒重、单株种子重呈极显著负相关,与茎粗呈显著负相关,与分枝数、蒴果数呈负相关;蒴果数与单株种子重、茎粗和分枝数呈极显著正相关,与千粒重呈正相关,与株高呈负相关;分枝数与茎粗呈极显著正相关,与着粒数和株高呈负相关;茎粗与分枝数、蒴果数、单株种子重呈极显著正相关,与千粒重和株高呈正相关,与着粒数显著负相关。从表4还可看出,单株种子重与千粒重、蒴果数、分枝数关系更为密切,在育种中应重点考虑这些性状。

2.4聚类分析采用系统聚类中的最长距离法,数据经标准化处理,以欧氏距离为遗传距离进行聚内分析,可得到3个品种群,结果见图1。根据品种群中各品种性状表现,各品种群有如下特征(表5)。品种群Ⅰ:这一类有51个品种,表现株高较高(平均73.45cm),着粒数(平均8.09粒/个)较多,千粒重(平均5.14g)和单株种子重(平均1.52g)较低。这类品种可作为油纤两用类型加以利用。品种群Ⅱ:这一类有4个品种,表现株高较低(平均43.33cm),千粒重(平均9.53g)较高。这类品种可作为油用亚麻矮杆基因的来源和大粒型品种选育的亲本材料加以利用。品种群Ⅲ:这一类有26个品种,表现株高适中(平均67.31cm),茎粗(平均5.83cm)最粗,分枝数(平均17.62个)和蒴果数(平均58.88个)最多,单株种子重(平均2.59g)较高。这类品种可作为油用亚麻的育种资源加以利用,部分品种经品种比较试验和多点试验可直接应用。

3讨论

种质资源的多样性是育种的基础,农艺性状的鉴定和描述依然是种质资源研究最基本的方法和途径。对81份外引亚麻种质资源主要农艺性状的变异度分析,表明81份种质资源存在较大遗传差异,多样性比较丰富。在此基础上,通过因子分析,把能代表7个性状的前3个因子归类为产量因子、单果种子数因子和株型因子。虽然每个因子都对几个性状起控制作用,但因子的载荷量不同,其作用程度也不同,表明单个因子对性状起直接作用或间接作用。相关性分析确定的各性状之间的关系表明,单株种子重与千粒重、蒴果数、分枝数关系更为密切,在育种中应重点考虑利用这些性状。通过系统聚类,把81份材料划分为3大类,其中品种群Ⅰ可作为油用亚麻矮杆基因的来源和大粒型品种选育的亲本材料加以利用,品种群Ⅱ可作为油用亚麻矮杆基因的来源和大粒型品种选育的亲本材料加以利用,品种群Ⅲ可作为油用亚麻的育种资源加以利用,部分品种经品种比较试验和多点试验可直接应用。文章仅对81份资源的部分农艺性状进行了多元统计分析,为资源的进一步利用和品种选育提供了依据,而对纤维含量、纤维品质、种子含油量、脂肪酸构成等品质性状未列入考察对象,值得进一步研究。

参考文献:

[1]袁志发,刘元祖,林家宝,等.多个数量性状的因子分析[J].陕西农业科学,1998(1):24-26.

[2]林范学,林范学,程水明.香茹数量性状的因子分析[J].菌物学报,2004,23(4):502-507.

[3]杨为海,王维,邹明宏,等.澳洲坚果果实数量性状的因子分析[J].热带作物学报,2011,32(9):1600-1604.

[4]桂敏,龙洪进,钟秋月,等.引进辣椒种质资源果实性状的多元统计分析[J].西南农业学报,2014,27(2):772-776.

[5]路颖.亚麻种质资源的研究与利用[J].黑龙江农业科学,2006(1):13-15.

[6]亢鲁毅,张辉,贾霄云,等.我国亚麻种质资源研究进展[J].内蒙古农业科技,2009(2):77-78.

[7]周亚东,李明.世界油用亚麻生产发展与展望[J].中国农学通报,2010,26(9):151-155.

[8]王玉富,贾婉琪,薛召东,等.国外引进亚麻种质资源的聚类分析及评价[J].植物遗传资源学报,2010,11(5):548-554.

[9]张建平,党占海.亚麻品种资源的聚类分析及评价[J].中国油料作物学报,2004,26(3):24-28.

[10]周亚东,李明,苏钰,等.亚麻种质资源脂肪酸组分含量与品质性状的相关分析[J].东北农业大学学报,2010,41(9):21-26.

[11]赵利,党占海,张建平.甘肃胡麻地方品种种质资源品质分析[J].中国油料作物学报,2006,28(3):282-286.

[12]王洋,张明生,李祥栋,等.不同高粱种质资源形态多样性及其形态标记聚类分析[J].贵州农业科学,2014(6):1-5.

[13]唐启义,冯光明.实用统计分析及其DPS数据处理系统[M].北京:科学技术出版社.

多元统计分析范文第2篇

文章运用多元统计分析中的因子分析,根据试卷的量化指标难度、区分度、信度以及学生对教师的评价等数据指标建立多元统计模型,利用SAS统计分析软件进行建模分析。通过因子分析运行结果,进一步分析影响教学效果、教学评价、教学质量的因素,为提高教学质量提供参考。

关键词:

多元统计分析;因子分析;难度;区分度;信度;态度

试卷质量的统计分析是检验学生学习成果、提高教学效果、改进教学方式的重要途径。过去很多研究大多就试卷质量量化指标进行计算和分析,仅得到了一些关于试卷质量的数据。而本文以教育统计和测量为理论基础,计算出试卷质量的量化指标,运用多元统计分析知识,建立因子模型,根据因子分析的结果,简要分析教师的教学效果和学生的学习状况,对教学质量得出综合评价。

一、试卷量化的指标

试卷分析数量化是教育测量科学化的重要内容,衡量试卷质量的主要检验指标有难度、区分度、信度、效度四项指标,这些指标的概念和计算方法如下(本文所要分析的试卷中不含有选择、是非题)。

(一)可靠性分析可靠性是指考试结果的可信程度,用于考察试卷的总体质量。从教育测量学的角度来看,学生的考试成绩应来自正态分布或近似正态分布,否则该次考试的成绩就是不合理的。

(二)难度分析一般大规模标准化考试难度控制0.4~0.7之间,但学科结业考试一般控制在0.5~0.85之间为宜。

(三)区分度分析试题区分度是考量试题是否能将学识不同的学生区分开的指标。

(四)信度分析信度是评估分数与考生真实水平一致性的指标。通常大规模标准化考试要求信度在0.9以上,自编试卷的信度应大于0.4。

二、具体试卷指标计算

现有某学校某专业学生(58人)的五门课程,其中,前两门课程为同一位老师教授,后三门课程的授课教师均为互不相同的教师。另外,根据问卷调查,得到了学生对五门专业课授课教师的教学评价的平均值,满分为100分。在对学生的调查中发现,学生对教师的评价较低,则相应的学生的学习积极性不高,学习态度差;而对评价高的课程,学生的学习积极性高,学习态度良好。因此,将教学评价可以看作学生的学习态度(见表1)。

(一)可靠性检验由于样本容量n≤200,将采用SAS软件中的Shapiro-Wilks的W统计量来检验正态性。经检验,此次考察的五门课程均符合正态分布,数据可靠,可以进行数据统计分析。

(二)试卷量化分析的各项指标的计算按照上述所提供的试卷各项指标计算公式可得到结果如表1所示。

三、正交因子模型及因子分析

建立因子分析数学模型的目的不仅要找出公共因子以及对变量进行分组,更重要的是要知道每个公共因子的意义,以便对实际问题做出科学的分析。下面以表1作为数据源,编写程序,输出结果如表2、表3。由表2可看出,前两个因子的累计贡献率超过90%,故公因子的个数为2。由表3可以看到第一公因子中主要载荷为x2(区分度)、x4(态度)、x1(难度),这都是影响学生考试成绩的指标,且可看到学生的对老师态度起了很大的作用,可以称之分数因子;第二个公因子中,起主要作用的是x3(信度),可称之为稳定性因子。

四、结果分析

通过上述的试卷质量指标的计算,以及因子分析的结果,可以得到以下分析结果。第一,虽然学生对前两门课程的同一位任课教师的评价很低,但是该授课教师试卷质量符合要求,反映了教师的教学大纲完成情况正常,说明了课程考试从一定意义上有效的检验了学生的学习效果及教师课堂教学效果;其次,学生对教师的评价的主观性较强,这些评价数据也反映学生对待授课教师、该门课程的学习态度情况。接下来,通过因子分析来进一步判断学生的态度对考试结果的影响。第二,SAS软件统计分析课程试卷与时间序列统计分析课程试卷相比较,前者的试卷量化指标显然要比后者质量高,以此来看,前者的教学效果及教学质量要比后者强,同一位老师教授的同一批学生的不同课程,存在较为明显的差异。从SAS软件中利用成对组检验,也可以得出这样的结论,即两次考试存在显著性差异。另外需要说明的是,前者是第六学期考试科目,后者是第七学期的必修课,而全国硕士研究生入学考试就是在第七学期。可以看到,在出题者和答题者不变的情况下,前后两次考试存在显著性差异,除了试卷质量本身的差异性,另一个非常重要的原因应该是学生的学习态度。第三,学生的学习态度是否影响考试结果,在因子分析中这个问题得到了解答。按照因子分析的理论,影响考试成绩的因素可以综合为少数的几个,并且可以根据因子载荷矩阵来判断,哪个因素的影响较大。经因子分析后,影响成绩的指标综合为两个:分数因子和稳定性因子。其中可以看到学生态度的载荷为0.94309,表明态度是影响成绩非常重要的因素。通过上面的分析,大多数学生都忙于准备考研,没有认真的准备考试,因此,在第七学期的《时间序列分析》考试与上学期的考试存在显著性差异,其中一部分原因是由学生的学习态度造成的。综上所述,学生的学习态度对教学有非常重要的影响,而学生对教师的教学评价也存在一定的主观性,通过对试卷质量的分析,可以从中可以获得教学上的一些信息。目前国内各高校都在努力提高教学质量,也在努力尝试开发较为有效的教学评价方法,试卷质量的考察也可以作为教学评价的指标之一,可以使评价更加全面有效。

参考文献:

[1]戴忠恒.心理与教育测量(第二版)[M].华东师范大学出版社,1991.

[2]梁伟,赵泽茂.“高等数学”考试试卷的统计分析[J].河海大学常州分校学报,1998(04).

[3]伍跃东,彭绍勇.数理统计在试卷分析数量化中的应用[J].郴州医专学报,1999(01).

[4]马少仙.试卷质量统计分析方法[J].西北民族学院学报(自然科学版),2001(42).

[5]范元玮,吴昌泽,刘世祥.数学考试成绩统计分析的一点启示[J].北京建筑工程学院学报,2001(04).

[6]何晓群.多元统计分析[M].中国人民大学出版社,2004.

[7]高惠璇.实用统计方法与SAS系统[M].北京大学出版社,2001.

[8]张尧庭,方开泰.多元统计分析引论[M].科学出版社,1982

多元统计分析范文第3篇

Abstract: Multivariate statistical analysis is a branch of statistics,which is rich and have a very wide range of applications. In many disciplines of natural and social sciences,researchers are likely to deal with data that has multiple variables. In this paper,we will discuss the concept,models and analytical steps of the factor analysis.

关键词:多元统计分析;因子分析;模型

Key words: multivariate statistical analysis;factor analysis;model

中图分类号:C93文献标识码:A文章编号:1006-4311(2010)15-0128-02

多元统计分析是运用数理统计方法来研究解决多指标问题的理论和方法。随着计算机应用技术的发展和科研生产的迫切需要,多元统计分析技术被广泛地应用于地质、气象、水文、医学、工业、农业和经济等许多领域,成为解决实际问题的有效方法。多元统计分析中的因子分析(Factor Analysis)是寻找公共因子的模型分析方法,它是在主成分的基础上构筑若干意义较为明确的公因子,以它们为框架分解原变量,以此考察原变量间的联系与区别。其基本目的就是用少数几个因子去描述许多指标或因素之间的联系,即将相关比较密切的几个变量归在同一类中,每一类变量就成为一个因子,以较少的几个因子反映原资料的大部分信息,就是从大量的数据中“由表及里”、“去粗取精”,寻找影响或支配变量的多变量统计方法。

对因子分析模型可以做如下描述:①X=(x1,x2,…,xp)是可观测随机向量,均值向量E(X)=0,协方差阵Cov(X)=∑,且协方差阵∑与相关矩阵R相等。②F=(F1,F2,…,Fm)(m

称为因子分析模型,由于该模型是针对变量进行的,各因子又是正交的,所以也称为R型正交因子模型。

其矩阵形式为:x=AF+ep

我们把F称为X的公共因子或潜因子,矩阵A称为因子载荷矩阵,e称为X的特殊因子。A=a(ij),aij为因子载荷。数学上可以证明,因子载荷aij就是第i变量与第j因子的相关系数,反映了第i变量在第j因子上的重要性。

建立因子分析模型的目的不仅是找出主因子,更重要的是知道每个主因子的意义,以便对实际问题进行分析。还有一个重要的作用是应用因子分析模型去评价每个样品在整个模型中的地位,即进行综合评价。

在上面的分析告一段落后,就可以确定因子分析的步骤。因子分析的核心问题有两个:一是如何构造因子变量;二是如何对因子变量进行命名解释。因此,因子分析的基本步骤和解决思路就是围绕这两个核心问题展开的。

我们来看一个实际的例子,即考察我国各省市社会发展综合状况。

以下是对我国各省市综合发展情况做因子分析。数据表中选取了六个指标分别是:人均GDP(元)X1,新增固定资产(亿元)X2,城镇居民人均年可支配收入(元)X3,农村居民机家庭纯收入(元)X4,高等学校数量(所)X5,卫生机构数量(所)X6。原始数据见表1:

分析过程如下:①将原始数据标准化;②建立六个指标的相关系数阵R;③公因子方差;④总方差解建立因子载荷阵;⑤建立因子载荷阵;⑥对因子载荷阵施行方差最大旋转,旋转后得正交因子表矩阵,由此有:X1=0.947F1+0.178F2-0.115F3,X2=0.940F1+0.105F2+0.261F3,X3=0.893F1-0.0747F2+0.404F3,X4=0.0364F1+0.967F2+0.09455F3,X5=0.212F1+0.830F2+0.345F3,X6=0.222F1+0.493F2+0.806F3;⑦输出因子成份得分系数矩阵。最后,由上述表可见,每个因子只有少数几个指标的因子载荷较大,因此可根据上表分类,将6个指标按高载荷分成3类,列于表2:

由此,运用因子分析的方法我们对国内各省市综合发展情况有了一个了解。

由前面的分析可以得出,因子分析法是从研究变量内部相关的依赖关系出发,把一些具有错综复杂关系的变量归结为少数几个综合因子的一种多变量统计分析方法。它的基本思想是将观测变量进行分类,将相关性较高,即联系比较紧密的分在同一类中,不同类变量之间的相关性则较低,那么每一类变量实际上就代表了一个基本结构,即公共因子。对于所研究的问题就是试图用最少个数的不可测的所谓公共因子的线性函数与特殊因子之和来描述原来观测的每一分量。

在实际问题中要选择适当的方法来解决问题,需要对问题进行综合考虑。应该根据实际情况对问题进行合理的分析与判断,收集相关资料,选择合适的分析方法,建立模型,最后对模型进行诊断和优化处理,并应用于生产实际。

参考文献:

[1]杨维权,刘兰亭,林鸿洲.多元统计分析[M].北京:高等教育出版社,1989.

多元统计分析范文第4篇

关键词:多元统计;人口研究;统计模型

中图分类号:G30-03 文献标识码:A 文章编号:1001-828X(2015)005-0000-01

随着统计学和统计软件的发展,统计分析技术被越来越多地应用于实际生活。我国作为一个人口大国,了解我国的人口状况是关系国计民生的一项重大工作。所以,研究多元统计分析技术在人口研究中的应用有着深远的意义。

一、应用于人口研究的多元统计方法

作为一门专业课程,多元统计分析提出了大量的统计方法。如多元线性回归分析、logistic回归分析以及因子分析和聚类分析等。

1.多元线性回归分析在人口研究中的应用

多元线性回归模型主要用于研究一种变量受多种因素影响时的状况。而在人口研究中,多元线性回归模型主要用于人口老龄化以及城乡收入水平的影响因素等问题。例如利用多元线性回归模型研究人口老龄化问题的分析步骤如下:

(1)通过分析与人口老龄化有关的变量,我们确定人均国内生产总值、养老保险人数,失业人口人数、人口密度和政府医疗支出作为老龄化问题的影响因素(依次用X1、X2、X3、X4、X5来表示),并通过抽样调查或查阅年鉴的方法获得回归分析所需的数据,采用多元线性回归的方法进行定量分析。

(2)建立多元线性回归模型:Y=A+b1X1+b2X2+b3X3+b4X4+b5X5+e.其中b1、b2、b3、b4、b5为回归系数,A为常数项,e为残差。利用SPSS进行逐步法分析确定系数及常数项。

(3)对各变量进行显著性检验,确定模型并结合实际意义进行分析。

2.logistic回归分析在人口研究中的应用

logistic回归分析的用途主要包括三个:一是寻找特殊因素因素;二是预测;三是判别,例如预测某一个体属于某一情形的概率。logistic回归分析在人口研究中主要用于人口预测。

3.因子分析和聚类分析在人口研究中的应用

因子分析是指从影响研究变量的众多影响因子中提取出公共因子的统计方法。因子分析能够将具有相同本质的影响因子归入同一个公共因子,从而减少研究变量的数目。聚类分析则根据研究对象的特征,对研究对象进行分类,从而达到减少研究对象的目的。因子分析和聚类分析主要用于研究人口迁移影响因素、人口发展水平等问题。

二、多元统计分析技术在人口研究中的应用现状

在20世纪80年代,我国的人口研究中很少使用多元统计分析技术。进入90年代后,随着各种多元统计分析方法的引入和统计分析软件的使用,统计分析技术在人口研究中得到了广泛的应用。多元统计分析技术能够定量分析经济因素、社会因素和人口因素之间的关系,从而更好地解释人口现象。

1.我国人口研究中多元统计分析的特点

我国人口研究问题中多元统计分析技术的应用呈现出多样化的特点,主要表现在统计方法的多样性和统计分析内容的多样性。前面提到的多元线性回归方法、logistic回归分析方法以及聚类分析等多元统计分析方法在我国人口研究中都有应用。统计分析内容更是涉及生殖健康、居住类型以及人均收入水平等生活的各个方面。

2.我国人口研究中多元统计分析数据特点

我国在人口研究中的多元统计分析数据主要来源于抽样调查和典型调查等,统计分析的单位主要是以个人和家庭等个体单位为主。在数据类型方面,我国人口问题研究中的多元分析数据以横截面数据为主,时间序列数据极少用到。

三、我国人口研究中多元统计分析技术存在的主要问题

由于多元统计分析技术在我国人口研究中的应用时间比较短,很多人口研究人员对多元统计分析技术也没有经过系统的学习,在实际应用中难免会出现一些问题。

1.人口研究中多元统计分析方法使用错误

统计方法主要由研究目的和研究数据决定。但在实际应用中,由于研究人员难以正确区分各个统计方法,从而出现随意选择的现象。通过查阅用多元统计方法研究人口问题的相关文献我们发现,在进行人口问题研究时使用最多的就是多元线性回归模型。虽然多元线性回归模型具有易于理解和分析简便的特点,但它主要是研究一个目标受多个因素影响时的情形。很多文献没有注意到这个问题,从而错误地使用了该方法。

2.多元统计分析中缺乏评价和检验

评价和检验是多元统计分析的一个重要内容,因为很多统计方法只有结合实际,才能更好地确定自己的模型建立是否恰当,才能更好地解释模型中各个变量的实际意义。但在人口研究的实际应用中,很多研究人员只是注重对统计结果的分析,而忽略了模型的检验和评价。

对模型的评价主要是指模型对观测数据的拟合程度,每一种多元统计方法都有相应的模型评价方法和指标。对模型的检验主要是指显著性检验,从而判断该模型中各变量之间的关系是否存在。因此,模型评价和检验是多元统计分析不可分割的一部分,读者也只有通过这些内容才能更好地理解人口研究报告中所描述的现象。然而通过统计可以发现,很多有关人口研究的统计报告都缺乏模型评价和检验者方面的内容。

四、结束语

多元统计分析中的很多方法都适用于人口研究。近年来,随着统计学科和计算机技术的发展,多元统计分析技术在人口研究中也得到了广泛的应用。我国人口研究对多元统计分析技术的应用呈现出多样化的特点,多元统计分析的数据来源以抽样调查和横截面数据为主。但由于我国人口研究中多元统计分析技术的引入比较晚,在实际应用中仍存在较多的问题需要改善。

参考文献:

[1]刘金塘,伍小兰.多元统计分析技术在人口研究中的应用[J].人口研究,2005,26(2):1-6.

[2]柳德江,陈红,唐红燕.基于Logistic模型的玉溪市未来人口预测[J].玉溪师范学院学报,2012(8):51-54.

多元统计分析范文第5篇

医用多元统计分析属于应用性的方法学科,课程性质要求学生在学习多元统计方法之后,要具备将各种多元统计分析方法应用到医疗卫生领域数据中的能力。培养学生的实践能力,仅从理论授课上下功夫提高学生实践能力是远远不够的,必须在理论授课、实验教学和课程考核等各个教学环节中都不脱离实践能力培养的主线。在理论课上讲授的内容一般包括原理方面的知识和如何分析实际数据两个方面。提高学生实践能力要求教学过程中淡化数学原理方面的知识,而将重点放置在如何分析实际数据上,即该多元统计分析方法使用的前提条件是什么,如何使用该方法以及分析结果如何解读,在具体研究的医学问题中此结果具有什么样的意义。尽管在现代教学方法中有体验式教学的渗入,但相对于实验课的实际体验来讲,学生对于数据何时采用、如何采用某种多元统计分析方法,还是保持在似乎知道,但又不完全明确的模糊阶段。很多原理方面的知识,尽管不是重点,但也需要学生了解一下,才能有助于把握整体脉络、合理应用,通过实验课的亲身体验,能直观观察到相对模糊的原理知识得到验证的过程,从而心服口服地从心底接受没有经过手工计算而呈现的分析结果。并且多元统计分析的实验课本身就是让学生去体验各多元统计分析方法怎样应用于实际数据的过程,从而使学生实践能力大大提高。一般课程考试比较侧重理论原理的考核,而医用多元统计分析授课的目的就是给学生讲授多元统计方法应用于医药卫生领域数据的实践过程,学习课程之后学生必须具备这种实践能力,否则就根本没有实现开设这门课程的初衷,没有达到教学目的。因此,课程考试也应侧重在学生实践能力的考核上。课程考核一般有试卷考核、平时实验成绩和上机考核三种形式,而以试卷考核的形式居多。对于医用多元统计分析课程,平时实验成绩考核和上机考核也应该是必须选择的考核形式,除此以外,在试卷考核中也可通过适当的题型体现对学生实践能力的考查。比如,将多元数据分析的结果展示在试卷上,让学生回答此分析结果对于研究目的反映出什么;或者指出研究目的,让学生回答选用何种多元统计分析方法,为何选用这种方法;或者从展现的结果让学生判断是否适用某种多元统计分析方法等多种题型来考查学生的实践能力。通过考核反馈出实践能力欠缺的部分,从而给予相应的应对措施。

2通过教学软件提高教学效率多元统计分析

建模一般都要经过逆矩阵、相关系数矩阵的计算,求解特征根与特征向量等过程,这些过程没有扎实的数学功底是根本不可能完成的。即便能完成这些运算,但也是相当耗时的过程。就运算相对简单的多元统计分析方法而言,如果采用人工计算器计算的话,也需要大约五个学时的时间才能完成,复杂的多元统计方法需要学时数就更多了。假定学校能够安排充分的学时数,学生也必须有足够的能力和耐心去完成这些运算。可见,统计软件和多元统计分析方法教学的结合是非常必要的。目前,常用的统计分析软件有SAS、SPSS和STATA。对于医学专业本科生和研究生的统计分析要求来讲,简单掌握每个软件基本功能就可以满足数据分析的需求,但对统计学专业的研究生而言,一般需要用到可编写程序的SAS软件,并且要深入学习,进行数据的模型拟合分析。各医学院校可根据自己的办学条件、师资力量、教材的情况、授课对象等因素综合考虑本院校采用医用多元统计分析的软件。借助软件在很短的时间能完成模型的建立、模型拟合检验等分析过程,通过分析结果中呈现的模型建立中间步骤,了解矩阵运算,求解特征根与特征向量的信息,把握前因后果、各步骤间的相互关系,大量时间的节余可用在多元统计分析方法的专业应用上。

3通过适宜教材激发学习兴趣多元统计分析

原理部分的繁琐复杂性对该课程的学习形成很大阻碍,且原理部分又不是医学专业学生学习的重点,这提示了教材选择的重要性。合适的教材不应该花费很大的篇幅在理论推导和模型建立的过程上,否则只会增加学生对该课程的畏惧心理。教材应当侧重于多元统计方法的应用部分,应用部分和学生专业的相关性越强,就越容易激发学生学习兴趣。上文中提到学习医用多元统计分析教学要结合统计分析软件,因此,教材中最好在每个多元统计方法的介绍之后都安排一个章节,说明这种多元统计方法通过统计分析软件如何实现,以及软件运行结果如何解读。医学各专业学生一般都未经过系统的统计软件的学习,因此,教材中软件相关内容的安排就尤其重要,不仅要有这样的章节,而且要通俗易懂,适合医学专业学生的初次统计软件学习,在每一种多元分析方法数据集的录入、软件实现的步骤、一些常用选择项的介绍、软件运行结果的每个部分的解读以及结合专业知识后的结论等各个方面都要有详尽的解释。医学可以划分成很多不同的专业,如公共卫生、医药和临床专业等,就公共卫生专业又可以进一步详细划分成劳动卫生、儿少卫生和营养等专业。目前的医用多元统计分析教材没有具体针对各个专业的多元统计分析教材,能选择到和医学专业接近的教材充其量也就是医用多元分析的教材了,因此,通过教材提高学习的积极性还是存在一定的局限性,但这种局限可以通过案例教学来弥补。在授课过程中,授课教师可能通过案例式教学,选择和授课学生专业休戚相关的例子来进行讲解,就格外能吸引学生的注意力。

4通过教学设计引导学生主动学习多媒体技术

在教学中的应用极大优化了教学过程。随着多媒体技术的发展,教学过程中“传统的PPT教学”逐渐形成新的多媒体教学形式——微课件。微课件是指使用多媒体技术在五分钟内就一个知识点进行针对性讲解的一段视频或音频。基于教学设计,微课件可用于难点讲解、内容小结等各个环节。如在教学导入阶段,教师根据新课知识点设计新颖的问题,通过简短的视频的形式展现。微课件以视频的形式吸引学生的注意力的同时,将教学问题引入,让学生带着问题去听完一堂课,从而起到引导学生主动学习、增强听课效果的作用。布置课后作业也是一种很好的引导学生主动学习的途径。以往教学中教师一般也布置作业,但布置的作业大多是多元分析方法基本思想和原则之类的思考题。笔者在教学实践中,将课后布置作业题目设定为“收集适用本次理论课医用多元分析方法的自己专业相关数据,并预计数据分析后可能的结果”。学生在收集数据的过程中,就必须去主动思考这种多元统计分析方法的基本思想、适用原则等问题,并且会进一步产生通过软件分析此数据的欲望。在实习课上,除了教师规定的实习题目之外,学生一般都会主动完成自己专业数据的分析,和教师探讨此数据分析的结果和对专业的指导意义。

5总结

以上是笔者在多年医用多元统计分析课程教学中的几点体会,通过培养实践能力、激发学习兴趣、提高教学效率和引导学生主动学习等多种方法增强教学效果,培养学生独立分析问题、利用科学方法解决问题的能力,使其在未来的科研岗位上能很好地利用和分析医疗卫生领域的海量信息为人们的健康服务。另一方面,通过各种方式增强医用多元统计分析的教学效果,也促使授课教师自身能力素质得以全面提升,真正落实“教师为主导,学生为主体”的教育理念。

多元统计分析范文第6篇

【关键词】多元统计分析;多元线性回归;ADF检验;协整分析

随着社会经济的进步发展,学者发现利用一元回归分析已经满足不了实证分析的要求。这是因为研究问题除了受到一维变量的影响,也会受到其他因素的作用。尤其是在延长样本数据时期、增大样本容量、引入其他影响因素之后,数据内部之间的规律难以依靠一元回归挖掘出来。多元统计分析开始被广泛应用在经济、管理、农业、社会、生物等研究领域。

一、多元统计分析的发展

纵观多元统计分析的发展进程,二位正态总体的分析方法虽然出现于19世纪,但多元统计分析的正式兴起却在20世纪。20世纪30年代,费希尔、霍特林等人为多元统计分析研究奠定理论基础。进入40年代,心理、教育、生物等领域开始将多元统计分析作为研究手段分析问题。但由于计算工作量较为繁杂和时局的影响,多元统计分析并未广发应用在其他领域,得到更进一步的发展。50年代后,计算机的出现为其发展提供技术便利,相关理论也得以提出。时至今日,诸如SPSS、R、SAS、EVIEWS等多种计量软件使得多元统计分析实际应用在各学科领域。

二、多元统计分析的基本方法

1.多元回归分析

多元回归分析的基本原理与一元线性回归分析相似,只不过是自变量为两个或两个以上。通过多元回归分析,几个变量之间是否存在的特定相关关系以及是何种关系将得到验证。在实证研究中,则通常会引入控制变量,通过控制一些变量的取值,可以更好研究主要自变量影响程度,在此基础上可以进行因素分析,厘清各因素间的相互关系。

2.主成分分析

与多元线性回归法不同,主成分分析适用于更多个指标的数据处理。在建立多层次的指标体系后,将多个指标转化为保留原有数据大部分信息的几个综合指标,并利用这几个综合指标来分析。将复杂的指标数据进行压缩,变量之间不存在相关性,压缩后得到的指标要有代表性,不能损失太多原始信息,能够准确解释研究问题的内在关系。分析步骤主要包括以下几步:俗蓟处理原始数据矩阵;基于标准化数据矩阵建立标准化相关系数矩阵;计算特征根、特征向量及标准正交化特征向量;依据结果确定主成分个数;计算主成分和主成分值;计算研究样本的得分值并加以评价。

3.因子分析

与主成分分析法相似,因子分析也是对多个变量的降维处理。通过研究相关阵或协方差阵的内部关系,提取代表性的因子,以因子为新的解释变量,计算得出个样本的因子得分,并加以排序、评价分析。与主成分分析方法处理程序不同,因子分析在得到特征向量等数据后,需要确定公共因子个数,并计算因子载荷矩阵和各样本的因子得分、总因子得分。

4.聚类分析

聚类分析也是实证分析当中常用的一种研究方法。它是将数据按照一定的标准将以分类,同类别下的数据之间差异比较下,不同类别之间的数据则有较大的差异。具体的分析方法包括层次聚类法、非层次聚类法、智能聚类法等。

三、多元回归分析的应用

本文选择多元线性回归法加以实际应用。本文采用时间序列方法分析安徽省R&D投入与经济增长之间的关系。安徽省GDP绝对值取自2001-2015年的《中国统计年鉴》,R&D经费与R&D人员都则取自中国科技统计网站的中国科技统计数据(2001-2015年)。为了消除异方差的影响,将三变量对数化处理。同时,对数化的数据也能够反映变量之间的弹性系数,不改变变量之间的协整关系。GERD代表R&D投入经费,GRP代表R&D人员,GDP代表经济增长。

1.单位根检验

通过EVIEWS6.0软件估计,结果显示,原序列lnGDP、lnGERD、lnGRP是非平稳时间序列。对三者进行一阶差分后,D(lnGDP)、D(lnGRP)、D(lnGERD)通过ADF检验,拒绝原假设,即差分后的序列是平稳的。因此,lnGDP、lnGRP、 lnGERD是一阶单整的。

2.协整分析

由ADF检验可知,lnGDP、lnGRP、lnGERD符合协整分析的条件。本文采用回归残差的协整检验方法。检验结果显示,残差序列在1%的显著性水平下拒绝原假设,可以确定残差序列是平稳的,变量之间存在长期协整关系。

3.回归分析

回归方程结果为:lnGDP = 7.6579lnGERD + 0.3510 lnGRP +C。模型可决系数为0.8767,接近于1,且F值也通过显著性检验,说明回归方程的拟合效果较好且变量之间的线性关系显著。

参考文献:

[1]左瑞琼.多元统计分析方法介绍及在经济中的应用[J].时代经贸,2007(9):27-28.

[2]乌冉.多元统计分析介绍及其在一些方面的应用[J].百科论丛,2010(4):349-350.

[3]姜波.多元统计分析方法在实际问题中的应用[J].沈阳师范大学学报(自然科学版),2012(4):465-467.

[4] 杨锦忠,宋希云.多元统计分析及其在烟草学中的应用[J].中国烟草学报, 2014(5):134-137.

多元统计分析范文第7篇

关键词:应用技术型;多元统计分析;课程实践教学

中图分类号:G4

文献标识码:A

doi:10.19311/ki.16723198.2017.05.071

0引言

多元统计分析是从经典统计学中发展起来的一个分支,是一种综合分析方法,它能够在多个对象和多个指标互相关联的情况下分析它们的统计规律,很适合自然科学和社会科学的特点。主要内容包括多元正态分布及其抽样分布、多元正态总体的均值向量和协方差阵的假设检验、多元方差分析、直线回归与相关、多元线性回归与相关(Ⅰ)和(Ⅱ)、主成分分析与因子分析、判别分析与聚类分析、Shannon信息量及其应用。

多元统计分析是一门研究多指标随机现象统计规律的统计学科,随着计算机的普遍应用和软件的迅猛发展以及大数据时代的来临,使得自然科学和社会科学的各个领域都广泛的用到多元统计分析方法,比如在经济、金融保险、生物医学、环境数据、管理工程等相关领域。尤其是多元分析方法在处理多维数据时,它必不可少的分析工具。作为统计学的主要分支,多元统计分析方法正在向人类生活和生产的每一个角落渗透,其分析理论也在实际应用中逐步的完善和发展。多元统计分析也可以对国家的宏观经济形势进行深入分析,并以直观的方式进行宏观经济建模,为经济决策提供了理论支持。

所以,作为讲授多元统计分析这门课程的老师,扮演着相当重要的角色,那就是如何引导学生学习和掌握这门课程,为学生进入理论研究部门和实际应用部门打下夯实的基础。培养应用型统计学人才,应当是既能够胜任企事业和行政职能部门的统计人才,又是能从事市场调查与分析、经济统计与预测的经济人才。于是本了如下的践与探索。

1《多元统计分析》课程实践教学现状

1.1数理统计学基础知识不足

《多元统计分析》是运用数理统计学的方法来研究多指标随机现象统计规律的一门统计学科。它是一元统计分析在维度上的推广。同时,《多元统计分析》也是数理统计学的一个重要分支。所以数理统计学基础是至关重要的,而数理统计学基础偏理论一些,不会有太多的应用题,抽象的概念很多,之所以感觉抽象是因为忽略了定义的来源和下定义的出发点,这样就很难理解抽象的概念,运用就更谈不上了;很多同学在学习过程中不注重各种定理的来源和证明,其实这些定理的证明过程也是必须要理解并能掌握其证明方法的。整个几门数理统计学基础课程线性代数基础、矩阵论、概率论与数理统计基础知识的不牢固,更何谈融会贯通了,而多元统计分析这门课程是建立在有一定数理统计学基础上的,尤其是概率论与数理统计方面的基础知识,因为教材中都是一些联系很紧凑的理论,而且有些推证简化了过程的证明和计算,如果没有一些数理统计学基础,就不知道定理结论的来源,这样只能是死记结论,导致不能很好的应用所学知识,如果没有这些就不能更好的掌握多元统计分析的理论与方法,也不能更好的理解多元统计分析中的基本概念。

1.2重传统的数理逻辑的推证,轻统计思想的讲解

我们在整个实施教学过程中,经常使用的教学方式是强化传统的数理逻辑的推证,简化对统计方法适用性的变别能力以及利用这些方法分析经济数据能力的练习,这是老师们在讲授多元统计分析这门课程时经常会忽略的问题。学习多元统计分析的最终目的是要应用于现实,分析和解决现实问题。老师在讲授这门课程时往往侧重在数理方法的推导上,这也导致很多同学把重点放在反复推敲理解这些证明过程上,而对于分析方法和公式在现实中的应用并不重视。因此学生只是被动性学习,没有主动去探索问题,最终也不知道如何使用统计分析方法。

课程教学方法还是照搬我国传统的理科教学方法,即“重点知识+例子说明+技巧解题”,这种固定的教学过程,看似完成了教学任务,但是学生的学习效果不能得到保证,这些技巧大多情况是学过之后很快就会忘记,所以我们也可以感觉到,当前多元统计分析在教学中存在一些问题,我们只是一味的强调怎样运用技巧解题,不去教学生如何用方法处理实际问题,这样的教学失误只注重理论上的教与学,既缺乏探究性和开创性,又缺乏实际运用训练。很多学生反映总是有种学到的不能用到实处的感觉,学习也是为了应付考试,所以这种传统的教学方式难以培养应用技术型统计学人才,与其他先进的学科教育相比缺乏生动性与普遍性。

1.3案例教学中存在的问题

案例教学法的采用给多元统计分析学科的教学实践带来很多好处,然而,如果运用不适当,其好处和作用就不能真正体现出来。但是如果忽略理论知识的学习,只是重视案例的学习,此类主要体现在学生身上。例如在教学实践中老师们经常会遇到学生建议少讲理论知识,多增加案例分析的情况。在学生们看来,理论性的概念和统计原理太单调乏味,然而忽视理论知识的学习,没有牢固的基础,不能积极参与到具体案例分析的讨论中来,听而不思考,思维过程就难免具有依赖性,即被动的接受学习,这类学生普遍缺乏体验性学习和研究性学习。而且,目前大多数高校统计学科教师在案例教学中所采用的案例素材也有不少问题,主要体现在以下几个方面:第一,不能很好地结合教学目的选择案例。任何学科案例教学所使用的案例都应该服务于教学目的,若是不能明确案例教学要解决的是统计领域内什么层次的问题,要提高的是学生哪方面的能力水平,案例教学就无法达到预计的效果。第二,教学实践中使用的案例时效性较差。没有结合社会经济的热点问题开展案例教学,难以被学生理解、接受和认可。在这种传统教学案例中,我们只看到知识的积淀而感觉不到对求索的追求;只看到记忆与理解而感觉不到质疑与批判;只看到“学会”的成果而感觉不到“会学”的收获、“乐学”的体验。

2应用技术型统计学人才培养中《多元统计分析》课程实践教学的创新研究

我们要以统计学思想的培养以及统计学方法在经济管理领域中的应用作为本R到萄У幕本目标,推动教学方法的改革。我们经过自己的教学实践与思考指出了多元统计分析学科教学中存在的问题,并就改进多元统计分析学科教学提出了若干建议。

2.1以我国经济真实数据编写案例,结合社会热点开展案例教学

在进行案例教学的过程中,多元统计分析要注意以我国现行经济运行中的真实数据为素材编写案例,并结合社会经济的热点问题开展案例教学。比如“以我国2013年-2015年的社会消费品零售总额的真实数据为样本建立统计预测模型,并利用该模型对2015年-2017年进行社会消费品零售总额的预测分析”;“以我国2013年1季度至2016年4季度的GDP季度真实数据,建立统计预测模型,估计与检验,然后预测2017年1季度至4季度的GDP。”如果我们准备这样的案例进行教学,就能使学生对所学的东西感兴趣、有好奇心和探究欲。

作为一种综合分析方法,多元统计分析只能作为一种定量和定性分析的工具,对案例进行深刻剖析。在案例教学实施中,应当以学生为主体,教师处于主导地位。任课老师需要及时掌握案例教学的进度,把握住同学们课堂讨论的内容和方向。案例教学法有利于激发学生学习的积极性和主动性,我们学习多元统计分析这门课程就是要学会处理数据并能进行定量分析,如统计预测法、核算的方法、指数模型方法、经济计量方法等,因此,在教学实践中任课教师需充分利用案例法开展教学活动,注重对学生们进行统计方法适用性的识别能力以及利用这些方法分析数量经济数据能力的训练。而在选取教学案例方面则应该注意把握选取案例的目的性、时效性和实用性,即要使所选取的案例既符合理论知识一致,服务于教学目的,又能紧跟当前社会经济发展,同时还一定要选择教师自己能够把握,学生便于理解、掌握和认可的案例。

2.2积极开展实验教学,将理论教学与实验教学相结合

实验教学是多元统计分析课程教学中必不可少的环节。学生通过亲自操作,能够加强对各统计分析方法的理解,并从中探索出一些新问题。然而,在教学过程中也出现了一些新问题。具体的来说,理论教学和实验教学有些脱离,理论教学的原理及其步骤的推导与实验基本脱节,使学生感到理论推证的没必要,实验教学中,使用统计MATLAB软件、SPSS软件、SAS软件、R软件等的缺点是只求结果不论原因和运行环境,理论的学习得不到实践环节的练习和巩固,使学生难以琢磨,就像“雾里看花”,这样实质上没有达到课程教学真正的要求。作为一套可以提供一些集成的统计工具,统计软件更重要的是它可以提供各种数学计算、统计计算的函数,并使使用者能灵活机动的进行数据分析,甚至还可以创造出符合需要的新的统计计算方法。例如MATLAB软件就是借助软件的统计工具箱中计算的函数完成,在实验教学过程中,我们强调训练对实验结果详细的统计分析能力,要学生根据所学的多元统计分析方法的理论步骤,分步骤编程独立完成。这样不仅使学生确实掌握各个多元统计分析方法的基本原理与步骤,而且也有针对性的使学生学习了MATLAB软件中相关基本的操作方法,真正地做到掌握该软件,在实验环节又一次巩固了学生对理论问题的学习,在实验完成后要求同学根据自己的亲自体验写实验报告。这样在每次实验中,大多数学生在实验中都有收获而且会有更深刻的思考,从而达到了教学目的。

2.3拓宽学生视野,加强师资建设

除了从实践中寻求帮助外,还应尽可能给学生们提供与统计学专业相关的、教师交流的机会和平台,使学生们切身感受到学习多元统计分析的重要性,从而调动学生学习统计学的积极性;适当吸纳优秀学生加入到教师的相关科研活动中,充分挖掘学生学习和研究的潜力,这样不仅注重了学生的“学”,同时还让学生体会到学习不仅是学的过程还是一个探究的过程,这样不仅优化了教学质量,还能取得更佳的教学效果。与此同时,统计学教师要保证有充分的时间去学习和掌握经济统计领域相关的实务操作,因此学校可适当安排教师分批去企业培训和锻炼,以此提高教师自身在统计实务方面的处理能力,增强教师的实践经验;有条件的学生还可以定期组织部分教师外出培训学习,提高教师在统计实践方面的水平,鼓励专业教师积极参加统计专业相关的技术资格考试以取得相应资格证书,达到“双师型”教师的要求;聘请国内高校相关专业知名教授做学校的兼职教授来指导青年教师,通过与本专业知名专家学者的亲身交流和学习提高青年教师的专业理论水平和实践教学水平;在教学实践方面,学校可以充分调动各方资源,如聘请公司、企事业、地方统计部门等实践能力强的专家或青年教师担任学生专业实践的指导教师,开阔学生们的眼界,帮助提升统计学课程实践教学的质量。

2.4在教学中融入数学建模思想

数学建模方法侧重于对实际问题的处理,在实际问题中庞大的信息数据量往往在对数据的处理和分析上提出更高的要求,要从表面上看起来杂乱无章的数据中发现和提炼出有规律性的结论,必须要掌握必要的统计分析工具,一些具有实际意义的数学建模实例,成为多元统计学分析应用的经典材料,这正是多元统计分析的“用武之地”,用多元统计分析方法解决了实际问题,这也正是多元统计分析解决了数学建模问题,即所谓融入数学建模思想,也提高了学生处理实际问题的能力。在讲授多元统计学分析课程中融入数学建模思想与方法,结合元统计学分析中基本概念、公式、统计理理以及分析方法的教学,鼓励学生积极运用统计软件和工具,对现实生活和产生的真实现象和数据等信息加以整合、归纳,经过演绎、求解以及推断,从统计学专业角度给出分析与预测,再经过翻译和解释,返回到实际生活中,用实践来检验这些数据的准确性。通过“实践―理论―再实践”的循环,让学生采用数学建模的理论与方法在平常的学习中掌握多元统计分析。

3结束语

通过《多元统计分析》课程实践教学的创新研究,一方面,可以理清今后统计类专业建设的方向,即以培养学生综合运用统计理论知识和方法解决实际问题的综合能力和实践能力,作为统计人才培养改革与专业建设的导向。另一方面,通过对统计类专业实践教学创新模式的探索,可以使该专业的课程实验、毕业设计、生产实习等与统计实际工作联系较密切的环节既按照教学要求实施,又能有针对性地增强教学效果,这对提高该专业的实践教学质量具有关键的教学研究意义。更重要的是,对实践教学创新的探索,能够充分体现该专业产学研结合的统计人才培养特色,进一步推动该专业教育教学改革和发展,也更加拉近该专业学生与经济管理部门、相关企业的距离,进一步消除学生对统计工作的陌生感,缩短毕业生进入统计工作岗位的适应期,这对扩大毕业生就业面,增强毕业生就业能力,提高该专业以及学校的社会知名度,也具有现实意义。此外,统计学是作为我校学科整体布局中的一个重要组成部分,构建培养技术应用型人才的统计学专业实践教学体系,将推动统计学专业的教学模式改革,也将给其他学科专业的教学改革以一定的示范和启发。

参考文献

[1]高惠璇.应用多元统计分析[M].北京:北京大学出版社,2005.

[2]王静敏.多元统计课程的创新改革研究[J].统计教育,2007,(10):2425.

[3]丁立旺,黄娟.对财经类专业概率论与数理统计课程的教学反思[J].当代教育理论与实践,2015,7(4):4648.

[4]解锋昌,李强.农业院校《多元统计分析》教学探讨[J].教学研究与课程改革,2005,(6):2829.

多元统计分析范文第8篇

【关键词】SPSS软件 多元统计分析 实验

【中图分类号】G30-03 【文献标识码】A 【文章编号】1674-4810(2012)21-0093-01

一 前言

“概率论与数理统计”是大学数学本科阶段课程设置中的一门课程,主要讲述一元随机变量的统计规律,但在社会生活及自然现象中,有很多现象需要同时观察多项指标,如研究一个地区经济发展的情况,就需要考虑当地的物价、信贷、税收、总产值、利润、固定资产、流动资金等,每一项指标都可看成一随机变量,如果只对某一项指标进行研究,结果可能是不准确的,因为各个指标之间是有联系的,可能存在相关性,单独分析某一个变量,可能丢失部分固有的信息,因而需要对多个指标(变量)进行整体研究,以发现其内部规律,“多元统计分析”就是研究多个变量相互关系及内在统计规律的一门学科,它起源于1928年Wishart发表的论文《多元正态总体样本协差阵的精确分布》,20世纪40年代,在心理、教育方面有一定的应用,但由于其计算量太大,发展受到一定的制约,到了20世纪50年代,由于电子计算机的发展,“多元统计分析”的方法才在社会各行各业得到迅猛发展,目前其研究工作已取得显著成绩,作为数学专业的学生,掌握该门课程的理论及实验(软件的应用)显得非常必要,但怎样使理论和实验教学并举呢,我们有必要对此问题做进一步的探讨。

二 Spss软件简介

Spss是Statistical Package for the social sciences的缩写,意思是社会统计软件包,是世界上最早的统计软件,由美国斯坦福大学三位研究生研制。如今,Spss已在银行、证劵、保险、教育教学、科研市场调查研究、商业、医疗、通讯等多个领域得到广泛的应用,更为有趣的是,在国际学术交流中,有不成文的规定,凡是用Spss软件做出的计算结果,可以不必说明算法,由此可见其影响和信誉都是非常高的。Spss的基本功能和特点是数据管理、统计分析、图表分析、输出管理等。另外,Spss还具有操作界面友好,输出结果美观且清晰直观的特点。

三 多元统计中Spss软件的辅助作用

1.实验设备

一般情况下,Spss运算的数据量非常庞大,因此对用户的计算机操作系统、CPU、内存、显卡、磁盘空间等做了最基本的要求,例如:操作系统要求为Windows98或者WindowsXP(2003)等;CPU要求为Premium 133MHz;内存要求为128MB……

2.教学内容和实验的安排

在本科低年级,学生已经掌握计算机基础及数据库技术,因此对Spss的教学以自学为主,讲解为辅,提供网上教学网址,督促学生在一段时间内必须自学的内容,辅以作业进行自学效果的测试,作业形式与多元统计分析的教学内容一致。因而,我们只需要掌握多元统计分析的基本原理、方法,了解其计算过程,应用Spss,就可以节省计算所花费的大量时间,把更多的时间、精力用于统计原理的学习和研究。

四 实验

在研究具体问题时,面临的是一些杂乱无章的情景或杂乱无章的数据,我们的任务是从这些杂乱无章的数据中发现规律。首先是对杂乱无章的情景进行资料量化处理,如对学习的态度是端正或不端正,要使其量化才能用统计软件进行分析,因此需要对资料进行编码。当资料实现量化后,就可以在Spss中录入数据,进行计算了。

在教学过程中,提供一个实际问题,如研究影响学生学习成绩的主要因素是什么?要求学生自己设计问卷调查,这样学生就必须学会查阅资料,进行实验设计,然后还需要认真思考,具体地去实施,得到实验结果所需要的数据,再整理这些资料、数据。录入Spss进行计算,看懂分析结果,得到答案,形成自己的研究报告。

通过合理安排实验与理论教学,学以致用,教学目的也就达到了。

参考文献

[1]张立军、任华英.多元统计分析实验[M].北京:中国统计出版社,2009

[2]于秀林、任雪松.多元统计分析[M].北京:中国统计出版社,1999

[3]刘宝权、席仲恩.Spss在英语试卷统计分析中的应用[J].外语电化教学,2004(2)

[4]魏连昌.试用统计软件Spss进行试卷分析[J].吉林师范大学学报,(自然科学版),2005(5)

多元统计分析范文第9篇

随着我国经济建设的迅速发展,针对企业经济效益评价日益需求多元化,如何科学利用多元化分析企业经济质量效益以及应用多元统计分析开展企业经济效益评估是本文重点研究对象。本文先从企业经济效益评价指标体系进行分析,提出利用多元统计分析开展企业经济效益评价,使企业经济效益评价体系更加完善和健全。

【关键词】

多元化统计分析;企业经济效益体系;应用

企业经济效益评价是政府加强经济宏观调控、改善企业经营管理和企业自我评价所建立的一个经济效益评价体系。它主要是反应企业在生产经营质量的一个宏观分析。而且企业经济效益受企业中的人力、物力、财力等内在因素以及市场条件、市场状况以及市场消费等外部因素共同的影响。本文根据企业经营活动进行全方位、多角度以及科学、合理、客观地进行分析和评价。

一、多元化统计分析介绍

多元化统计分析是一种综合分析处理方法,它是数理统计学中的一个重要的分支学科。它是直接将经济指标的数据通过数学或统计方法处理后获得权数的方法,主要有变异系数法、熵值法、主成分分析法、因子分析法等。当总体的分布是多元概率分布时,就可以利用多元化统计对其进行数理统计和分析。通过运用多元化统计分析对企业经济效益评价能够更加科学、客观的反映出企业经营活动的概率,进而为企业的长期运营提出新的发展途径。

二、企业经济效益评价指标体系

企业经济效益活动指标体系是指在企业运营过程中由多个相互关联的经济活动所反映出的经济效益指标进而构成的有机整体。目前,企业经济效益评价指标体系主要包括:销售利润率、总资产报酬率、资本收益率、资本保值增值率、资产负债率、流动比率(或速动比率)、应收账款周转率、存货周转率、社会贡献率、社会积累率等10项指标。建立一套完整的经济效益评价指标体系其主要目的在于使企业的领导层对企业的经济效益进行正确的评估和分析从而获得更多的价值信息。如何正确评价和考量企业经济效益水平,是我国经济界和学术界所进行的长期探索,目前由于我国企业经济效益评价体系面临着重重困难和局限性,致使经济指标不能正确分析和如期完成,使得企业经济效益面临着严峻的挑战。至此,为了全面提升企业经济效益,本文通过多元化统计分析在企业经济效益中发挥的积极作用作出以下探讨。

三、多元化统计分析在企业经济效益评价中的应用

由于企业经济效益的方法多种多样,为使企业经济效益能够有进一面的提升因此需要考虑的影响因素有很多,为全面的反应出企业的经营状况需要我们设计出多方位的经济指标。本文通过利用多元统计分析法中的因子分析法、主成分分析法以及聚类分析在企业经济效益评价中的应用,使企业经济效益评价有着全方面、多方位的认识。

1.因子分析法。因子分析法是根据研究对象的彼此相关程度分成变量分组,进而使得同组之间内变量的相关系数保持较高,而分组后的变量之间不再相关或者相关系数很低,每组变量就代表着一个基础结构,也就是公共因子。利用因子分析法的优势在于它能从大量的现象数据中,抽出潜在的公共因子。通过对这些公共因子进行分析,而得出全体数据所具有的结构,惟以数据作为实态来表述研究目标的调查手段提供理论依据。例如:在对企业经济效益进行测度时,由于多个指标之间可能会因为彼此之间存在联系而增加分析的复杂性,这时我们可以利用因子分析法对指标集进行降维处理,减少分析指标的数量,从而对企业经济效益测度分析更加简单明了化。因子分析法在企业经济效益中广泛的应用,已经逐渐的形成一种独特的多指标评价技术。

2.主成分分析法。主成分分析法是一种数学变换的方法,它和因子分析法有着明显的区别。主成分分析法的主要优势是①它能消除评价指标之间的相关影响;因为当主成分因子对原指标变量进行变换后,便形成了彼此互不相关的主成分。②可以减少指标选择的工作量;与其他评价方法而言,是很难消除评价指标之间的相互关联的,因此造成选择指标时浪费很多的时间,而通过主成分分析就易于选择;③在评级较多的指标时,通过主成分分析中各主分析按大小顺序进行选择,在分析问题时就可以利用前后差距较大的几个主成分进行分析,进而减少了很多工作量。例如:在评价企业资产运营状况的时候,由于要使用的各项财务指标很多,因此就可以利用主成分分析列为企业生产运营指标、资金消耗指标和资源利用指标进而分析出企业运营状况和运行动态。

3.聚类分析。所谓聚类分析就是数据聚集到不同的类或者分为一簇这样的过程,它与分类明显的不同就是在于聚类划分的类是不可知的。它主要是通过元素之间有着相似度进行集合分成一簇,然后继而进行合并,直至元素合并到一类为止。在聚类分析在应用到企业经济效益评价中,可以对存货周转率、资产周转率、流动比率等指标进行分类分析,进而得出企业资产的经济效益结果。

四、结语

研究企业经济效益对国家、企业以及对社会的发展都有非常重要的意义和作用,对企业而言,提高企业经济效益是每个企业所追求发展的终极目标,它是一切生产力的动力,对企业的发展、经营和生存有着重大的意义。对于国家和社会而言,提高企业经济效益,不仅能推动我国的经济发展,增强国家经济实力,而且对我国社会主义的发展也有着不可忽视的作用。因此,分析企业经济效益尤为重要。通过应用多元化经济分析,对企业的生产经营状况作出更为确切的、明细的考量和评价,从而使企业对经济的纵向发展和横向发展有着全面的认识,寻找自身缺陷,并及时采取补救措施,使企业在市场经济中能够迅速脱颖而出并提高竞争实力。

参考文献:

[1]贾鹏鹏.多元统计分析在企业经济效益评价中的应用[J].企业研究,2014,14:4.

[2]黄丽丽.我国工业企业经济效益水平分析[D].中南大学,2012.

[3]王菊.多元统计方法在企业经济效益中的应用分析[J].现代商业,2013,09:176.

多元统计分析范文第10篇

关键词:spss 环境检测 多元统计分析 因子分析

中图分类号:X824 文献标识码:A 文章编号:1007—3973(2012)009—120—02

1 多元统计分析

多指标综合评价中比较难以解决的是各指标间信息的重复问题,因此因子分析法解决了这个问题,其主要是对协方差阵或相关阵的内部依赖关系的研究,并且可以使一些具有一定关系的样本或变量归结为较少的综合因子的多元统计分析方法。

2 淋溶试验常规有机指标综合评价模型

2.1 建立因子模型

根据淋溶试验结果建立因子模型,设x1代表pH值,x2代表DO,x3代表BOD,x4代表水样的COD,x5代表高锰酸盐指数,x6代表氨氮,x7代表总氮,x8代表硝酸盐氮,x9代表总磷。据此建立数据文件,相应的代表含义为它们的变量标签,对原始数据作标准化处理,得到变量间的相关矩阵如表1。

由相关系数可知:其中大部分绝对值大于0.5,说明每个变量至少与其它一个变量有较大的相关系数;pH值与氨氮、硝酸盐氮、总磷呈现负相关;高锰酸盐指数与DO、COD、BOD呈现较高的正相关;总磷与氨氮、硝酸盐氮也有较高正相关。对于一个因子模型,变量之间必须相关,如果相关很小,说明变量之间不享有共同因子。由此也可以看出,可用适当的因子模型来解释描述多个变量之间的相关关系。从相关矩阵出发,用主成分分析法求解特征向量和相应的特征值。

由于前面四个主因子提供了原始资料88.769%的信息,通过观察特征值、方差分布情况可以得知这些主因子和变量之间的相关程度较高。据主因子数确定准则,说明九项指标提供的全部信息可以用四个主因子来代表;并且为使因子模型有一个简单结构,四个主因子更能全面系统地说明变量情况,我们必须对因子载荷矩阵进行旋转,从而便于对实际背景的合理解释。

2.2 进行因子旋转

与不考虑因子旋转时得到主成分模型的初始因子载荷矩阵相比较,旋转前的公共因子对变量的解释意义不是很明确。初始因子载荷矩阵中,四个公因子对变量总氮、硝酸盐氮的说明比较模糊,有必要对其作因子旋转。

第一主因子主要由变量高锰酸盐指数、BOD、COD、DO共同表征,也即是有机综合指标,其反映有机污染指标的重要性;水体中有机阴阳离子等物质的量主要由变量氨氮、总磷、硝酸盐氮共同表征。其中硝酸盐氮是填充对地下水影响的重要因子主要是由于硝酸盐氮的载荷比较高;第三主因子由变量总氮表征,由于检测中总氮的超标比较严重,因此更加印证了对总氮的监控的重要性;第四主因子则由变量pH值表征,说明了水质的酸碱程度的影响方面。由此我们也可以知道,四个公因子充分反映了矸石淋出水样中,有机综合指标、硝酸盐氮、总氮、pH值是重要的检测因子。

2.3 求因子得分

通过比较分析,确定使用最大方差正交旋转获得合理的因子载荷,并由此计算得出公因子方差和方差贡献,最后计算得到因子得分系数(如表2)。

根据因子分析基础知识,我们知道通过系数矩阵就可以将所有的公因子表示为各个变量的线性组合,也就是所求的因子得分。如本文中第一个公因子得分就可以表示为:

其中,z1—z9 表示九个指标变量标准化后的值,其它三个公因子得分同样可以计算得到。在对所有水样进行综合评价时,就可以用因子得分来代替原来的试验数据结果,从而大大减少综合评价计算量。

3 综合评价结果

根据因子分析基础知识,我们知道通过系数矩阵就可以将所有的公因子表示为各个变量的线性组合,也就是所求的因子得分。

从综合得分结果来看:

(1)所有水样的得分都小于标准水样的得分,表明煤矸石井下填充过程中对地下水环境的有机污染程度较轻,综合评价上看基本上可以达到国家水质指标地下水Ⅲ类水质标准;

(2)粒径小的矸石对地下水的污染影响比较大,由于其粒径小,表面积就大,元素的溶出率也越大,由此引起超标现象;

(3)得到结果显示中等粒径的得分较低,影响较小;

(4)从因子分析计算过程中,我们可以明确有机综合指标、硝酸盐氮、总氮、pH值都是淋出水样的重要污染因子,这也是在实际应用时需要特别监测的主要因子。

参考文献:

[1] 赵选民,徐伟,师义民,等.数理统计[M].北京:科学出版社,2002:167—181.

[2] 梅长林,周家良.实用统计方法[M].北京:科学出版社,2002:1—145.

[3] 吴聿明.环境统计学[M].北京:中国环境科学出版社,1991:109—113,427—472.

[4] 游家兴.如何正确运用因子分析法进行综合评价[J].统计教育,2003(5):10—11.

上一篇:数据统计范文 下一篇:统计分析范文