多元统计分析论文范文

时间:2023-02-28 05:00:48

多元统计分析论文

多元统计分析论文范文第1篇

1聚类分析在证券投资中的应用

(1)定义:聚类分析是依据研究对象的特征对其进行分类、减少研究对象的数目,也叫分类分析和数值分析,是一种统计分析技术。(2)在证券投资中应用聚类分析,是基于证券投资的各种基本特点而决定的。证券投资中包含着非常多的动态的变化因素,要认真分析证券投资中各种因素的动态变化情况,找出合适的方法对这种动态情况进行把握规范处理,使投资分析更加的准确、精确。1)弥补影响股票价格波动因素的不确定性证券市场受到非常多方面的影响,具有很大的波动性和不稳定性,这种波动性也造成了证券市场极不稳定的发展状态,这些状态的好坏对证券市场投资者和小股民有着非常重要的影响。聚类分析的方法是建立在基础分析之上的,立足基础发展长远,并对股票的基本层面的因素进行量化分析,并认真分析掌握结果再应用于证券投资实践中,从股票的基本特征出发,从深层次挖掘股票的内在价值,并将这些价值发挥到最大的效用。影响证券投资市场波动的因素非常多,通过聚类分析得出的数据更加的全面科学,对于投资者来说这些数据是进行理性投资必不可少的参考依据。2)聚类分析深层次分析了与证券市场相关的行业和公司的成长性聚类分析是一种非常专业的投资分析方法,它善于利用证券投资过程中出现的各种数据来对证券所涉及的各种行业和公司进行具体的行业分析,这些数据所产生额模型是证券投资者进行证券投资必不可少的依据。而所谓成长性是一种是一个行业和一个公司发展的变化趋势,聚类分析通过各种数据总结归纳出某个行业的发展历史和未来发展趋势,并不断的进行自我检测和自我更新。并且,要在实际生活中更好的利用这种分析方法进行分析研究总结,就要有各种准确的数据来和不同成长阶段的不同参数,但是,获取这种参数比较困难,需要在证券市场实际交易和对行业和公司的不断调查研究中才能得出正确的数据。因此,再利用聚类分析法进行行业和公司分析和证券投资分析时要注重选取正确的、关键的指标进行检查,例如主营收入增长率、净利润增长率等指标,这样才有利于正确预测证券市场上股票的发展潜力。3)在实际操作中更加直观实用聚类分析是根据现代证券市场发展水平和特点发展出来的新的分析方法,这种分析方法的出现与现代的基本的投资组合理论形成了比较,突出了聚类分析方法更加贴近实际生活,更加直观、实用的特点,并且由于技术的发展,聚类分析方法在实际应用中所受到的局限较小,而且易操作,因此它的适用范围就比现资理论更加的广泛。

2主成分分析在证券投资中的应用

(1)定义:在统计分析中,主成分分析是一种分析、简化数据集的技术。主成分分析经常用减少数据集的维数,同时保持数据集的对方差贡献最大的特征。主成分分析由卡尔•皮尔逊于1901年发明,用于分析数据及建立数理模型。其方法主要是通过对协方差矩阵进行特征分解,以得出数据的主成分(即特征矢量)与它们的权值。(2)主成分分析的应用非常广泛,判别分析的分析方法就是通过对各种分类数据的研究,分析出自变量各组间存在的差异,并总结出差异性,判断哪一个自变量对组间差异的贡献是否完全,根据这些数据将自变量的转变方法进行样本归类。1)降低影响证券投资市场变动的因素之间的互相影响在证券市场中有非常多的因素在影响着证券市场的稳定,这些因素之间有着非常多的关系,相互影响、相互关联,但相互之间的影响也存在着非常多的影响。而主成分分析方法就是在对影响证券投资相互关系的因素中进行分析,并对原始数据指标变量进行认真分析,将其中重要的主成分因素概括出来,并进行转换形成相互彼此相互独立的成分,而且经过实践证明在影响证券市场投资分析中的指标间相关程度越高,主成分分析效果越好。2)通过主成分分析减少指标选择的工作量主成分分析的目的就是要通过对各种数据、因素的分析总结出相对各种因素的不同影响程度,总结总体因素中的主要影响成分,并总结出不同层次的影响因素梯度,在分析时采取逐级分析的方法,这样既可以抓住主要矛盾进行分析,也可以节省时间,并且提高分析的准确性,减少分析人员的工作量,因此,主成分分析法指标选择上的优势更加的突出。3)由主成分分析法构造回归模型更加的精确、节省时间在进行证券投资因素分析时,为了能够更加清晰准确的对模型中的相关数据进行分析,都要对各种数据进行模型处理,这样的处理方式可以提高整个证券投资分析的准确性,是模型更加易于做出结构分析、控制和进行证券市场变动的预报。

3因子分析

(1)定义:因子分析是指研究从变量群中提取共性因子的统计技术。最早由英国心理学家C.E.斯皮尔曼提出。因子分析可在许多变量中找出隐藏的具有代表性的因子。将相同本质的变量归入一个因子,可减少变量的数目,还可检验变量间关系的假设。(2)应用因子分析最主要的作用是确定证券投资组合的模型。因子分析将影响股票价格的各种因素看成是不同的变量,建立股价因子模型,利用各因子不相关性确定股票的分类,再分析股票的发展潜力的基础上确定出合适的证券投资模型。

4总结

随着经济发展的不断加快,金融证券市场的发展也达到了又一个高度。我国证券市场的发展还不完善,暴露出来的诸多经济问题必须引起政府和社会的广泛关注。证券市场研究着也要积极进行证券市场的各种理论对市场的发展做出合理的预测和控制。多元统计分析方法是近年来应用比较广泛、科学的方法,它为整个证券市场的健康发展做出了辅作用。为了证券市场能够更好发展,多元统计分析方法也要进行积极创新,为将来的发展做出贡献。

多元统计分析论文范文第2篇

多元统计分析(简称多元分析)是运用数理统计的方法来研究多变量(多指标)问题的理论和方法,它是一元统计学的推广.多元统计分析是研究多个随机变量之间相互依赖关系以及内在统计规律性的一门统计学科,是数理统计学30多年来迅速发展起来的一个分支.在计算机非常普及、各种统计分析软件不断推出的今天,多元统计分析方法已广泛地应用到社会科学和自然科学的许多领域中.绍兴文理学院数理信息学院信息与计算科学专业金融数学方向开设“应用多元统计分析”课程,作为讲授这门课程的教师,如何提高多元统计分析的教学质量,培养学生灵活运用、综合驾驭多元统计分析方法的能力,真正做到学以致用,是必须思考的问题.本文结合教学实践中的体会,做一些尝试性的探讨. 1多元统计分析课程的现状 本科院校中,除了统计专业开设多元统计分析这门课,其他的如教育学、医学、气象学、环境科学、经济学等相关专业都会开设多元统计分析课程,只是侧重的方面会有所不同.以“多元统计分析教学大纲”为关键词百度一下,几秒钟之内就可以搜出20100条相关的结果;几乎所有的教学大纲都给出了多元统计分析课程的先修课程,为高等数学、线性代数和概率论与数理统计.按照顺序打开20个相关的网页,结果发现,专门为统计学专业本科生开设的多元统计分析课程的教学大纲要求72学时,其中约20个学时用于讲授多元正态总体参数的估计和假设检验等预备知识;统计学和经济管理类通用的教学大纲要求45到54学时不等,约6学时用于讲授矩阵代数、随机向量及多元正态分布;两种大纲都包括一定的上机实验时间.可见有所取舍地讲授预备知识是可行的,而一定的实验时间是必需的.学生需要学会应用多元统计方法来处理通过不同渠道获得的数据,分析以后得出结论.但是多元统计分析课程教学模式出现了种种问题,如教学学时不足,课程理论性太强,没有实验教学内容,学生学习后实际应用能力弱等等.如何提高教学效果是多元统计分析课程教学面临的一个重要问题.对于学生来说,掌握统计方法不仅要理论上弄明白,更重要的在于能够正确有效地应用这些方法,分析说明实际问题. 2多元统计分析课程教学的改革与实践 课程一方面连接并受制于教育目的和培养目标,它是培养目标的具体体现,是实现教育目的的基础;另一方面连接并制约着教学的形式、方法,一定的课程及其内容决定相应的教学形式和方法.〔2〕绍兴文理学院信息与计算科学金融数学方向的目标之一是培养能在金融、保险、银行、证券、政府等部门从事数据处理分析、风险评估和管理、专家理财、证券投资以及管理工作的人才.其实风险评估和管理、专家理财、证券投资以及管理工作都离不开数据处理和分析,在这些领域内所涉及的变量不是一个,而经常是多个,并且这些变量之间又存在一定的联系,多元统计分析正是讨论多元随机变量的理论和统计方法的一门课程.进一步地,为了适应实际的需要,对于多元统计分析课堂教学,必须把“教、学、用”融为一体. 2.1减少数学理论 多元统计分析涉及的都是随机向量或多个随机向量放在一起组成的随机矩阵.与一维随机变量的讨论方法类似,首先假设总体服从多元正态分布,然后讨论多元正态分布的定义、数字特征、性质以及由取自多元正态总体的样本所构造的统计量的分布等等,再就是参数估计和对参数的假设检验.但是所有这些讨论都涉及矩阵,在实际的教学过程中,甚至样本离差阵的计算也不是一二两句话就可以让学生接受的,虽然我们的学生已经学过高等代数,但是高等代数中矩阵的乘法没办法直接用到样本离差阵的计算.当总体为p下的维的随机向量,样本容量为n的时候,样本离差阵是n个p×1矩阵与1×p矩阵的乘积的和.更不必说接下去要讨论的三大分布———威沙特分布、霍特林分布和威尔克斯分布,以及统计量的分布.一元统计是多元统计的前提和基础,多元统计则是一元统计的扩展和深化.在教学中,总是从学生已有的知识出发,类比联想到新知识.〔3〕讲授多元统计的时候,可以对二者进行比较,比如威沙特分布是一元统计中χ2分布的推广,两者自由度的含义是一样的,前者的总体协方差阵对应后者的总体方差,一元样本的统计量和多元样本的统计量的分布不同,但是分布的分位点的本质是相同的. 讲授太多的理论除了容易令学生产生畏惧情绪,也为课时所不允许.在我们的培养计划里,安排给“应用多元统计分析”的时间是每周两课时,不考虑节日放假,也只有18周.在授课计划里,安排给预备知识的讲授时间只有4课时.在讲授这部分内容的时候,不可能做详细的证明,讲清楚条件和结论,让学生知道后面所构造的统计量分布的来历就足够了.2.2丰富教学手段“教人未见其趣,必不乐学”,如何使枯燥的多元统计分析知识变得容易接受,应该是每位专业教师共同追求的目标.我们的教学必须摆脱“填鸭式”、“满堂灌”的生硬做法,让学生变被动学习为主动学习.〔4〕 2.2.1增加绪论课 在讲授各种多元统计方法之前,可以先介绍该方法的起源和产生的背景.每一种多元统计分析方法的产生和发展都有着耐人寻味、引人入胜的实际背景.结合教学内容选讲相关的史料,可以激发学生的学习兴趣,同时介绍各种方法的使用条件.而在讲授完一种新的统计方法以后,可以鼓励学生与已经学过的方法进行比较,找出不同方法之间的区别和内在的联系.比如,把因子分析的基本思想、数学模型、参数估计与主成分分析的相关内容进行比较,分析两种方法在模型、参数唯一性、取舍主因子(主成分)等问题上的不同与使用环境等方面的共同之处,这样既强化了对因子分析的理解,又回顾了主成分分析的内容.而聚类分析和判别分析,这两种方法在相似性的度量工具等问题上具有共同点,但前者分类,后者归类,可在实际问题中互相配合使用. 2.2.2用案例引出方法 #p#分页标题#e# 一般的教科书,特别是数学教科书,为了内容编排上的需要,常常是以定义、例子、定理、应用,这样的顺序出现,在完整地介绍完一种方法的理论基础之后,再适当地举例说明.〔5〕但是,对于尚未入门的学生来说,用定义开始是难以理解的.多元统计分析中主成分分析、因子分析、典型相关分析、判别分析和聚类分析等方法,每一种都具有很强的实用性,所以以案例引入的教学方法,不仅需要且是可行的.比如在介绍聚类分析之前,把我国的31个省、自治区和直辖市按2003年的三次产业产值,用SPSS软件计算给出结果,分成三类,比较三个类别的三次产业产值的平均值,分别是三个产业都比较发达的地区、中等发达地区和欠发达地区.这样的结果符合实际,也令学生对方法本身产生了好奇,在这样的氛围下再介绍方法,比直接介绍方法的效果会好得多.然后再根据学生的兴趣爱好给出一个例子,进一步地,可以给出问题,如果现在知道某个城市三个产业的产值,那么它该归入哪一类呢?以此引出判别分析.这样的授课顺序可以归纳为:案例—方法—应用.不仅让学生了解方法的理论,而且学会应用,培养了学生解决实际问题的能力. 2.2.3统计软件的应用多元统计分析课程的特点之一是计算复杂、计算量大.如果不借助于计算机往往很难得到结果,当然也不可能对整个分析过程获得较全面的认识.但是,由于我们的课时有限,不可能在课堂上对统计分析软件做详细的介绍,所以在我们的培养计划中,多元统计分析的先修课程还应包括统计分析软件,SPSS软件是统计软件课程中应包含的内容.要求学生已经掌握用SPSS软件实现一元正态总体的参数估计和假设检验,以及最简单的一元线性回归. 在课堂上,教师在讲案例的计算时均通过SPSS软件实现,把每一种统计方法的计算演示给学生,解释其中的参数的设置,并利用软件输出结果进行分析.在数理信息学院统计实验室的每一台计算机上安装有正版的SPSS软件,要求学生在自由上机的时间里自行完成每一种统计方法的计算,并借助软件完成课后的作业.但是值得注意的是,软件不是万能的,它只是帮助计算而已,只要建立的数据文件符合要求,软件总是可以给出计算结果的.所以,在利用软件计算之前,必须搞清楚样本数据的结构和内在关系,选择好合理的统计方法,不能把软件看作一个“黑匣子”,一边数据进去,另一边结果出来.我们的学生毕竟是学过数学分析、高等代数、概率论和数理统计的,在不要求严格证明的情况下,应该具有接受和理解多元统计方法的能力.也只有搞清楚各种统计方法的基本原理、前提条件、适用范围和局限性以后,才能对软件的输出结果有更好的解释.一般侧重于应用的教科书里,都会给出一种统计方法的具体步骤.比如主成分分析的具体步骤是:a.将原始数据标准化;b.建立变量的相关系数阵;c.求相关系数阵的特征根和相应的特征向量;d.由累积方差贡献率确定主成分的个数,并写出主成分.〔6〕多元统计分析的计算题可以大致分成两类,一类是借助统计软件完成计算,另一类是样本容量相对较小,学生可以借助计算器完成,或者可以教师先完成一部分计算,余下部分让学生继续下去,目的是加深学生对统计方法的理解.比如,根据以上主成分分析的步骤,给出样本的相关系数阵、相关系数阵的特征值和特征向量,并要求累积贡献率达到某一值,让学生确定主成分的个数,并写出主成分.两类习题相辅相成,既让学生掌握了统计方法,日后又可以借助软件计算解决实际问题,而不至于不管实际背景,只会生搬硬套统计方法,甚至误用统计方法. 2.2.4利用多媒体授课 多元统计分析课程的数学推导和运算量很大,多维随机向量的分布函数会很长很复杂,数学推导动辄是向量或者矩阵,如果用传统的黑板和粉笔展示出来,不仅书写的时间会很长,而且对于涉及多个指标和总体的案例恐怕也难以展示.对于这些问题,利用多媒体就可以迎刃而解.但是全部课程都采用多媒体课件效果并不好,因为多媒体课件演示的速度太快,会因为学生缺乏思考的时间而达不到应有的效果.所以可以根据讲授内容的特点,把传统的黑板加粉笔的授课方式与多媒体课件有机地结合起来,以达到最佳的课堂效果.利用统计软件讲授课程时,更是离不开多媒体.再就是,当讲完一种统计方法以后,找一二篇相关的文献在课堂上集体阅读,这不仅有利于学生对方法的理解,并且从别人如何发现问题并利用多元统计分析的方法去解决问题的过程中,让学生了解所学的知识可以用于实际,激发学生学习的热情,并为期末撰写课程论文打下基础. 2.2.5考核方法 由于多元统计分析课程的特殊性,即应用性强、计算量大,学生通过这门课程的学习,不仅要掌握各种统计方法的原理,更要学会如何应用.所以学生学习该门课程的总评成绩中,平时成绩占30%,包括出勤和作业情况,期末独立撰写一篇小论文占70%.学生可以选择自己感兴趣的内容搜集数据,用适当的统计方法处理数据,通过SPSS软件计算出结果,并对软件的输出结果做出合理的解释.教师在学生选题、构思、查阅相关资料等方面予以全程指导.课程小论文的评分标准是:搜集整理数据、加工各种信息的能力占20%;利用统计软件估计模型、设定各参数、软件运行结果的表述占35%;论文结构、逻辑性、语言文字表述占15%;学习态度占10%;创意、学术水平或实用价值占10%;规范化占10%. 2.3课堂教学的延伸 课堂教学的时间有限,当一个学期结束,学生获得相应的学分以后,多元统计分析因其很强的应用性,相应的实践活动还可以继续下去.2008年9月,我组织部分学生申请了题为“绍兴文理学院大学数学成绩影响因素调查分析及教学对策探讨”的学生课题,学生们结合自己感兴趣的问题,咨询大学数学部的老师,设计了问卷,在相关专业的学生中做了抽样调查,把调查的结果整理成数据文件,然后用回归分析、主成分分析、因子分析等多元统计分析的方法对数据做了处理,利用SPSS软件完成计算,并对软件的输出结果结合实际情况进行了解释,得出相应的结论.认为学习高等数学的意愿、课前课后是否有预习和复习以及是否做好课堂笔记等因素会影响到非数学专业学生的高等数学成绩.有意思的是,由于整理问卷的学生的粗心,有部分数据不知道出自哪个专业的学生.正好把其他数据作为训练样本,对这部分的调查结果做了判别分析.参加这个课题的学生都觉得从中学到了课堂上没有的东西.这样的课题对学生来说是自己给自己出题,然后又自己根据调查得到的样本数据的特点判断用什么方法解决,完全不同于教材给出的习题.最后还把分析结果提供给大学数学部的老师,感觉真正解决了一个实际问题,很有成就感.这样的学生课题作为多元统计分析课堂教学的延伸,对学生学好这门课程以及培养学生的动手能力很有帮助.#p#分页标题#e# 3结束语 多元统计分析是本科生比较难学的课程之一,概念多、公式多,内容逻辑性强,计算量大,性质、定理的证明多借助于矩阵的运算,又是应用性很强的一门课,广泛应用于自然科学和社会科学的各个领域,对于金融数学方向的学生来说,是他们日后工作中的一个强有力的工具.在课时有限的情况下,如何上好这门课是授课老师必须面对的问题,对这门课程教学的改革与实践是我们永久的工作.

多元统计分析论文范文第3篇

Abstract: According to the university scientific research data in nearly ten years, the factor analysis and cluster analysis statistical methods in the multivariate statistical analysis are used to carry out the comprehensive evaluation analysis of the college scientific research status and put forward a method for evaluating the state of the research. Research shows that, in some colleges, the first factor is very high, indicating that these colleges in cutting-edge academic research achievements. But at the same time, the third factor is low, indicating that these colleges and enterprises to contact the lack of scientific research. In other colleges, the second factor is very high, indicating that these colleges in the per capita contribution rate, C class paper per capita contribution rate and other aspects to do better. In addition, some of the college's third factor is very high, indicating that these colleges are closely related to the enterprise's scientific research and cooperation. The results of the subsequent cluster analysis also confirmed the rationality of the conclusion of the comprehensive evaluation analysis. Through the study of this paper, it provides a theoretical basis for the scientific management system and evaluation system of scientific research achievements.

关键词: 高校;科研状况;因子分析;聚类分析;评价

Key words: colleges and universities;research status;factor analysis;cluster analysis;evaluate

中图分类号:G463 文献标识码:A 文章编号:1006-4311(2016)31-0015-04

0 引言

科研能力是衡量一所高校科教水平的重要标志。某高校作为省重点高校有着悠久的办学历史,科研水平在省内也是名列前茅,本文针对该高校20个学院的各项科研指标进行多元统计分析,建立了描述科研水平的各类变量,包括各类科研项目的经费总额、各类论文的发表数量、论著发表数量,投入科研人员数量等。但由于各学院规模不一,各学院科研性质也不尽相同,为了保证研究结果的平衡性,本文采用对科研成果人均贡献率的方式进行研究。然而进行统计分析时,并非变量收集的越多越有利,变量间信息的高度相关、高度重叠会给统计方法的应用带来许多困难,因此本文借助SPSS统计分析软件,采用因子分析方法,在众多变量中提取影响各学院科研状况的主要因子对问题进行分析,最后通过因子变量的聚类分析对评价结果进行验证。国内学者目前主要集中对我国体育事业进行科研状况分析,如贾志强、郑岩平对我国1995-2000年篮球科研状况作了分析。张金、夏秀荣对我国1994-2003年排球科研状况作了分析。在高校科研状况分析方面,孟学英、陈春华利用调查问卷方式对我国部分高职院校教师科研状况做了调查分析。同时国内对多元统计方法的应用也主要集中在医疗、经济方面,如孟莹、谢守祥等利用多元统计分析方法对江苏省经济差异化做了分析。王曦、宋剑南利用多元统计分析方法对影响中医症候的主要因素做了研究。利用多元统计分析方法结合高效科研状况评价分析还鲜有研究。本文结合多元统计分析分析方法对某高校科学地建立高校科研业绩的管理体系及评价体系提供了理论依据。

1 因子分析方法简介

因子分析是利用降维的思想,由研究原始变量相关矩阵内部的依赖关系出发,把一些具有错综复杂关系的变量归结为少数几个综合因子的一种多变量统计分析方法。因子分析的基本思想是根据相关性大小把原始变量分组,使得同组内的变量之间相关性较高,而不同组的变量之间的相关性则较低。每组变量代表一个基本结构,并用一个不可观测的综合变量表示,这个基本结构就称为公共因子。对于所研究问题的某一具体问题,原始变量可以分解成两部分之和的形式,一部分是少数几个不可测的所谓公共因子的线性函数,另一部分是与公共因子无关的特殊因子。进行因子分析的步骤如下:①根据研究问题选取原始变量。②对原始变量进行标准化并求其相关阵,分析变量之间的相关性。③求解初始公共因子及因子载荷矩阵。④因子旋转。⑤因子得分。⑥根据因子得分值进行进一步分析。

2 各学院科研状况的因子分析

2.1 数据分析和指标选取

本文选用的数据来源于某高校2006年至2015年的统计数据。设定数据中8个指标变量分别是X1:2006-2015年横向项目金额人均贡献率(万元/人);X2:2006-2015年市校级项目金额人均贡献率(万元/人);X3:2006-2015年省部级项目金额人均贡献率(万元/人);X4:2006-2015年部级项目金额人均贡献率(万元/人);X5:A类论文人均贡献率(篇/人);X6:B类论文人均贡献率(篇/人);X7:C类论文人均贡献率(篇/人);X8:论著数量人均贡献率(项/人)。数据详情见表1。

在进行数据分析前,进行KMO检验,P值为0.000,检验结果是显著的,同时KMO值达到0.577,结果见表2,表明数据之间具有一定的相关性,可进行因子分析。

从表3变量共同度表中可以看出因子分析的变量共同度均较高,表明变量中的大部分信息均被因子所提取,说明因子分析的结果是有效的。

2.2 因子提取和因子解释

现应用主成分分析法来进行因子提取和因子个数的确定,从表4中可以看出只有前三个因子特征根大于1,并且前三个因子特征值之和接近80%,故提取前三个因子基本包含了全部测评指标的绝大部分信息,因子分析效果较理想。

由于初始载荷阵结构不够清晰,不便于对因子进行解释,因此对因子载荷矩阵实行旋转,达到简化结构的目的,使各变量在某些因子上有较高载荷,而在其余因子上只有小到中等的载荷。这里采用方差最大正交旋转法进行因子旋转。结果见表5。

从旋转后的因子载荷矩阵来看,第一个主因子在省部级项目金额人均贡献率、部级项目金额人均贡献率、A类论文人均贡献率、B类论文人均贡献率上具有较高载荷,第二个主因子在C类论文人均贡献率、论著数量人均贡献率上具有较高载荷,第三个主因子在横向项目金额人均贡献率、市校级项目金额人均贡献率上具有较高载荷。

2.3 因子得分和因子变量

本文采用回归法估计因子得分系数,并输出因子得分系数矩阵见表6。

根据表6可写出以下因子得分函数:F1=-0.014横向项目金额人均贡献率-0.078市校级项目金额人均贡献率+0.263省部级项目金额人均贡献率+0.293部级项目金额人均贡献率+0.178A类论文人均贡献率+0.508B类论文人均贡献率+0.021C类论文人均贡献率+0.174论著人均贡献率(1);F2=-0.159横向项目金额人均贡献率+0.065市校级项目金额人均贡献率+0.00省部级项目金额人均贡献率-0.057部级项目金额人均贡献率-0.235A类论文人均贡献率+0.393B类论文人均贡献率+0.328C类论文人均贡献率+0.570论著人均贡献率(2);F3=0.442横向项目金额人均贡献率+0.582市校级项目金额人均贡献率+0.123省部级项目金额人均贡献率+0.010部级项目金额人均贡献率-0.076A类论文人均贡献率-0.219B类论文人均贡献率+0.384C类论文人均贡献率-0.010论著人均贡献率(3)

通过上述公式(1)、公式(2)和公式(3)可得到各个学院的因子得分。从而获得三个因子变量,由于这三个因子变量是线性无关的。因此,可以利用它们对各个学院的科研状况做统计分析。

3 各学院科研状况的综合评价分析

下面利用三个因子变量对2006年-2015年该高校各学院科研状况做多元统计分析,并对各学院近10年来科研状况进行综合评价。

首先画出三因子变量的散点图,对各学院近10年来科研状况做对比分析。以第一因子变量为横坐标,第二因子变量为纵坐标,第三因子变量为竖坐标的三维散点图如图1所示。

从图1中可以看出P学院、O学院、M学院等的第一因子很高。说明这些学院在部级项目人均贡献率、省部级项目人均贡献率、A类论文人均贡献率、B类论文人均贡献率上成绩突出,但在横向项目人均贡献率上稍显不足,这些学院应该在保持尖端学术科研的前提下,多加强与企业的合作,创造更多产业应用成果。L学院、R学院、N学院等的第二因子很高,说明这些学院在论著人均贡献率、C类论文人均贡献率上成绩突出,这与这些学院的科研性质是密不可分的,第二因子很高的学院可以在保持自己科研特色的前提下,多关注学术前沿的相关信息,争取在尖端科研中有更大的突破。如B学院、I学院等的第三因子很高,说明这些学院在横向项目人均贡献率上成绩突出,这些学院可以在紧密保持与企业的科研联系的基础上,加强自己在学科特色科研中的研究,多出一些基础研究方面的尖端科研学术成果,增强学院在科研创新中的能力。

最后利用系统聚类分析法对各学院科研状况进行聚类分析,即利用三因子变量对20个学院进行聚类,结果如表7所示,M学院、P学院、O学院和J学院为一类,B学院、I学院为一类,其它学院为一类。这个结果与散点图分析的情况基本类似。

4 结束语

本文针对某高校各学院科研状况进行综合评价分析,通过对高校近十年科研指标数据进行因子分析,将八个指标变量分为三个科研因子,分别是高端科研因子、校企合作科研因子、基础科研因子,并给出了因子得分模型,对各学院近十年的科研状况给出了分析,最终的聚类分析结果也对各学院科研状况做了验证说明。论文的研究成果为科学地建立高校科研业绩的管理体系及评价体系提供了理论依据。

从分析结果来看,因学院科研特色不同,导致各个学院在学术科研这个万花筒中所扮演的角色也各不相同,但各学院之间还是应当加强科研合作,取他人之长补己之短,这样才能为该高校向科研大校、科研强校的进军道路上打下坚实的基础。

参考文献:

[1]薛薇.SPSS 统计分析方法及应用[M].二版.北京:电子工业出版社,2006:303-349.

[2]张文彤.SPSS11统计分析教程―高级篇[M].北京:北京希望电子出版社,2002:166-210.

[3]李卫东.应用多元统计分析[M].北京:北京大学出版社,2008:226-240.

[4]阎慈琳.关于主成分分析做综合评价的若干问题[J].数理统计与管理,1998(2):22-24.

[5]胡永宏,贺思辉.综合评价方法[M].北京:经济科学出版社, 2000.

[6]何晓群.现代统计分析方法与应用[M].北京:中国人民大学出版社,2003,8:15-18.

[7]孙静水.计量经济学[M].北京:清华大学出版社,2004.

多元统计分析论文范文第4篇

【关键词】多元统计分析 三段式科技创新

一、前言

多元统计分析是一门研究统计应用方法的统计课程,是高等院校统计专业的重要基础课,对于训练与提高学生的逻辑推理能力与统计应用能力都具有重要作用。随着统计软件的开发,多元统计分析课程在自然科学和社会科学的各个领域应用越来越广泛。然而,该课程本身具有理论推导繁琐、计算强度大、实际操作复杂等特点,不仅消磨了学生的学习积极性,也使得其理论方法难以应用到解决实际问题中,从而失去了多元统计分析课程应用性的作用。

为培养学生对多元统计分析课程的学习兴趣,使多元统计统计真正与现实问题相结合,发挥其应用性课程的作用,本研究将以学生为主体,以科技创新活动为载体,实施面向科技创新活动的《多元统计分析》“三段式”应用教学模式的研究。分别包括:一段:统计案例的构建,重点阐述在科技活动中如何构建统计模型;二段:问题情景设计,让学生对科技活动的实际问题进行情景模拟;三段:统计创新实战,组织学生参与科技创新竞赛,辅助以专门的技能培训。

在国外大学的应用统计专业课程中,案例教学是主要的教学模式之一。案例教学法是将实际问题提炼并模拟。因为实际问题的复杂性使得提炼出的案例具有较强的综合性。这恰恰符合统计学课程的应用性和操作性的要求。因此,为了增强学生面对实际问题的统计应用能力及操作能力,应促进学生积极参与社会实践活动和各种竞赛。通过竞赛不但可以增强学生的撰写科研论文及归纳总结的能力,还可以培养学生的团队意识,学习沟通,表达等基本技能。

二、“三段式”应用教学模式的内容

(一)研究内容

本研究以科技问题为引,以三段式立体教学模式为手段,以培养学生科技创新能力为目的,改革传统的《多元统计分析》教学模式。

一段:统计案例的构建,重点阐述在科技活动中如何构建统计模型;

案例教学法是将实际问题提炼并模拟。因为实际问题的复杂性使得提炼出的案例具有较强的综合性。这恰恰符合统计学课程的应用性和操作性的要求。通过对各类典型案例的分析与讲解,即能够将理论知识与实际问题紧密结合,增强学生对理论知识的理解;又能够帮助学生进行实际问题的提炼,进而培养学生的独立分析能力。

我们在借鉴国外案例教学模式的基础上,以我国实际背景出发,进行案例教学,通过案例教学开放学生的思维空间,教会学生掌握知识的同时,最终学会思维、分析和推理、并提出自己的见解,培养统计思维能力。由于《多元统计分析》旨在学生统计能力的养成.而统计能力又主要体现在统计思想、方法的应用上,因此统计的教学过程不应局限于基本理论和方法的介绍.应注意学生分析思维能力的培养,在课堂上多提出“what”、“why”、“how”等系列问题,让学生自己思考并当堂回答,采取这种学生参与式教学方法,能有效地激发学生求知欲和创造能力,不仅能较好地培养学生的竞争意识,敏捷反应,答辩口才,更能进一步明晰解决问题的思路,对培养适应现代社会生活需要的合格人才是非常有益的。同时还要求学生掌握科技创新方法、增强逻辑思维与分析能力及文献检索与收集能力。

二段:问题情景设计,让学生对科技活动的实际问题进行情景模拟;

本阶段采用学生与教师并重的教学模式。培养学生对实际问题的挖掘和提炼能力、统计数据搜集、数据整理能力和数据分析能力。教师将科研项目、社会商业项目为主,设计模拟实践,带队指导学生参与整个模拟流程,在流程的每一部分详细指导其中所用到的统计方法、统计知识、统计原理。结合实际问题,尤其是商业经济问题,适当介绍所用的经济知识,给出经济意义解释。

教师可以组织学生结合自身对实际问题进行统计调查,如对大学生网购现象调查分析、学生对课程教学改革的感受的调研、大学生创业观念及意愿问题的调查等,使得学生能够真正将理论与实线结台,理论知识得以巩固。

培养学生的统计应用条件反射能力,促使学生将实际问题与统计方法之间建立一些直觉的联系,即学生在接触某些具体问题时,能够第一时间想到处理这些问题能够应用的统计方法。如:怎样知道这些问题,可以选用数据、图形、表格等来描述、界定这些问题;怎样了解这些问题的规律、趋势,可以选用推断统计、多元统计等方法。

三段:统计创新实战,组织学生参与科技创新竞赛,辅助以专门的技能培训;

本阶段采用学生为主,教师为辅的教学模式,培养学生归纳总结能力和撰写科研论文能力。每年都会有各级学科竞赛,在比赛前一个月左右时间,通知学生开始为竞赛做好准备,根据往年比赛惯例,提前构思,用1-3天的时间初步选定方向,用4-7天的时间设计调查问卷,教师鼓励学生根据各自特长组成团队参与科技竞赛,团队为主、团队完成竞赛的全程,教师为辅、只为团队提供思路、方法的指导,使教学活动由被动的执行任务变为主动的创造性劳动。

通过竞赛还可以培养学生的团队意识,学习沟通,表达等基本技能。

(二)研究创新点

1.打破了传统的案例教学模式。传统的案例教学是为了加深学生对基本概念,基本方法的理解,而我们所进行的案例教学是希望通过案例教学培养统计思维能力、掌握科技创新方法、逻辑思维与分析能力和文献检索与收集能力。

2.改进了传统的实践教学模式,实施以科技创新活动流程为参考,学生为主体实践教学。传统的实践教学,虽然称之为实践,但是实践的过程只是教师布置题目,学生完成论文,不能够真正做到理论与实线相结合,我们组织学生结合自身对实际问题进行统计调查,如对大学生网购现象调查分析、学生对课程教学改革的感受的调研、大学生创业观念及意愿问题的调查等,使得学生能够真正将理论与实线结台,理论知识得以巩固。

3.以科技创新竞赛为工具,教学并重的统计专业技能培养。传统的检验教学效果的途径是考试,或者通过论文考核学生对知识的掌握情况,本项目继续延续论文考核形式,并进一步让学生参与到教师的科研中,好的课业论文可以作为学生毕业设计的基础。同时通过组织学生参与学科竞赛,培养学生归纳总结能力和撰写科研论文能力,同时也可以培养学生的团队意识。

三、研究主要成果及推广价值

(一)主要成果

“挑战杯”活动在全国高校中的影响日益扩大,已成为衡量高校创新型人才培养的重要标志之一。它既是学生科技训练的重要平台,也是反映高校办学水平、教学质量的重要依据。

2009年,学生参加河北省大学生课外科技作品竞赛即“挑战杯”,获得特等奖一项,三等奖一项,2010年获得一等奖一项,2011年获得三等奖一项。学生的科研能力增强,完成多篇学术论文,如07级统计专业学生王彦的文章被EI检索,06级统计专业学生魏志星发表的文章已被JICT(EI源刊)录用;

(二)推广价值

为了适应社会、科技、经济发展对人才培养提出的新要求,及时更新教育理念,深入开展教学内容与课程体系改革,不断提高教学质量。我们提出了“三段式”教学模式,指导学生参加大学生数学建模竞赛和“挑战杯”竞赛,均取得了好成绩,这对全校的人才培养和教学工作起到了十分积极的重要推动作用。同时,在省内各高校中,我校的成绩也是屈指可数的,特别是统计专业学生在同类专业学生中表现优异,屡次获奖。说明我们的教学模式有很大的成效,有很高的推广价值。

四、研究前景

大学生课外科技活动即能够增强学生的科学素质,又能够拓展学生的知识。本研究就是将课外科技活动和课堂教学结合起来,真正做到理论与实践相结合。将课内外内容完美的结合起来,为培养和提高学生的创新能力提供必要的理论支持。国家的未来靠创新,创新人才的培养靠教育。

参考文献:

[1]郭玉珍,凤启龙. 对大学生课外学术科技创新体系建设的思考[J].边疆经济与文化.2008(11)

[2]冀相奎,刘文婷. 高校科技创新工作探析[J].科技信息.2008(23)

[3]扬卫,依凡. 关于“大学创新文化”的讨论[J].新华文摘.2007(13)

[4]田喜洲. 论大学生科研能力的培养[J].重庆大学学报.2002(6)

[5]曹雨平等.开展课外科技活动提高学生专业素质[J].中国高教研究.2000(l1)

多元统计分析论文范文第5篇

[关键词] 公共信息 公共信息资源 研究综述

信息作为一种重要的资源,随着社会政治、经济、文化、科技的快速发展,其重要性与日俱增。它是连接社会生活各个环节的纽带,也是社会成员之间沟通交流的桥梁,调整与控制着整个社会活动。同时,公共利益的存在和公共事务的处理为作为信息资源一部分的公共信息资源的产生提供了可能。公共信息资源管理的目的是促进公共信息资源的合理配置,实现公共信息资源共享和价值最大化,提供高质量的公共信息服务。本文在统计我国公共信息资源研究领域相关文献的基础上,对我国公共信息资源的研究进展进行描述、分析和总结。

2011年11月30日,笔者在中国知网的中文期刊全文数据库检索系统中,以“公共信息资源”为检索词,进行题名路径检索,检索到相关文献99篇,经过筛选,剔除掉1篇重复的论文、1本题名为《公共信息资源的多元化管理》(作者:夏义堃,出版社:武汉大学出版社)的专著、1篇报道型文章和1篇年鉴类文章,最后统计出2011年11月30日之前发表的与公共信息资源相关的论文共95篇。

1 我国公共信息资源研究的论文统计分析

1.1 论文数量分析

以上述检索方式检索到的论文种类主要分为3类:博士论文2篇,硕士论文7篇,期刊论文86篇;这些论文最早发表的年份是2000年。从图1中可以看出,2001年没有相关,而纵观2000年至今,有关公共信息资源的论文数量虽然呈曲折发展态势,但总发展趋势是增长的,尤以2007年、2009年和2010年这3年论文数量最多。这说明我国近几年在公共信息资源领域的研究成果越来越多。

1.2 论文作者分析

随着信息资源重要性的日益凸显,作为信息资源一部分的公共信息资源渐渐进入科学研究的范畴,越来越多的学者对此进行研究。然而,研究公共信息资源的学者所在岗位不同、拥有的知识结构也不同,因此呈现出了不同的特点。笔者以第一作者为准,对按上述方式检索出的95篇论文的作者情况进行统计分析,得出以下结果:

多元统计分析论文范文第6篇

关键词 体育锻炼 心理健康 统计学问题 对策

身体锻炼对心理健康的影响研究已成为并将继续成为国际运动心理学和健康心理学领域中的重点研究课题。虽然许多研究结果表明体育锻炼能对心理健康起到积极作用,但这些研究结果并不完全令人信服。其中的一个重要原因就是因为许多相关研究在设计阶段和结果分析阶段存在大量的统计学缺陷和错误,进而严重影响了研究结果的可靠性和说服力[1]。为了改变这一局面,为今后的相关研究提供借鉴,本研究旨在收集2000-2011年已发表在16种中文体育核心期刊上的关于体育锻炼与心理健康相关研究论文并进行分析总结,从统计学角度和科研设计角度归纳总结目前该领域研究中存在的主要统计学问题和缺陷并提出相应对策,以期为推动体育锻炼与心理健康相关研究在我国的发展起到一定的借鉴作用。

一、研究对象及内容分析

(一)研究对象

本研究旨在分析及探讨目前我国体育锻炼与心理健康相关研究中存在的统计问题,优秀核心期刊中的学术著作正好能满足调查需求。所以,本研究以北京大学图书馆2008年版《中文核心期刊要目总览》中评定的中文体育类16种期刊为研究对象,从其2000-2011年已出版论文中以体育锻炼和心理健康为检索词在中国知网期刊数据库、万方数据库和维普中文科技期刊数据库三个数据库同时进行检索,剔除重复论文后,共收集到相关研究论文75篇。

(二)内容分析

在2000-2011年已发表在16种中文体育核心期刊中的75篇论文中,问卷调查类研究为34篇,占45.3%;实验性研究20篇,占26.7%;综述20篇,占26.7%;关于问卷和量比信度和效度检验方法的方法学研究1篇。

二、存在的主要问题

(一)研究对象和研究项目存在局限性

通过对75篇文献的研究发现,目前我国开展的关于体育锻炼与心理健康的相关研究中,研究对象基本上是在校学生,其中又以在校大学生为主(占85%以上),而关于其他群体体育锻炼与心理健康的相关研究基本处于缺失状态。研究对象的局限性不利于从不同人群和项目多层次探讨体育锻炼与心理健康的因果关系。

(二)调查问卷及量表的不合理及评价的缺失

通过对研究文献调查问卷及量表的分析发现,我国目前关于体育锻炼与心理健康的研究中采用的问卷和量表绝大部分都是借鉴国外已有的量表进行简单地修正,许多量表并不适合我国的实际情况[2]。同时,在使用这些量表前,很少论文提及了问卷和量表信度及效度的评价[3]。在收集的所有文献中,除去1篇关于问卷调查和量表信度和效度检验方法的方法学论文以及在4篇问卷调查类问卷中进行过问卷的信度和效度检验外,其余论文均未进行或是笼统地解释说信度和效度经过检验,达到可接受水平。

(三)样本含量的随意性

在34篇问卷调查类研究和20篇对照实验研究中,样本含量从十几人到几千人不等,且均未提及样本含量的依据。样本含量选择的随意性必然导致两类错误,一种是样本含量过大,造成人力、物力和时间上的浪费,还容易引入混杂因素,导致研究结果的偏倚;另一种是样本含量过少,样本量过少容易把偶然性或巧合的现象当成必然的规律性现象,导致研究结果的不可重复,研究结果失去意义。因此,运用统计学方法对样本含量进行估计是调查类和实验类研究中不可或缺的步骤之一,必须引起高度重视[4-5]。

(四)对照实验缺乏同质性检验

在20篇对照试验中,除1篇文章采用自身对照研究不需要进行同质性检验外,其余19篇文章中只有1篇文章在试验前进行了同质性检验,有5篇文章在对照实验在结果分析中才进行同质性检验,严重违背了实验设计的基本步骤和原则[6]。在干预实施前,不进行同质性检验,无法说明研究指标在实验组和对照组是否一致,进而导致无法判断结果的差异是由于干预导致还是在干预开始前对照组和实验组本来就存在差别。

(五)统计分析方法的错误运用

在54篇进行了统计分析的论文中,统计分析方法的错误运用主要是因为没有考虑方法的适用条件。其中比较常见的错误主要是以下两个。一个是在对计量资料集中趋势和离散趋势进行描述的指标选择上。另一个问题为选择方差分析还是选择协方差分析资料存在较大分歧。因此,在对研究结果进行分析前,充分考虑资料的类型及统计分析的条件及前提,从统计学角度选择适合的方法对数据进行处理是分析前不可缺少的步骤。

三、结论与建议

(一)结论

16种中文体育类核心期刊中关于体育锻炼与心理健康的相关研究中,对实验设计方法和抽样方法重视不够。在所研究的75篇论文中,实验设计方法和抽样方法“无”和“不明确”的比例很高且正确率偏低,影响论文的质量和科学价值。同时,在这些文章中,相当比例的文章存在随意抽样,样本含量存在随意性;缺乏对调查问卷和量表的信度和效度。评价研究结果的统计分析也存在方法运用不当等问题。因此,加强对该领域研究中方法学的研究和探讨,分析目前存在的问题和缺陷,提高体育科研人员的统计学水平是今后研究中需要注意的问题。

(二)建议

1.加强调查问卷和量表的改良

我国目前关于体育锻炼与心理健康研究中的问卷和量表存在大量缺陷和不规范,修订工作刻不容缓。在以后的研究中,如何充分借鉴国外心理健康研究工具优点的基础上,结合已有的研究成果和我国的实际情况, 摸索出一套符合我国关于体育锻炼与心理健康的测量工具是今后该领域专家和学者需要解决的问题[7-8]。

2.在研究设计阶段充分考虑统计学方法和原则

进行体育科研设计时,应该根据研究目的确定合适的实验设计方案、抽样方法和统计分析方法,并且应该在文章中明确地阐述。实验设计方案决定了抽样方法,抽样方法又是确定统计方法时必须考虑的前提。抽样方法不同,统计指标均数、率及其标准误的计算方法就不同;实验设计方法不同,统计方法也不同。

3.加强复杂实验设计和多元统计方法的运用

目前我国在体育锻炼与心理健康的相关研究中,所采用的研究方法多为观察性研究设计和单因素研究设计,这种设计方案和统计分析方法降低了研究的水平。今后,可以采用多因素研究设计对体育锻炼和心理健康加以定量研究;在统计分析时,也可采用协方差结构模型和多元线性回顾和多元逐步回顾等统计方法进行统计分析,使这一领域的研究更加深入。

4.加强学科的交叉和融合

体育本身是一门综合性学科,体育锻炼与心理健康的研究不仅包括了体育学,同时也涉及运动医学、解剖学、教育学、心理学和统计学的相关知识和内容[9]。任何一个体育科研工作者不可能是所有科目的专家,因此,在研究过程中应该加强多学科合作,倡导学科间的关联性和不同研究工作者的相互协作性,达到取长补短,相互优化的目的。在问卷调查法的运用中,从问卷的设计到论文的撰写,都应根据自己所研究的题目向各行的专家请教,认真听取他们的意见和建议;论文撰写的过程中,研究者也要做到不同学科间的交流。

参考文献:

[1]陈及治.体育统计与体育科研方法[J].天津体育学院学报.2001.16(3):42-46.

[2]杨威.我国体育社会学研究中问卷调查方法的回顾与思考[J].体育学刊.2001(3):27-31.

[3]王海军,徐克静.问卷调查中的信度与效度问题[J].中国健康教育.1994(11):21- 23.

[4]李沛良.社会研究的统计分析[M].武汉:湖北人民出版社.1987.

[5] Douglas等,汪仁官等译.实验设计与分析[M].北京:中国统计出版社.1998.

[6]丛湖平.体育统计[M].北京:高等教育出版社.1998:1-7.

[7]殷恒婵,付雪林.对体育锻炼心理健康效应研究的分析与展望[J].体育科学.2004(6):37-39.

[8]季浏,李林,汪晓赞.身体锻炼对心理健康的影响[J].山东体育学院院报.1998(1):37-42.

多元统计分析论文范文第7篇

医学统计学是根据概率论和数理统计的原理, 结合医药卫生工作的实际情况, 研究实验设计和数字资料的搜集、整理、分析和推断的一门科学, 广泛应用于基础医学、临床医学、预防医学、药学和卫生事业管理等诸多领域。它是人们认识客观世界的一种重要手段, 现代科技工作者做科学研究或撰写论文, 很少看到不用统计学。

与此同时,如果统计学方法应用不当,不仅不能准确地反映科研结果,而且还可能带来错误的结沦。Rosenfeld 等比较了不同年表的文章,在20 世纪90年代以后有更多的文章使用了统计推断,而且比较复杂的统计分析方法如多因素分析等也更多的应用于临床研究中,但同时也存在使用统计方法欠妥或叙述不清的情况。

因此本文将对医学科技论文常见统计学方法的正确应用进行讨论,希望加强作者的统计思维,进而提高期刊论文的统计质量及学术水平。

2、统计学方法的内容

统计软件包、统计分析方法及检验水准是统计学方法必须描述的3 方面内容。SPSS (statistics package for social science) 和SAS(statistical analysis system ) 是全世界学术界公认且最常用的两大统计软件包[6]。检验水准即A,表示组间实际无差别而统计结果判断为有差别,犯这类错误的概率[1]。实际工作中常取 A=0.05,表示本次研究计算所得P 值必须小于0.05,才能认为组间差异有统计学意义。统计分析方法的准确描述是科技论文科学性的关键所在。统计学方法一般包括统计描述和组间差异性检验(即:假设检验) 两部分内容。

3、统计学方法的正确选用

统计方法的选择取决于研究设计、数据资料类型和变量值的分布。计量资料常用u检验、t检验(.配对t检验)、 F检验;计数资料用 检验;等级资料、偏态资料或不明分布的资料可用秩和检验等。每种显著性检验方法均有其适用范围, 如方差分析(F检验).要求数据服从正态分布, 且各总体方差齐, 否则不宜作方差分析, 若改用非参数统计方法, 则会降低统计效率, 故常在可能情况下, 通过变量变换(如对数变换、平方根变换、反正弦函数变换、例数变换等)使资料转换为正态分布, 以满足方差分析或t检验的应用条件。医学期刊中最常见的是t检验和 检验, 这两种方法误用也较为多见。

3.1重复t检验

多个样本均数间的两两比较(又称多重比较)不宜用t检验, 因为重复数次,t检验将增加第一类错误的概率, 使检验效率降低。此时宜用方差分析, 并在此基础上用两两比较方法..(如.SNK、LSD、Duncan法等)。对于同一对均数间的差异, 用t检验无显著性, 而两两比较可能有显著性, 可见错误选用统计方法将推出错误结论。

3.2行列标 检验误用

行列表 检验用于2个或多个样本率(或构成比).比较, 它要求行列表中不宜有1/5以上格子的理论频数T

3.3需要注意的统计学问题

3.3.1无足够的统计学信息

论文中未说明统计方法和 取值, 无均数、标准差或率及t值、 值等统计量, 甚至未作假设检验直接下结论。不少临床医学论文作者只在文中提及P值大小并据此推断结果的显著性。实际上, 临床医学研究关心的是各组之间结局(如疗效)的差别大小, 而不单纯是统计学显著性, 因此应同时说明检验方法、 水平、统计量值、P值和可信区间, 以便让读者了解所用的方法和结论是否适当及其临床的实际意义。

3.3.2统计图、表

统计图、表是统计描述的重要工具。统计图宜少而精, 应按资料性质和分析目的选用适合的统计图形, 统计图虽直观但不能代替精确的数据或统计量同。统计表宜简单明了, 层次清楚, 一般采用三线表。常见的统计表运用不当有.. 标题复杂或过于简略甚至无标题, 辅助线过多, 标目繁杂, 层次不清。另外, 表内不宜留空格, 暂缺或未记录可用“…” 表示, 无数字用“一”表示, 数字若是“0”则填明“0”。

3.3.3统计软件使用的误区

目前计算机应用已十分普及, 统计软件的使用也非常方便, 但软件只能解决计算问题, 并不能替代人脑的统计思维。根据资料的分布特征和数据特点选择统计方法, 正确地解释分析结果并推导出正确的结论, 这是科研工作者在做统计分析时必须首先掌握的, 计算只是一种工具。有了诸如SASA、SPSS等高级统计软件包, 复杂了多元分析如多重回归、多因素方差分析等已变得十分容易, 于是一些作者片面追求使用高深的多元统计方法且多种方法一起用, 误以为统计方法用得越高级, 文章水平越高。实际上如果使用不当, 多元统计方法使用得越多, 错误可能也越多。一个精心设计的临床研究, 资料可能用简单的t检验或 检验就足以说明问题, 若滥用多元分析、结果会适得其反。

4.结语

通过上面的分析,在医学研究中必须正确运用统计学,这是科研工作的科学性所决定的。搞科研,首先必须尊重科学。借助统计学这个有用的工具,可以去探索未知事物,揭示和阐明客观事物变化的规律性。

参考文献:

[1]于国艺, 周晓彬, 王俊. 医学论文常见统计方法误用分析.编辑学报, 1998;10(3):132.

[2]杨树勤, 主编.卫生统计学.第3版.北京: 人民卫生出版社, 1995;145-147.

[3]王苏星.医学论文中常用显著性检验方法的选择.中华创伤杂志, 1998;14(1):63.

多元统计分析论文范文第8篇

一 课程体系设计和实践实训设计整体思路

1.遵照教育部对经济统计学专业的要求

严格遵照教育部对经济统计学专业的要求。主干学科为理论经济学、应用经济学、统计学,其中核心课程为西方经济学(微观经济学、宏观经济学),计量经济学,财政学,货币金融学,会计学,经济统计学,国民经济统计学,概率论与数理统计,抽样技术与应用,应用时间序列分析。实践性教学环节包括实验课程(含基本统计分析软件应用、统计实务模拟等),社会实践(含经济社会统计调查、统计工作实习等),科研和论文写作(含毕业论文、学年论文、科研实践等)。专业实验包括计算机基本技能实验、统计分析应用软件实验、经济计量分析软件实验、数据挖掘技术与应用实验。

2.参照其他院校的培养方案和课程设置

它山之石,可以攻玉。我们选择了部分具有代表性的财经院校(如上海财经大学、中央财经大学、东北财经大学、西南财经大学、中南财经政法大学、北京工商大学、上海金融学院、 河南财经大学、浙江财经学院和山东工商学院)和综合类院校(如浙江大学、吉林大学、南京大学和云南大学)以及师范类院校(如北京师范大学、华东师范大学、东北师范大学、南京师范大学)作为参照院校。通过比较分析得出,在统计学经济统计、商务统计、金融统计方向中,财经类院校主要突出经济学课程,招生偏重理科生。综合性院校和师范类院校主要课程为理学类,招生偏重理科生。

综上所述,经济统计学专业应培养适应信息化社会需要,熟练掌握现代统计理论和经济数量分析方法,具有扎实的统计学、经济学和金融学基础,能熟练应用计算机软件处理统计数据的复合型高素质经济管理统计人才。学生毕业后可在政府部门、金融机构、外资企业和大中型公司等从事经济统计分析、管理咨询、市场调研和商务数据分析等管理工作。

3.与学院培养方案形式统一

新制订的培养方案和整个学院的形式保持了统一,以便于教务人员管理工作的开展。

二 经济统计学培养方案专业课的设置

经济统计学的培养目标与基本规格和招收对象为理科生,设置了保险精算、金融统计和商务统计三个方向。学生修满培养方案规定的学分并达到学位授予要求者,授予经济学学士学位。

由于经济统计学对统计学和经济学知识的要求较高,我们提高了课程总学分和总学时,注重主干学科和专业课程的开课顺序和教学周学时分配,强化实训实践课程,实行理论和实践并行。

培养方案确定了5门学科基础课程,分别为宏观经济学、微观经济学、C语言程序设计、概率论与数理统计、管理学。确定了5门专业基础课程,分别为基础会计学、经济统计学、货币金融学、财政学、计量经济学。确定了9门专业核心课程,分别为国民经济统计学、多元统计分析、统计预测与决策、抽样技术与应用、应用时间序列分析、金融统计学、市场调查与分析、投资学、数据挖掘。

分设了三个专业方向,分别 为保险精算(开设保险学、保险统计学、利息理论、寿险精算、非寿险精算5门课程)、金融统计(开设商业银行经营管理、金融市场、金融资产评估、金融工具与金融风险管理、投资组合分析 5门课程)和商务统计(开设信息检索与利用、企业经营统计学、投入产出分析、项目管理、质量控制统计方法5门课程)方向。

开设专业任选课4门。开设实训课程8门,为C语言程序设计实训、SPSS统计软件应用实训、会计软件实训、计量建模与Eviews软件应用实训、市场调查与分析实训、多元统计分析与SAS软件应用实训、时间序列分析实训、数据挖掘(Matlab语言及其应用)实训。专业课合计为36门。

多元统计分析论文范文第9篇

关键词:对外汉语教材;学术期刊;统计分析

笔者认为,对外汉语教材述评论文的发展趋势在一定程度上反映了对外汉语界总体的教学情况,所以选取一段时期内研究教材的论文进行分析是十分必要的。通过对这个时期内论文的考查,以期初步了解和掌握我国对外汉语教材研究领域状况及发展趋势。

1.研究准备与设计

(1)样本范围。本研究材料来源于2000年至2014年七本对外汉语专业期刊:《世界汉语教学》《语言教学与研究》《语言文字应用》《云南师范大学学报》《华文教学与研究》《汉语学习》《中国语文》。这七本期刊在汉语教学界是较为知名的刊物,对它们进行研究在一定程度上能够探寻出对外汉语教材研究的发展趋势。

(2)研究方法。本文对2000年至2014年以来这七份学术期刊上的所有论文进行了一次梳理,尽可能无遗漏地筛选出研究对外汉语教材的论文,最后进入统计分析的论文共有139篇。在此基础上,二次提取并统计上述论文的教材研究关注点,得出相关数据并进行分析。

通过对新世纪以来这七份期刊的教材研究方面的统计分析,我们尝试寻找对外汉语教材研究论文的关注重点和可以改进的地方。

2.研究结果与分析

(1)教材研究论文主要关注点。通过对论文的归类整理,教材研究论文的关注点基本可以分为三大类。对语言类教材的研究在总体研究中占有很大的比重,在三个时间段研究都保持在88%以上;不同时段对文化类教材及教材中文化意识的研究都有关注,但比重较低,在6%左右;商务类、报刊类、外交类教材研究论文只有3%左右。

(2)语言类教材研究情况。语言类教材的研究论文在所有教材研究论文中所占比重最大,包括了不同的研究类别,论文研究内容基本上可分为教材评估、教材编写设想、教材编写经验总结和教材介绍四大类。下表是自2000年至2014年以来每五年的语言类教材研究类别论文的比重图,从中可以看出,教材评估研究一直以来是研究的重点;教材编写设想类研究论文总体呈上升趋势;教材编写经验总结与教材介绍类研究论文呈现逐渐下降态势。

其中,教材评估论文的研究重点主要有课文话题选择、词汇、课后练习这些问题的研究,大部分是对单本教材的分析,缺乏一个统一的评估标准。

3.存在问题及对策

(1)教材研究论文关注重点是语言类教材,而对文化类教材或教材中的文化意识研究很少。这说明学界对文化教材和语言教材中融入文化意识的编写问题还未真正重视起来,但实际上汉语国际教育的根本任务在于中华文化的推广,让世界认识崛起的中国,所以文化教材的编写与研究是十分迫切的。在今后的教材编写中,编者应有意识地将文化纳入整体编写中,变过去单纯的语言教学教材为语言文化教学综合教材;而对专为文化课编写的教材,要依据对外汉语文化教学大纲编写,内容注重多元性,同时定位要准确,对国内留学生编写的文化教材不应只介绍汉族文化,还应涵盖其他少数民族文化,而对海外文化教材编写也不能单向地传播中国文化,应该以消除文化摩擦为目的的双向文化对话为目的,在体现中国文化时还应该结合当地实际。此外,在编写体例方面还要注意,要符合对外汉语文化教学目标,也要考虑到学生语言接受能力。

(2)其他使用目的类教材研究论文比例很少。该类研究论文少可能与这类教材的专业性较强,学习者需要一定的汉语基础,适用面不是很广有关。但随着经济发展,对商务、外交类汉语教材的需求也日益增大,此类教材编写与研究亟待加强。教材编写要语言与专业知识并重,注重培养学生实际处理问题的思维;教材的内容要不断适应变化发展的国际经济形势。

(3)教材评估类论文占语言类教材研究论文的主导,缺乏一套完整的、科学的、便于操作的对外汉语教材评估系统标准。我们可以从是否符合教学大纲、选材是否有趣味性、词汇量大小是否合适、练习设计是否科学、注释是否全面、文化取向是否多元、语言表达是否易于学生理解、版面设计是否新颖有趣、教材配套是否完善这九个方面进行评估。

多元统计分析论文范文第10篇

关键词:统计分析;SAS;MATLAB;生物信息学

生物信息学(Bioinformatics)是伴随着人类基因组计划而兴起的一门新兴的交叉学科。它的出现在促使生物学和医学的研究向处理高通量数据需求发展的同时,又引入了众多复杂的统计学方法。然而,西班牙学者Emili和Carles撰文指出2001年nature登载的181篇研究论文中,38%的文章至少有一处统计错误。显然,即使高水平研究论文也存在统计学问题,这就提醒我们在进行统计分析教学的时候要严格把握好各种统计概念,选择合适的统计分析软件。

1、课程内容选择

统计学软件是我们应用统计方法不可缺少的工具。时下统计学软件名目繁多,各具特色,诸如SAS、SPSS、TSP、Excel、Eviews、Statistica、Minitab等等。

在数据处理和统计分析方面,统计分析系统(Statistics Analysis System,SAS)已经成为国际上的标准软件系统。尤其在教育、科研领域,SAS软件已成为专业研究人员进行统计分析的标准软件。SAS系统由多个功能模块组合而成,其基本部分是BASE SAS模块。除此之外,还包含以下不同的模块:SAS/STAT(统计分析模块)、SAS/GRAPH(绘图模块)、SAS/QC(质量控制模块)、SAS/ETS(经济计量学和时间序列分析模块)、SAS/OR(运筹学模块)等等。

MATLAB(Matrix Laboratory)是一种解释性执行语言,具有强大的计算、仿真、绘图等功能。它使用简单,扩充方便,具有丰富的函数库(工具箱),计算的功能实现比较简单,因此逐渐成为大学生学习研究必不可少的分析软件。尽管MATLAB的功能非常强大,而且生物信息学专业学生大部分的基础、专业课程都涉及到相应的MATLAB软件使用,但是却没有专门对其统计方法的使用介绍。

综上所述,SAS在专业领域应用很多,几乎作为医学统计学必学软件;MATLAB拥有强大的函数功能,结合生物信息学专业学生现有知识结构和将来研究学习、工作的需求,我们选取这两种软件作为课程内容。鉴于本课程许多内容涉及的数学问题和计算较复杂,并且要结合计算机软件来完成,因此根据本学科的特点和学生的实际情况探索一个有效的教学方法,有助于学生掌握好这个工具。通过近两年教学工作中积累的一些经验,我们已经形成了一套较为完整的授课体系。

2、课程基本框架

《SAS统计分析与MATLAB应用》是我院生物信息学专业一门特色的实践性基础课,是研究在生物信息学中如何应用SAS和MATLAB软件的学科。它需要学生在掌握了扎实的概率论与数理统计、生物统计和多元统计理论的基础上,进一步实现计算机软件的掌握。近年来随着计算机的发展和应用的普及,这门学科将成为科学研究和生产实践中数据分析的一种重要手段。通过本课程的学习,主要任务是使学生掌握SAS和MATLAB的基本语法、功能及统计应用,能够熟练运用这两个软件解决实际的生物信息学问题,为今后生物信息学软件的使用打好基础。具体课程内容安排包括:

SAS方面:①SAS系统概述,包括SAS窗口系统的使用方法,SAS程序的编写、修改和运行;②数据集的建立和整理:利用viewtable编辑数据集;利用DATA语句的传统数据步程序;外部数据文件的读取;③SAS实用过程(如PRINT、FORMAT、TRANSPOSE等)和数值资料统计描述(如MEANS、FREQ、UNIVARIAT等);④数值资料的统计推断(进行t检验的MEANS、TTEST过程,方差分析的ANOVA、GLM过程);⑤相关和回归分析(CORR、REG、LOGISTIC过程);⑥多元统计分析的聚类分析(CLUSTER、TREE过程),主成分分析(PRINCOMP过程)和因子分析(FACTOR过程)。

MATLAB方面:①MATLAB数值计算,包括矩阵和数组的运算;②数据结构和全局变量,程序结构,程序流控制,以及M文件的调试;③MATLAB中的计算结果的可视化和高级图形处理,包括二维图形的绘制,三维图形的绘制;④常见概率分布,样本的统计描述以及回归分析函数。

3、授课方式探讨

传统的SAS以及MATLAB教学倾向于基础理论知识的讲解,并且实验教学中采纳的案例大多是农业、环境或者动物实验的数据,对于依托医学的生物信息学专业学生来说,并不是他们兴趣所在。由于生物信息学专业的建立只有短短几年,学生在没开专业课之前对于生物信息学的了解寥寥无几。他们更关注于这个专业将来能够从事什么工作,发展前景如何?因此,我们在教学过程中针对这种情况,有的放矢的选择医学,尤其是生物信息学方向的已发表案例数据来进行讲解,甚至作为学生实验课的习题。在学习中初步把生物信息学的一些专业知识渗透给学生,较好的激发他们的学习兴趣。

比如,我们讲解聚类分析的时候采用的数据是基因芯片数据。讲解这个案例之前可以给学生介绍:现代功能基因组学研究的一个重大突破就是基因芯片技术,它产生了大量的表达谱数据,为生物统计、数据挖掘和知识发现等生物信息学方法研究提出了具有挑战意义的课题;对于基因芯片数据的分析可以采用有监督学习方法(比如特征选择算法),另外也可以采用无监督学习方法,其中典型的代表就是聚类。这里我们可以采用SAS系统里面的聚类分析CLUSTER过程实现,也可以通过MATLAB直接调用cluster函数实现。通过这种讲解,一方面引入了生物信息学的知识点,另一方面经过横向对比,使学生可以轻松认识到两种软件的异同之处,加深知识的理解。

这种实例在我们日常的学习研究工作中会经常遇到,世上无难事,只怕有心人,要注意积累,把平时阅读的文献资料信息收集整理起来,有效地与课堂教学结合,不但活跃了课堂气氛,还能有效的调动学生学习的积极性,改善学生面对成堆的数据和统计理论而疲劳的思维。

4、教学过程体会

本课程融合了多门比较复杂的统计学理论,虽然软件的实现过程相对简单,但是需要学生掌握的理论知识较多,非常有必要开设在高等数学、生物统计和多元统计等课程结束后,而我们也正是按照这种思路进行的,节省了本就不富裕的课堂理论教学时间。另外,由于SAS与MATLAB都是非常庞大的分析软件,拥有面向各个研究领域的模块,因此不同的内容需要分别精讲、略讲,培养学生自主学习的能力。

参考文献:

[1] 董大钧.SAS统计分析应用[M]. 北京:电子工业出版社,2009.

[2] 黄燕,吴平等.SAS统计分析及应用[M]. 北京:机械工业出版社,2007.

[3] 陈桂明,戚红雨,潘伟等.MATLAB数理统计(6.X)[M]. 北京:科学出版社,2002.

[4] 张玉华,潘燕,李桥等.医学研究生SAS统计分析软件教学的探索与实践[J]. 中国卫生统计.2006,23(5):466-467.

作者简介:

上一篇:统计基础论文范文 下一篇:统计与预测论文范文