正态分布及其扩展综述

时间:2022-09-02 06:02:04

【摘要】本文综述了正态分布的最新发展状况,给出了正态分布的概念和公式,主要论述了正态分布的各种扩展,包括渐近正态分布、二元正态分布、离散正态分布、广义正态分布、对数正态分布、多元正态分布、广义逆正态分布、偏正态分布和截尾正态分布等,并论述了其最新进展和应用动态.

【关键词】正态分布;广义正态分布;多维正态分布;偏正态分布

一、正态分布及其应用

1.正态分布定义和性质

生产与科学实验中很多随机变量的概率分布都可以近似地用正态分布来描述,正态分布是当今应用最为广泛的连续概率分布.17世纪,棣莫弗和拉普拉斯最早使用了正态分布,18世纪早期德国数学家高斯研究了正态分布的性质并应用正态分布分析了天文数据,所以在科学界正态分布也叫作高斯分布.正态分布的概率密度函数为:f(x)=

2.正态分布的应用

由于正态分布具有很多优良性质,根据中心极限定理,诸多数据集合可以用它来近似拟合,所以生产与科学实验中很多随机变量的概率分布都可以近似地用正态分布来描述.例如,在生产条件不变的情况下,产品的口径、长度等指标,同一种生物体的身长、体重等指标.一般来说,如果一个量是由许多微小的独立随机因素影响的结果,那么就可以认为这个量具有正态分布,还有一些常用的概率分布也是由它衍生而来的,例如对数正态分布、t分布、F分布等.

二、正态分布的新发展

实际应用中由于正态分布的不易满足性,故针对不同问题对正态分布进行了扩展,在一般正态分布的基础上,导出了渐近正态分布、二元正态分布、离散正态分布、广义正态分布、广义逆正态分布、对数正态分布、多元正态分布、偏正态分布和截尾正态分布等,各扩展有不同的特点和应用.

1.渐近正态分布

渐近正态分布在因子分析中应用很广泛,因子分析主要用在行为和社会科学,如随着年龄的增长,儿童的身高、体重会随着变化,因为影响身高与体重的生长因子相同故有一定的相关性.渐近正态分布主要用于弱假设情况下的最大似然因子分析,通过渐近正态性可以使因子分析适用于更广泛数据分布的分析.因子分析模型对于p可观测随机向量xα可以表示为:xα=μ+Λfa+ua (α=1,…,N) (7),其中μ是p维向量参数,Λ是p×k阶因子载荷矩阵,fα是非观测可能包含随机误差的k阶向量,uα是一个非观测随机误差向量,而且fα和uα互相独立.

Anderson和Amemiya分别在1956年和1987年讨论了最大似然估计在弱假设情况下的性质,后者指出对于探索性因子分析,如果uα服从正态分布,因子载荷和误差的渐近分布将对fα有更好的适应性.对于因子分析模型,Aerson和Rubin在1956年通过最大似然估计得出渐近正态分布统计量上提出一般性结论,指出用渐近分布来做一般分布的因子和误差分析的可靠性.随后在1988年Anderson 和Amemiya对该结论做了证明,并把模型拓展到Λ是λ的非线性函数上这种更一般的情况.

2.二元正态分布

二元正态分布是多元正态分布的一个特例,它的很多性质可从多元正态分布中推出.定义:两个连续的随机变量x和y,x~N(μx,σ2x),y~N(μy,σ2y),它们的联合概率密度可用下式表示:

它是左截尾的离散正态分布,同时像半边连续正态分布一样也是有确定期望和方差的最大熵分布.Kemp同时推出半边正态分布是qhyperPoissonI分布,说明它和M/M/1 队列的关系,推导了它的期望和图形的单峰性质.

4.广义正态分布

广义正态分布在1972年最早由Miller et.al提出,它是作为一个非随机误差的模型用于粗差探测模型.它具有对称的单峰概率密度曲线,很多其他的分布通过它概率密度式参数的指数衰减推导而出.由于广义正态分布的强适应性、稳定性,只需一个参数就可确定和可逼近大批量数据,所以它在各个领域获得了广泛应用.

【参考文献】

[1] Wassily Hoeffding.A Class of Statistics with AsyMptotically Normal Distribution.Institute of Statistics.

[2] T.W.Anderson,Yasuo AmeMiya.The AsyMptotic Normal Distribution of Estimators In Factor Analysis Under General Conditions.The Annals of Statistics,1988,Vol.16,No.2,159-771.

[3] P.Blaesild.Conditioning With Conic Sections In The TwoDimensional Normal distribution.The Annals of Statistics[J].1979,vol 7,No 3,169-670.

[4] ManLai Tang,WaiYin Poon.Statistical inference for equivalence trials with ordinal responses: Alatent normal distribution putational Statistics & Data Analysis[J].2007,vol 51,5918-5926.

[5] D.Marcottea,E.Henry.Automatic joint set clustering using a mixture of bivariate normal distributions.International.Rock Mechanics & Mining Sciences[J].2002,vol 39,323–334.

[6] S.J.van Albada,P.A.Robinson.Transformation of arbitrary distributions to the normal distribution with application to EEG testretest reliability Neuroscience Methods[J].2007,vol 161,205-211.

[7] N.E.Savin,Henry B.,Iowa City.Semiparametric Estimation of the BoxCox Model.Preliminary and Incomplete.Tippie College of Business[J].2001,vol 30.

上一篇:例说可行域的判定方法 下一篇:包含与排除原理及应用