应用矩阵的迹检验高维协方差矩阵相等

时间:2022-08-21 08:14:10

应用矩阵的迹检验高维协方差矩阵相等

摘要:数学、统计学及物理学等多学科领域中均是随机矩阵理论的活跃研究领域,并且发展迅猛。现如今,随机矩阵理论及其应用范围十分广泛,其在多元统计分析中应用的研究也得到了越来越多的专家学者的关注。本文就随机矩阵理论的研究背景、目的意义及发展趋势进行了粗浅分析,以探究随机矩阵理论在高维多元统计分析的检验问题中的应用问题,为发掘随机矩阵理论更多的应用研究价值提供新思路。

关键词:随机矩阵理论;多元统计分析;检验问题

中图分类号:G642.0 文献标志码:A 文章编号:1674-9324(2016)32-0200-02

一、随机矩阵理论的研究背景

随机矩阵理论在发展的早期研究阶段主要用于科研探索研究,在数学和物理等学科得到广泛应用。随着随机矩阵理论的进一步深入研究,随机矩阵理论被应用到股市的价格波动预示,乃至后来对于金融资产收益、医学生理信号、磁场电子运动等方面的研究探索。随着随机矩阵理论被广泛应用于解决一些科学研究或工程实践等问题,国内外对于随机矩阵理论的研究均有了突破性进展。国内外均有对于随机矩阵理论与频谱感知进行科学连接的研究。

二、随机矩阵理论研究的目的意义及发展趋势

随机矩阵意味着所有的元素都是随机变量。随机矩阵理论主要是研究在满足某些条件时随机矩阵的特征根的性质。其中统计中的样本协方差矩阵是随机矩阵理论中的一类重要研究对象,并且由于目前现实生活中高维数据的大量出现,利用随机矩阵理论去进行高位数据的分析越来越流行。随机矩阵理论自从被提出来后,受到了无数的不同领域的学者的关注。首先是数学家,原因是本身对于矩阵各种性质的研究就是数学家们关心的重点,而更重要的是随机矩阵理论与数学上备受关注的黎曼猜想有着大量的数值证据关联。目前已经有大量的研究数据表明,黎曼ζ函数的非平凡零点的分布可以用任何一个典型随机厄尔米特矩阵特征根分布来描述,但是遗憾的是还没有严格的数学证明,所以目前包括像菲尔兹奖获得者Terence Tao等很多世界著名数学家都在从事随机矩阵理论的研究。另外,包括统计学家、物理学家、经济学家和通讯学家在内的学者们也同样对随机矩阵理论有很高的关注度,因为随着计算机技术的飞速发展和广泛应用,人们得以搜集储存大维巨量数据(比如多体物理学、现代经济学以及通讯中的信号处理中的大维数据),然而建立在经典的极限理论(假设维数固定,而样本容量趋于无穷)下的多元统计方法被应用于大维数据时,它们或者根本不可以应用,或者即使可以应用,其效率也会非常低。所以统计学家利用大维随机矩阵的谱分析理论(这时我们假设维数趋于无穷),对那些传统的统计分析方法进行了必要的修正,使之适用于大维统计分析。随机矩阵理论及其统计应用中有着诸多经典结果被世界所认可,这也是随机矩阵理论可以进行高维检验的理论基础。

三、随机矩阵的经验谱分布函数

四、多元统计分析

多元统计分析是指对于元素为随机变量的向量和元素为随机变量的矩阵进行的分析。其中随机变量X的分布函数表现为:F(a)=P(X

随机向量X=(X1,X2,…,Xn)的分布函数为:F(X1,X2,…,Xn)=P(X1

多元统计分析的数字特征包括数字期望、协方差矩阵和相关矩阵。其中随机矩阵X的数学期望表现为:E(aX)=aE(X)

E(AXB+C)=AE(X)B+C

E(X1+X2+…+Xn)=E(X1)+E(X2)+…+E(X1)

(其中a,A,B,C均为常数;X1,X2,…,Xn为n个同阶的矩阵)

多元统计分析是统计学的延伸,是运用数理统计学的方法对多变量、多个指标进行研究分析的理论和方法。多元统计分析涉及对变量或指标根据其相似性进行分类,以求达到类别中对象的同质性做大化或是类别间异质性最大化的聚类分析;对于自变量与因变量没有严格确定的函数关系时,用来反映依据一种因变量与多种自变量之间线性或是非线性数学模型数量关系的多元回归分析;根据总体变量或是指标来衡量样本变量或是指标的判别分析;通过将具有一定相关性的多个指标重新组合成一组新的相互没有关系的综合指标来探究多个变量或指标间相关性的主成分分析,此外还有典型相关分析、多元方差分析等。

五、随机矩阵在多元统计分析中的运用

1.检验多个高维均值。对于高维均值变量的统计分析,是多元统计分析中的重要组成部分。然而,随机矩对于高维数据的均值变量的检验问题,可以对单总体均值进行检验,可以对多总体均值进行检验,还可以对多总体均值进行检验。随机矩阵对于单总体均值的检验即将总体均值定位一个常数,H0:μ=μ0;随机矩阵对于双总体均值的检验是让两个样本的总体均值保持一致,H0:μ1=…μ2;随机矩阵对于多个总体均值的检验是让N个总体均值保持一致,H0:μ1=…μn。然而无论是单总体均值的检验、双总体均值的检验还是多总体均值的检验,都是在高维数据的维度小于样本量的前提下,因为当维数很高时,随机矩阵的原理预示着样本的协方差存在一些问题,表现为不稳定的状态。大维随机矩阵针对这一问题给出对应的解决办法。

2.检验多个高维协方差矩阵。协方差可以简单的定义为:Cov(X,Y)=E[X-E(X)][Y-E(Y)]

如果Cov(X,Y)=0时,X与Y是不相关关系。对于这时的高维协方差矩阵而言,两个独立的随机变量是必然不相关的关系,而两个不相关的随机变量则未必是独立的。而当X=Y时,Cov(X,Y)=Var(X),X和Y的协方差矩阵与Y和X的协方差矩阵互为转置关系,Cov(X,Y)=[Cov(Y,X)]

如果Cov(X,Y)=0,那么X与Y是不相关的。对于这时的高维协方差矩阵而言,同样两个独立的随机向量是必然不相关的关系,而两个不相关的随机向量则未必是独立的。

3.检验线性回归模型中的回归系数。回归分析是用来分析书籍间的内在规律的统计分析,它是基于数据、变量或是向量之间的依存关系而确立的。回归分析不同于描述两变量间相关关系的线性关系,因为线性关系只用来笔试自变量X与因变量Y的关系,而自变量X与因变量Y只有满足线性关系时才能进行回归分析,因为回归分析是一种拟合分析方法,即使自变量X与因变量Y不存在线性关系也可以对其进行回归分析。对于多元线性回归模型中回归变量的维度明显高于样本量的高维数据的回归性质进行分析称为大回归分析。多元线性回归模型表现为:Fi为独立分布的序列,源于均值等于0的协方差矩阵――高斯噪声分布,B为回归系数矩阵,zi为回归变量。

Xi=Bzi+Fi,i=1,2,…,n

综上,我们得出的结论是检验高维协方差等于给定的非随机矩阵,随机矩阵可以检验两个协方差矩阵相等,随机矩阵可以检验线性回归模型中的回归系数,随机矩阵可以检验同协方差矩阵的多个总体均值相等。

六、结语

本文的主要研究是基于随机矩阵理论对于高维多元统计分析的检验问题中的应用进行了探究,包括随机矩阵理论用于检验多个高维均值,随机矩阵理论用于检验多个高维协方差矩阵,随机矩阵理论用于检验线性回归模型中的回归系数等多个问题进行探究。通过所得结果我们可以发现随机矩阵理论对于高维统计分析具有非常强的应用前景。

参考文献:

[1]胡江.大维随机矩阵经验谱分布函数的收敛[D].长春:东北师范大学,2012.

[2]解俊山.随机矩阵谱统计量的若干概率极限定理[D].杭州:浙江大学,2012.

上一篇:互联网+安防报警系统设计与研究 下一篇:浅谈指导大学生创新项目的体会及感想