用线性模型统计分析论文

时间:2022-09-09 07:54:05

用线性模型统计分析论文

本文主要分析线性-对数模型(2),分别从随机误差项u、参数1b及x的样本范围三方面,利用Eviews软件及D-W检验,分析误用线性模型处理之后的自相关性,从而判断线性-对数模型有无误用线性模型.

1随机误差项大小对误用线性模型的影响

1.1数值模拟具体步骤

1.2数值模拟结果具体分析根据数值模拟的结果,对数据进行处理,得到表1.由表1可知,线性-对数模型中的随机误差项对于误用线性模型后,DW检验是否存在显著自相关有明显影响.当随机误差项服从的正态分布的标准差为0.01时,残差序列存在显著自相关或DW检验失效的比例较高,达到94.2%,说明线性-对数规律性明显,随机干扰较弱,容易发现线性模型有问题,如果用线性模型处理,会产生较大的误差,从而会影响问题的解决.当标准差由0.01逐渐变大时,残差序列存在显著自相关或DW检验失效的比例会逐渐降低,当标准差达到0.05时,存在显著自相关或DW检验失效的比例仅为18.8%,这反映出干扰较大时,样本观察值的线性-对数规律性不太明显,这时,难以通过DW检验发现是否误用了线性模型,这时要注意从经济规律本身分析变量之间的关系,从而确定模型函数形式,或用其它检验方法进行进一步检验.当然,如果仅以预测为目标,这时用线性模型也是可以考虑的.

2样本范围大小对误用线性模型的影响

2.1数值模拟具体步骤第一步:取定参数0b1和1b2;第二步:选定解释变量的一个容量为30的样本,在一个实数范围内选择30个实数作为ix的模拟观测值:12330x,x,x,x(首先选实数范围为0.01–0.3,之后将实数范围分别改为0.01–0.6,0.01–0.9,0.01–1.2,再分别进行数值模拟);第三步:利用软件在实数范围内产生一组随机误差项:12330u,u,uu,iu服从N(0,0.12);第四步:将得到的随机数和已知的变量代入lny12xu模型中,从而得到30个ilny的模拟观测值.将得到的随机数和已知的变量代入yexp(lny),从而得到30个iy的模拟观测值;第五步:利用产生的30个lniy值,对所选的30个x值进行回归,得线性-对数模型(2)的估计,并利用如此产生的iy值,对所选的30个x值进行回归,得线性模型的估计;第六步:提取线性模型的DW统计量,并查表得n30,k2,显著性水平0.05时,1.35ld,1.49ud;第七步:循环10000次,统计检验结果存在显著一阶自相关性或DW检验失效的百分比.

2.2数值模拟结果具体分析根据数值模拟结果,统计分析得到表2.样本范围大小不同时,残差序列存在显著自相关的分布图见图1.由表2和图1可以看出,在随机误差项u和b1取值确定的情况下,x的取值范围也会影响线性-对数模型误用线性模型后DW检验的结果.当样本范围逐渐扩大时,残差序列的自相关性逐渐显著.在样本范围为(0.01–0.3)的情况下,线性-对数模型用线性模型处理后,DW检验残差序列显著自相关或DW检验失效的比例为17.2%,随着样本范围变大为(0.01–0.6),可以看到显著自相关或DW检验失效的比例有所提高,为36.9%,在图1中看到模型的非线性还不明显,如果DW检验残差序列不存在自相关性,误将线性-对数模型用线性模型处理,得到的线性模型误差不太大,是可以接受的.但是,当x范围变为(0.01–0.9)的时候,D-W检验出的显著自相关或DW检验失效的比例很大,从图1中也可以看出线性-对数模型不宜用线性模型处理,否则误差会比较大.当样本范围再次扩大的时候,可以发现线性-对数模型的非线性更加明显了,而且D-W检验的残差序列的显著自相关或DW检验失效的比例接近100%,此时线性-对数模型完全不能用线性模型处理.因此,对线性-对数问题,用线性模型处理的时候,如果x的解释取值范围较小,即使DW检验显示不存在显著一阶自相关,也应该注意检验是否存在误用函数形式的问题,否则就可能出现误用函数形式的错误.当然,这时即使犯了误用函数形式的错误,因为非线性规律不明显,单纯从误差的角度来看,与用非线性模型处理相差也不会很多.

3参数取值的大小对误用线性模型的影响

3.1数值模拟具体步骤第一步:取定参数0b1和1b6(之后将参数1b改为5,2,1,分别进行数值模拟);第二步:选定解释变量的一个容量为30的样本,数值分别为:0.01,0.02,0.03,0.04,0.05,0.06,0.07,0.08,0.09,0.1,0.11,0.12,0.13,0.14,0.15,0.16,0.17,0.18,0.19,0.2,0.21,0.22,0.23,0.24,0.25,0.26,0.27,0.28,0.29,0.3;第三步:利用软件在实数范围内产生一组随机误差项:12330u,u,uu,iu服从N(0,0.12);第四步:将得到的随机数和已知的变量代入lny16xu模型中,从而得到30个ilny的模拟观测值.将得到的随机数和已知的变量代入yexp(lny),从而得到30个iy的模拟观测值;第五步:利用产生的30个ilny值,对所选的30个x值进行回归,得线性-对数模型(2)的估计,并且利用如此产生的iy值,对所选的30个x值进行回归,得线性模型的估计;第六步:提取得线性模型的DW统计量,并查表得n30,k2,在显著性水平0.05时,1.35ld,1.49ud;第七步:循环10000次,统计检验结果有自相关性或DW检验失效的百分比.

3.2数值模拟结果具体分析根据数值模拟的结果,对数据进行统计分析,得表3.由表3可以看出,在随机误差项方差和样本范围大小确定的情况下,线性-对数模型中的b1的不同取值,对误用线性模型后DW检验显著自相关或检验失效的比例有明显影响.当b1为6的时候可以看到线性-对数模型线性化后,残差序列显著自相关或DW检验失效的比例为100%,在这种情况下,容易发现线性模型存在问题,不容易犯误用线性模型的错误.当改变b1的取值时,显著自相关或DW检验失效的比例也随之改变,当取值逐渐变小的时候,显著自相关或DW检验失效的比例会逐渐降低.当b1取值达到2的时候,显著自相关或DW检验失效的比例为17.2%,当b1取值为1的时候,显著自相关或DW检验失效的比例为16.2%,虽有所降低,但是幅度有所减慢,如果以为不存在一阶自相关就应用线性模型处理,则会出现误用线性模型的问题.不过当b1为2和比2小的时候,线性-对数模型的曲率较小,用线性模型作为线性-对数模型的近似,误差是较小的,对预测结果影响不大.由此可以得出,在半对数模型用线性模型处理的过程中,b1是重要的影响因素,需要根据线性-对数模型的实际情况,通过数值模拟的结果分析和DW检验,查看半对数模型线性化后残差序列的自相关性程度.如果显著自相关,则线性-对数模型用线性模型处理带来的误差就较大,应进一步探索自相关的原因,当不存在显著自相关时,可能会出现误用线性模型问题,如果仅研究变量间的数量关系,也可以将线性-对数模型用线性模型近似.

4结语

本文分析了线性-对数模型误用线性模型的三种情况。运用Eviews进行蒙特卡洛实验,以及D-W检验,直观地说明了线性-对数模型中的随机误差项u、参数b1取值大小和x的取值范围影响误用线性模型的可能性.当总体非线性规律明显时,常常能检验出残差序列自相关或出现DW检验失效的情况,因此出现残差序列自相关或出现DW检验失效的情况,要注意检验是否因为总体规律非线性所致.当DW检验不存在一阶自相关时,容易忽略总体规律非线性检验,会造成误用线性模型的失误.但幸运的是,这时非线性规律实际是不太明显的,如果仅考虑变量之间的数量关系的话,线性模型也是可以接受的.

作者:吴梦婷王义闹单位:温州大学数学与信息科学学院

上一篇:农村收入统计分析论文 下一篇:生化指标统计分析论文