基于多元线性回归模型的大名县货运总量预测

时间:2022-08-19 07:17:19

基于多元线性回归模型的大名县货运总量预测

摘要:通过一个实例详细介绍了建立经济计量模型的过程和步骤,旨在引入用多元线性回归分析的方法来分析实际问题的思想。由定性分析选取与大名县货运总量有较强的相关性的几个影响因素,以其作为解释变量,建立与货运总量的线性模型。

关键词:货运总量 多元线性回归 模型

中图分类号:F207 文献标志码:A文章编号:1673-291X(2011)26-0055-02

多元线性回归模型是由一组独立解释变量值来预测一个或多个被解释变量的一种统计工具。本文主要从工业总产值、农业总产值、居民非商品支出等经济指标出发,建立与大名县年货运总量的多元线性回归模型,进行货运总量的预测和分析。

一、提出因变量与自变量

把货运总量(亿元)作为因变量Y,以工业总产值(亿元)为X1、农业总产值(亿元)X2、居民非商品支出(亿元)X3为解释变量。1991―2000年大名县货运总量与工业总产值、农业总产值、居民非商品支出的数据统计见表1。

二、作相关分析,设定理论模型

用SPSS软件计算增广相关阵,并通过变量间的相关性分析可以进行多元回归分析,由定性分析可知,X1,X2,X3都与变量Y有较强的相关性,设回归模型为:

Y=β0+β1X1+β2X2+β3X3+ut

三、计算结果

用SPSS软件计算,其中Y表示货运总量(亿元),X1表示工业总产值(亿元)、X2表示农业总产值(亿元)、X3表示居民非商品支出(亿元)。输出结果如表2和表3所示。

由上述数据可知:β0=-348.28β1=3.754β2=7.101 β3=12.447

则回归方程为:

y=-348.28+3.754X1+7.101X2+12.447X3

四、多元线性回归模型的检验

(一)拟合优度检验

多元回归可决系数R2=0.805 5,修正的多重可决系数R2=0.708 3,两者均小于0.85,说明模型的拟合程度一般,但可以基本拟合。

(二)对回归方程的显著性检验

提出假设:H0:β1=β2=β3=0;H1:β1、β2、β3不全为0

取显著性水平α=0.05,F临界值Fα(k-1,n-k)即F0.05(3,6)=4.76

由上表可知F=8.283 2>F0.05(3,6)=4.76

所以拒绝原假设H0,接受备择假设H1,所以回归方程十分显著,即可以以95%的概率断言自变量X1,X2,X3全体对因变量Y产生显著影响。

(三)回归参数的显著性检验(t检验)

提出假设:对于任意参数βi(i=1,2,3),则有

H0:βi=0;H1:βi≠0

由上表可知,t1=1.942,t2=2.465,t3=1.178

给定显著性水平α=0.05,自由度为(n-k)的tα/2(n-k) 当n=10,k=4,可知t0.025 6=2.4469

因为|t1|=1.942<tα/2(n-k)=2.446 9,所以t1未通过检验

因为|t2|=2.465>tα/2(n-k)=2.446 9,所以t2通过检验

因为|t3|=1.178<tα/2(n-k)=2.446 9,所以t3未通过检验

(四)修改回归模型

剔除对Y影响不显著的变量(每次只能剔除一个变量)

首先剔除ti(i=1,2,3)中最小的变量X3,并建立新的回归方程

利用spss软件对此模型的剩余参数进行估计,重新得到数据:

β0=-459.624 β1=4.676 β2=8.971

五、对新的多元线性回归模型进行检验

(一)拟合优度检验

多元回归可决系数R2=0.761,修正的多重可决系数R2=0.692,两者均小于0.85,说明模型的拟合程度一般,但可以基本拟合。

(二)对回归方程的显著性检验

提出假设。

H0:β1=β2=0;H1:β1、β2不全为零

取显著性水平α=0.05, F临界值Fα(k-1,n-k)即F0.05(2,7)=4.74

由上表可知F=11.117>F0.05(2,7)=4.74

所以拒绝原假设H0,接受备择假设H1,因此回归方程十分显著,即可以以95%的概率断言自变量X1,X2全体对因变量Y产生显著影响。

(三)回归参数的显著性检验(t检验)

提出假设。对于任意参数βi(i=1,2),有:

H0:βi=0;H1:βi≠0

由上表可知,t1=2.575,t2=3.634

给定显著性水平α=0.05,自由度为(n-k)的tα/2(n-k)。当n=10,k=3,可知t0.025 7=2.364 6

因为|t1|=2.575>tα/2(n-k)=2.364 6,所以t1通过检验

因为|t2|=3.634>tα/2(n-k)=2.364 6,所以t2通过检验

(四)做出多元回归方程的线性拟合图

根据以上的分析结果,最终得到货运总量与工业总产值、农业总产值之间的多元线性回归方程为:

y=-459.624+4.676X1+8.971X2

六、所建多元线性回归模型的意义

由回归方程的结构来看,具有明显的经济意义。β1的符号为正,说明工业总产值增加货运总量也增加,因为工业总产值增加了,货物需求量也就增加了,所以货运总量也就增加了,符合经济意义;β1=4.676,表明当其他因素不变时,工业总产值增加一个单位,货运总量平均增加4.676个单位;β2的符号也为正,说明农业总产值增加货运总量也增加,因为农业总产值的增加,意味着农产品的增加,必然带动农产品货运的增加,因而货运总量也就增加,符合经济意义;β2=8.971,表明当其他因素不变时,农业总产值增加一个单位时,货运总量平均增加8.971个单位。这个回归方程比较简明地描述了货运总量的结构和增长成因。

由上面这个回归方程的建立过程,我们看到,货运总量受着多种因素的影响。但我们最终得到的回归模型只引进了两个因素,即工业总产值、农业总产值,这说明这两个变量是影响大名县货运总量的主要因素。

收稿日期:2011-06-16

作者简介:杨风杰(1982-),男,河北邯郸人,硕士研究生,从事区域经济与规划研究。

参考文献:

[1] 盛骤,谢式千.概率论与数理统计[M].北京:高等教育出版社,2004.

[2] 薛薇.统计分析与SPSS的应用[M].北京:中国人民大学出版社,2001.

[3] 袁卫,庞皓.统计学[M].北京:高等教育出版社,2000.

上一篇:平顶山地区生产总值的变化趋势及其区域差异研... 下一篇:浅谈德州市工业节水