非线性回归模型中拟合曲线的选择

时间:2022-09-14 04:05:49

摘要:回归分析是应用极其广泛的数据分析方法之一。本文着重于非线性关系如何转化为线性模型,以实例采用不同曲线拟合,并比较优劣。

关键词:线性回归 非线性回归 残差平方和 r检验法

中图分类号: H319 文献标识码: A 文章编号:1672-1578(2014)10-0019-01

1 一元线性回归模型

在含有变量的系统中,如果自变量与因变量之间是直线或近似的直线关系,称之为线性回归模型。一元线性回归模型如下:

y=β0+β1x+εE(ε)=0,D(ε)=?滓2

利用提供的数据,可由LS估计法作出β0,β1的估计值 0,

1,于是得到回归方程 = 0+ 1x

残差平方和Qe= (yi- i)2越小,表示y与x的线性关系越显著。回归方程的显著性可用F检验法或t检验法或检验法来检验。

2 可化为线性的非线性回归模型

在实际问题中,自变量与因变量之间未必总有线性关系,回归函数往往是比较复杂的非线性函数,但在某些情形下,可以通过对自变量与因变量作适当的变换,将一个非线性的函数关系转化成线性函数关系,再用线性回归的方法来处理。常见的情形有以下几种:

(1)双曲线 =+ ;

(2)幂函数y=xb;

(3)指数函数y=ebx;

(4)倒指数函数y=e ;

(5)对数曲线y=+blnx。

3 应用举例

在实际应用中,一般是由给出的数据,利用matlab软件,先描绘出散点图,然后根据曲线的形状选择一条最佳的拟合曲线,建立变量之间的回归方程。

实例:出钢时所用的盛钢水的钢包,由于钢水对耐火材料的侵蚀,容积不断增大。我们希望找出使用次数与增大的的容积之间的关系。实验数据如下:

根据实测数据作出散点图,选用双曲线 =+ ,令

u= ,y= ,得线性函数:u=+v,由x,y的数据可得u,v的数据,利用matlab可求得 =0.1312, =0.0823,r=0.9683,于是得回归方程: =0.0823+0.1312v。取α=0.01,查相关系数临界值,

r1-0.01(15-2)=r0.99(13)=0.6411,因r=0.9683>0.6411,所以回归方程是高度显著的。代回到原来变量得回归方程为

=0.0823+ 或 =

在上面的运算中,由于对y作了变换,故实际上所求的回归方程是按偏差平方和 ( - )2达到最小求得的,但这个值最小并不说明残差平方和Qe= (yi- i)2最小,因此所求得的回归曲线不一定是最佳拟合曲线。

如果选取倒指数曲线y=e ,作变换u=lny,y= ,c=ln可得线性函数:u=c+bv,利用数据计算结果如下: =-1.1107,

=2.4579,r=-0.9795。

因r=0.9795>0.6411=r0.99(13),所以回归方程为 =2.4578-1.1107v。高度显著。代回到原来变量得回归方程为:

=11.679e 。

为比较两个回归方程哪个拟合得更好一些,分别求两个模型下的残差平方和,双曲线回归方程的残差平方和Qe=1.4385,倒指数曲线回归方程的残差平方和Qe=0.8915,由于0.8915

参考文献:

[1]电子科技大学应用数学系.概率论与数理统计.电子科技大学出版社.1999.8.

[2]李永乐,胡庆军.应用数理统计.国防科技大学出版社.1999.8.

上一篇:加强高校对大学生社会主义核心价值观教育的途... 下一篇:浅析如何上好课改后的语文课