回归分析的解题策略

时间:2022-07-29 10:09:56

回归分析的解题策略

回归分析是处理变量间相关关系的一种数学方法,主要解决:(1)确定特定量之间是否有相关关系,如果有就找出它们之间的回归模型的数学表达式;(2)求出回归方程;(3)利用回归方程进行预报,同时从残差、相关指数和残差分析角度探讨回归模型的拟合效果.

一、判断两个变量的正或负相关

判断两个变量是正相关还是负相关,有三种常用方法. (1)利用散点图. (2)利用相关系数[r]的符号,当[r>0]时,正相关;当[r0]时,[y=bx+a]是增函数,两变量是正相关;当[b

例1 对变量[x,y]有观测数据[(xi,yi)(i=1,2,][…,][10)],得散点图1. 对变量[u,v]有观测数据[(ui,vi)(i=1,2,…,10)], 得散点图2. 由这两个散点图可以判断( )

解析 由图1可知,各点整体呈递减趋势,变量[x]与[y]负相关;由图2可知,各点整体呈递增趋势,变量[u]与[v]正相关.

答案 C

例2 对具有线性相关关系的两个变量建立的回归直线方程[y=bx+a]中,回归系数[b]( )

A. 可能小于0 B. 小于0

C. 能等于0 D. 只能等于0

解析 根据相关系数知,当[b=0],[r=0]时,两个变量不具有线性相关关系. 当[r]的绝对值接近于零时,表示两个变量之间几乎不存在线性相关关系. 因此本题[b]不能等于零,可能大于0也可能小于0.

答案 A

二、体会最小二乘估算的思想方法

对于一组具有线性相关关系的数据 [(x1,y1),(x2,y2),]…,[(xn,yn)],其回归直线[y=bx+a]的斜率和截距分别是使“偏差平方和”[Q(α,β)=(y1-βx1-α)2][+ (y2-βx2-α)2+…][+ (yn-][βxn-α)2]取最小值时的选择值. 这种方法称为最小二乘估算法.

三、线性回归分析

对具有相关关系的两个变量进行统计分析时,首先作出散点图,然后进行相关性检验. 或直接利用相关系数进行相关性检验. 在确认具有线性相关关系后,再求回归直线方程.

例4 某农科所对冬季昼夜温差大小与某反季节大豆新品种发芽多少之间的关系进行分析研究,他们分别记录了12月1日至12月5日的每天昼夜温差与实验室每天每100颗种子中的发芽数,得到如下资料:

该农科所确定的研究方案是:先从这五组数据中选取2组,用剩下的3组数据求线性回归方程,再对被选取的2组数据进行检验.

(1)求选取的2组数据恰好是不相邻两天数据的概率;

(2)若选取的是12月1日与12月5日的两组数据,请根据12月2日至12月4日的数据,求出[y]关于[x]的线性回归方程[y=bx+a];

(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(2)中所得的线性回归方程是否可靠?

解析 (1)设抽到不相邻两组数据为事件[A],因为从5组数据中选取2组数据共有10种情况,每种情况都是等可能出现的,其中抽到相邻两组数据的情况有4种, 所以[P(A)=1-410=35].

(2)由数据求得,

上一篇:写作中的逻辑应用 下一篇:必修五Unit 5&选修六Unit 1重点词汇