变量间的相关关系分析法

时间:2022-07-06 11:36:45

变量间的相关关系分析法

变量间的相关关系在新教材中开始涉及,利用散点图判断两个变量之间是否具有相关关系,求解回归方程,并进行相应的预测将是考查的重点.下面就变量的相关关系的分析方法进行归纳论述.

一、相关关系的概念

相关关系是指两个变量之间存在一定的关系,这种关系是不固定的,当自变量取一个值时,因变量有许多值与之对应.

如:身高——体重

X Y

例1 下列关系中,变量间带有随机性的相关关系的是 .

①正方形的边长与面积之间的关系 ②水稻产量与施肥量之间的关系 ③人的身高与年龄之间的关系 ④降雪量与交通事故的发生率之间的关系

分析 两变量之间的关系有两种:函数关系与带有随机性的相关关系.

解 ①正方形的边长与面积之间的关系是函数关系.

②水稻产量与施肥量之间不是严格的函数关系,但是具有相关性,因而是相关关系.

③人的身高与年龄之间的关系既不是函数关系,也不是相关关系,因为人的年龄到达一定时期,身高就不发生明显变化了,因而它们不具有相关关系.

④降雪与交通事故的发生率之间具有相关关系.

答案 ②④

点拨 准确理解变量间的相关关系的概念是解答本题的关键.

二、通过散点图来显示相关关系

例2 现随机抽取某校10名学生在入学考试中的数学成绩[x]与入学后的第一次数学成绩[y],数据如下:

问这10名学生的两次数学考试成绩是否具有相关关系?

解析 应用散点图分析:

两次数学考试成绩散点图如图所示,由散点图可以看出,两个变量的对应点集中在一条直线的周围,且[y]随[x]的变大而变大,具有正相关关系. 因此,这10名学生的两次数学考试成绩具有相关关系.

点拨 两个变量是否具有相关关系,主要依据散点图加以判断,看变量对应的点是否分布在一条直线附近,若是,则具有相关关系;否则,不具有相关关系.

三、通过求线性回归直线方程来分析相关关系

例3 某种产品的广告费支出[x]与销售额[y](单位:百万元)之间有如下对应数据:

(1)画出散点图;

(2)求回归直线方程.

解析 (1)散点图如下.

(2)列出下表,并进行有关计算.

于是所求的回归直线方程是[y=6.5x+17.5].

点拨 对一组数据进行线性回归分析时,应先画出其散点图,看其是否成直线,再依系数[a],[b]的计算公式,算出[a],[b]. 由于计算量较大,所以在计算时应借助技术手段,认真细致,谨防计算中产生错误.

四、计算相关系数来测度变量间的关系强度

根据相关系数判断相关的程度:相关系数的取值是在-1和+1之间,即[-1≤r≤+1]. 若[0≤r≤+1],表示[X]与[Y]之间存在正相关关系,若[-1≤r≤0],表示[X]与[Y]之间存在负相关关系;若[r=+1],表示[X],[Y]之间为完全正相关关系,若[r=-1],表示[X]与[Y]之间为完全负相关关系,当[r=0]时,表示[Y]的取值与[X]无关,即二者之间不存在线性相关关系,但不能说明两者之间没有任何关系. 它们可能会存在非线性相关关系.

例4 某学校5个学生的数学和物理成绩如下表,判断它们是否有相关关系.

解析 [x=80+75+70+65+605=70],

由0.9>0.75知,数学成绩和物理成绩有显著性的线性相关关系.

点拨 利用相关系数进行研究,若相关系数[r]>0.75,认为两个变量之间具有很强的线性关系.

五、通过变量间的相关关系进行科学预测

例5 人口问题是我国最大的社会问题之一,预测人口数量及其发展趋势是我国制定一系列相关政策的基础. 由人口统计年鉴查得我国从1949年至1994年人口数据资料如下表:

试预测我国1999年的人口数,并查阅有关资料证实你的结论.

解析 在直角坐标系中描出数据的散点图,直观判断散点在一条直线上,所以用线性回归方程拟合二者关系,可将数据适当简化,如将年份减去1949并用[x]表示,人口数用[y]表示,则得到下表:

再用计算机计算相应的数据之和:

所以[y=14.51006+526.56165];根据上述方程可以预测,当[x=50](即1999年)时,

[y=1252.06465](百万)[≈12.52](亿).

同学们可以通过查阅有关人口普查的资料进行查证.

点拨 本题根据线性回归方程进行预测,这要求同学们具备一定的数据分析、推测能力.通过学习,体会数据收集、分析在现实生活中的作用.

1. 下列两变量具有相关关系的是( )

A. 正方体的体积与边长

B. 匀速行驶的车辆的行驶距离与时间

C. 人的身高与体重

D. 人的身高与视力

2.为了对某市中考成绩进行分析,在60分以上的全体同学中随机抽出8位,他们的数学(已折算为百分制)、物理、化学分数对应如下表:

(1)用变量[y]与[x,z]与[x]的相关系数说明物理与数学、化学与数学的相关程度;

(2)求[y]与[x,z]与[x]的线性回归方程(系数精确到0.01),并用相关指数比较所求回归模型的效果.

参考数据:[x=77.5,y=85,z=81,]

3.某研究性学习小组对春季昼夜温差大小与某花卉种子发芽多少之间的关系进行研究,他们分别记录了3月1日至3月5日的每天昼夜温差与实验室每天每100颗种子浸泡后的发芽数,得到如下资料:

(1)从3月1日至3月5日中任选2天,记发芽的种子数分别为[m,n],求事件“[m,n]均小于26”的概率;

(2)请根据3月2日至3月4日的数据,求出[y]关于[x]的线性回归方程[y=bx+a];

(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(2)所得的线性回归方程是否可靠?

1. C

2. (1)物理与数学、化学与数学的成绩都是高度正相关. (2)回归模型[y=0.65x+3463]比回归模型[z=0.72x+25.20]的拟合的效果好.

3. (1)[310] (2)[y=52x-3] (3)得到的线性回归方程是可靠的.

上一篇:把“对话”作为语文课的“还原剂” 下一篇:概率、统计中的常见错误分析