相关性与因果性

时间:2022-09-17 09:38:49

在初中数学的学习中,同学们已经掌握了不少

收集、整理、统计数据的方法,不过要当心了,千万不

要不假思索地从统计数据中寻找结论、统计数据有

时也有说谎的时候,对此,美国著名作家马克,吐温

曾经做出了一个简洁而漂亮的诠释:“世上一共有三

种谎言:谎言,糟糕的谎言和统计数据。”

如果盲目地对统计数据进行分析,有时会得出

一些极为荒谬的结果。

统计学家曾经调查过铀矿工人的寿命,其结果

让人大跌眼镜:在铀矿工作的工人居然与其他人的

寿命相当,有的甚至更长!难道统计结果表明在铀矿

工作对身体无害吗?当然不是!其实,统计数据本身

确实不假,铀矿工人的寿命真的不比普通人低,难就

难在我们如何透过数据的外表,从中挖掘出正确的

信息,事实上,只有那些身强体壮的人才会去铀矿工

作,他们的寿命本来就长一些,正是因为去了铀矿工

作,才把他们的寿命拉低到了平均水平,造成了数据

的“伪独立性”,这种现象常常被称为“健康工人效

应”。

类似地,有数据表明打太极拳的人和不打太极

拳的人的平均寿命相同,事实上呢,太极拳确实可以

强身健体、延长寿命,但打太极拳的人往往是体弱多

病的人,这一事实也给统计数据带来了虚假的独立

性。

表面上不相关的统计数据,其背后仍然可能存

在着很强的因果关系。

有虚假的独立性数据,就有虚假的相关性数据,

统计数据显示,去救火的消防队员越多,火灾损失就

越大,初次听到这样的结论,想必大家的反应都一

样:这怎么可能呢?仔细想想你就明白了:正因为火

灾损失大,才会有很多人去救火,这里,因果关系弄

颠倒了,数据只能显示两个事件有相关性,但并不能

告诉你它们内部的逻辑关系。

事实上,两个在统计数据上呈现相关性的事件,

甚至有可能根本就没有因果关系,统计数据表明,冰

淇淋销量增加,鲨鱼食人事件也会同时增加,但这并

不意味着,把冰淇淋销售点全部取缔了,就能减小被

鲨鱼吃掉的概率,真实的情况则是,这两个变量同时

增加只不过是因为夏天到了,统计数据显示,足球队

的获胜率,竟然与队员的球袜长度成正比,难道把队

员的球袜都换长一些,就能增加进球数了吗?显然不

是,数据背后真正的因果关系是,球队的获胜率和队

员的球袜长度同时受第三方因素——队员的身

高——的影响,这导致获胜率与球袜长度之间呈现

出虚假的相关性。

类似的例子还有很多,如果观察大气层中二氧

化碳含量的变化和肥胖症人口数量的变化,你会发

现一个非常有趣的现象:在1950年左右,二者都出

现了一次非常剧烈的增长,但科学研究并没有发现

二氧化碳含量的增加会导致人类出现过度肥胖的趋

势,事实上,这些数据背后的真实关系则是,上世纪

50年代,汽车产业形成了一定的规模,尾气排放导

致大气中的二氧化碳含量陡然增加:同时,人们也更

多地用汽车代步,走路的时间越来越少,于是就越来

越胖了。

可见,要想从统计数据中挖掘出正确的结论,远

没有想象中那么容易。

有的同学可能会问,在科学研究当中,为了得到

事物之间正确的因果关系,应该怎么做呢?这是科学

研究中一个非常核心的问题,在生物学、医学和心理

学当中,人们常常用对照实验的方法来挖掘因果关

系,感兴趣的同学不妨在网络上搜一搜“实验组”、

“对照组”、“单盲实验”、“双肓实验”,领会一下实验

设计科学的奥妙吧。

上一篇:谦辞中的文史知识 下一篇:对新课改下初中数学教学的几点感悟