时间:2022-09-17 09:38:49
在初中数学的学习中,同学们已经掌握了不少
收集、整理、统计数据的方法,不过要当心了,千万不
要不假思索地从统计数据中寻找结论、统计数据有
时也有说谎的时候,对此,美国著名作家马克,吐温
曾经做出了一个简洁而漂亮的诠释:“世上一共有三
种谎言:谎言,糟糕的谎言和统计数据。”
如果盲目地对统计数据进行分析,有时会得出
一些极为荒谬的结果。
统计学家曾经调查过铀矿工人的寿命,其结果
让人大跌眼镜:在铀矿工作的工人居然与其他人的
寿命相当,有的甚至更长!难道统计结果表明在铀矿
工作对身体无害吗?当然不是!其实,统计数据本身
确实不假,铀矿工人的寿命真的不比普通人低,难就
难在我们如何透过数据的外表,从中挖掘出正确的
信息,事实上,只有那些身强体壮的人才会去铀矿工
作,他们的寿命本来就长一些,正是因为去了铀矿工
作,才把他们的寿命拉低到了平均水平,造成了数据
的“伪独立性”,这种现象常常被称为“健康工人效
应”。
类似地,有数据表明打太极拳的人和不打太极
拳的人的平均寿命相同,事实上呢,太极拳确实可以
强身健体、延长寿命,但打太极拳的人往往是体弱多
病的人,这一事实也给统计数据带来了虚假的独立
性。
表面上不相关的统计数据,其背后仍然可能存
在着很强的因果关系。
有虚假的独立性数据,就有虚假的相关性数据,
统计数据显示,去救火的消防队员越多,火灾损失就
越大,初次听到这样的结论,想必大家的反应都一
样:这怎么可能呢?仔细想想你就明白了:正因为火
灾损失大,才会有很多人去救火,这里,因果关系弄
颠倒了,数据只能显示两个事件有相关性,但并不能
告诉你它们内部的逻辑关系。
事实上,两个在统计数据上呈现相关性的事件,
甚至有可能根本就没有因果关系,统计数据表明,冰
淇淋销量增加,鲨鱼食人事件也会同时增加,但这并
不意味着,把冰淇淋销售点全部取缔了,就能减小被
鲨鱼吃掉的概率,真实的情况则是,这两个变量同时
增加只不过是因为夏天到了,统计数据显示,足球队
的获胜率,竟然与队员的球袜长度成正比,难道把队
员的球袜都换长一些,就能增加进球数了吗?显然不
是,数据背后真正的因果关系是,球队的获胜率和队
员的球袜长度同时受第三方因素——队员的身
高——的影响,这导致获胜率与球袜长度之间呈现
出虚假的相关性。
类似的例子还有很多,如果观察大气层中二氧
化碳含量的变化和肥胖症人口数量的变化,你会发
现一个非常有趣的现象:在1950年左右,二者都出
现了一次非常剧烈的增长,但科学研究并没有发现
二氧化碳含量的增加会导致人类出现过度肥胖的趋
势,事实上,这些数据背后的真实关系则是,上世纪
50年代,汽车产业形成了一定的规模,尾气排放导
致大气中的二氧化碳含量陡然增加:同时,人们也更
多地用汽车代步,走路的时间越来越少,于是就越来
越胖了。
可见,要想从统计数据中挖掘出正确的结论,远
没有想象中那么容易。
有的同学可能会问,在科学研究当中,为了得到
事物之间正确的因果关系,应该怎么做呢?这是科学
研究中一个非常核心的问题,在生物学、医学和心理
学当中,人们常常用对照实验的方法来挖掘因果关
系,感兴趣的同学不妨在网络上搜一搜“实验组”、
“对照组”、“单盲实验”、“双肓实验”,领会一下实验
设计科学的奥妙吧。