关注统计 思考应用

时间:2022-10-27 01:05:01

关注统计 思考应用

2012年湖北省将进行首次新课标高考,传统高考中文理科概率一般都有一道解答题,统计一般以小题形式出现.《课标》文科概率的内容删去了很多,概率只占8课时,而统计占到30课时;理科的概率占20课时,而统计占到26课时.《课标》在数学能力的表述中首次提出数据处理能力.《考纲》对数据处理能力作了具体的说明:会收集数据、整理数据、分析数据,能从大量数据中抽取对研究对象有用的信息,并做出判断.数据处理能力主要依据统计或统计案例中的方法对数据进行整理、分析,并解决给定的实际问题.

所以从《课标》要求和《考纲》要求等方面来看,统计这一内容显得更为重要,考统计的解答题已成为高考的一种趋势,特别是文科.

抽样方法是统计学的基础.2001年天津卷首次考查抽样方法.《考纲》要求学生“理解”随机抽样的必要性和重要性.简单随机抽样要求的是“会用”,突出抽样的“等可能性”,与“古典概型”交汇考查较多,一般不单独考查.分层抽样和系统抽样的要求虽然是“了解”,但其方法的独特性使它成为高考的常考点.

例1(2006湖北文17)某单位最近组织了一次健身活动,活动分为登山组和游泳组,且每个职工至多参加了其中一组.在参加活动的职工中,青年人占42.5%,中年人占47.5%,老年人占10%.登山组的职工占参加活动总人数的,且该组中,青年人占50%,中年人占40%,老年人占10%.为了了解各组不同的年龄层次的职工对本次活动的满意程度,现用分层抽样的方法从参加活动的全体职工中抽取一个容量为200的样本.试确定

(Ⅰ)游泳组中,青年人、中年人、老年人分别所占的比例;

(Ⅱ)游泳组中,青年人、中年人、老年人分别应抽取的人数.

评注:本题在生活化应用的包装下,考查分层抽样知识.抽样方法考查的重点集中在分层抽样,注意其“成比例”,偶尔考查系统抽样,注意其“等距性”;在统计的解答题中,常常将抽样方法作为基础性知识先行考查,再利用所得数据考查其它知识,这种考查方式在文科试题中尤为明显.

《考纲》要求学生“了解”分布的意义和作用,会列频率分布表、会画频率分布直方图及频率折线图,“理解”它们各自的特点.图、表是数据统计分析的重要工具和手段.不同的图、表从各自的角度反映数据的特点,传递相应的统计信息.图、表的工具属性显示出其在基于“应用”的“统计”考查中不可替代的作用.2005年江西卷首次考查频率分布直方图.

例2(2010安徽文18)某市2010年4月1日―4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):

61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,

91,77,86,81,83,82,82,64,79,86,85,75,71,49,45.

(1)完成频率分布表;

(2)作出频率分布直方图;

(3)根据国家标准,污染指数在0~50之间时,空气质量为优:在51~100之间时,为良;在101~150之间时,为轻微污染;在151~200之间时,为轻度污染.

请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价.

评注:结合生活化背景考查频率分布表、频率分布直方图是高考的热点,其方式主要是理解频率分布表、频率分布直方图,并由图、表得到数据相关信息,在此基础上考查频率、频数、样本容量,并与概率或其它知识交汇考查.在频率分布表中,频数的和等于样本容量,频率的和等于1,每一小组的频率等于这一组的频数除以样本容量.频率分布直方图中,小矩形的高等于每一组的频率/组距,它们与频数成正比,小矩形的面积等于这一组的频率,各个小矩形的面积的和等于1.对于像本例第(3)问这样的开放性问题的回答,要选择适当的数据特征进行考查,根据数据特征分析得出实际问题的结论.另外,值得注意的是,频率折线图还没有在高考试题中出现.

茎叶图是新课标新增的内容,它是用来表示样本数据分布的一种方法,在样本数据较少时,用茎叶图表示数据的效果更好.2008年山东卷、海南卷首次考查茎叶图.

例3(2009安徽文17)某良种培育基地正在培育一种小麦新品种A,将其与原有的一个优良品种B进行对照试验,两种小麦各种植了25亩,所得亩产数据(单位:千克)如下:

品种A: 357,359,367,368,375,388,392,399,

400,405,412,414,415,421,423,423,427,430,430,

434,443,445,445,451,454

品种B:363,371,374,383,385,386,391,392,

394,394,395,397,397,400,401,401,403,406,407,

410,412,415,416,422,430

(1)完成所附的茎叶图;

(2)用茎叶图处理现有的数据,有什么优点?

(3)通过观察茎叶图,对品种与亩产量及其稳定性进行比较,写出统计结论.

评注:本题源于课本而高于课本,不少学生由于缺乏对这部分内容的重视,以至对相关知识一知半解,造成不必要的失分,尤其是第(2)和第(3)问.分析样本数据,得出统计结论是本题命制的出发点,也是统计学的本质.因此,基于“应用”的“统计”考查应立足于此.本题对统计的考查有良好的导向作用.

众数、中位数、平均数是初中就学习了样本数据的基本数字特征.值得注意的是,高中课本新增了从频率分布直方图中估计样本的众数、中位数、平均数.2009年海南卷首次考查从频率分布直方图中估计样本的众数、中位数、平均数.

例4(2009海南文19)某工厂有工人1000名,其中250名工人参加过短期培训(称为A类工人),另外750名工人参加过长期培训(称为B类工人).现用分层抽样方法(按A类、B类分二层)从该工厂的工人中共抽查100名工人,调查他们的生产能力(此处生产能力指一天加工的零件数).

(1)A类工人中和B类工人中各抽查多少工人;

(2)从A类工人中的抽查结果和从B类工人中的抽查结果分别如下表1和表2.

①先确定x、y,再完成频率分布直方图,就生产能力而言,A类工人中个体间的差异程度与B类工人中个体间的差异程度哪个更小?(不用计算,可通过观察直方图直接回答结论)

②分别估计A类工人和B类工人生产能力的平均数,并估计该工厂工人的生产能力的平均数(同一组中的数据用该组区间的中点值作代表).

评注:本题首次考查从频率分布直方图中估计样本的平均数,2010年辽宁卷考查了从频率分布直方图中估计样本的中位数.在频率分布直方图中样本众数的估计值是图中最高矩形的中点的横坐标;利用中位数左边和右边的直方图面积相等估计样本的中位数;样本平均数的估计值等于每个小矩形的面积乘以底边中点的横坐标之和.

极差、标准差、方差也是初中就学习了样本数据的基本数字特征,高中没有新增知识.《考纲》要求“理解”样本标准差的意义和作用,会计算数据标准差,并给出合理的解释.2002年天津南卷首次考查标准差.

例5(2011辽宁文19)某农场计划种植某种新作物,为此对这种作物的两个品种(分别称为品种甲和品种乙)进行田间试验.选取两大块地,每大块地分成n小块地,在总共2n小块地中,随机选n小块地种植品种甲,另外n小块地种植品种乙.

(1)假设n=2,求第一大块地都种植品种甲的概率;

(2)试验时每大块地分成8小块,即n=8,试验结束后得到品种甲和品种乙在各小块地上的每公顷产量(单位:kg/hm2)如下表:

分别求品种甲和品种乙的每公顷产量的样本平均数和样本方差;根据试验结果,你认为应该种植哪一品种?

评注:本题虽有生活化背景的包装,其本质还是应用有关公式计算基本数字特征(平均数和方差),是基本知识的应用,但要避免计算错误,并能根据平均数和方差,给出合理的解释.

线性回归自1999年进入高中数学选修教材、2005年进入高中数学必修教材以来,很长时间内高考数学试卷中几乎没见线性回归试题的身影.而在2007年高考结束后,关注高考的人都知道2007年广东高考数学有一道关于线性回归的解答题.2011年线性回归题更在6个省市卷中集中亮相.在此之前,大多数师生认为这部分内容即便是使用计算器,计算量也很大,更何况高考不允许使用计算器,因此这部分内容很难出考试题,所以学习线性回归时总是一带而过.导致原本简单的题目让不少考生无从下手,这不得不引起我们对这方面知识的思考、重视.

例6(2011安徽文20)某地最近十年粮食需求量逐年上升,下表是部分统计数据:

(1)利用所给数据求年需求量与年份之间的回归直线方程y=bx+a;

(2)利用(1)中所求出的直线方程预测该地2012年的粮食需求量.

评注:线性回归的常考点:

独立性检验问题是新课改中增加的内容之一,具有很强的现实背景和较强的实践性.与它有关的试题往往情景新颖,富有时代气息,贴近生活实际,加之大家对模型都非常熟悉,能充分调动学生运用数学的思想和意识,从而激发他们对生活、对数学的热爱.正因为如此,它成为近三年高考的一大“亮点”.2009年辽宁卷首次考查独立性检验.

例7(2010海南文19理19)为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:

(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例;

(2)能否有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关?

(3)根据(2)的结论,能否提出更好的调查方法来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例?说明理由.

评注:解答独立性检验问题,首先应该判断该题是不是独立性检验问题(如2010年广东卷文科第17题第(1)问就不是独立性检验问题,不少考生用了独立性检验的方法,浪费了宝贵时间),然后确定a,b,c,d,以便利用公式计算观测值(计算时应充分约分,以便减小计算量),再查表判断.常见的两种提问方式为:在犯错误的概率不超过x的前提下,能否认为“某某与某某有关”;能否有x%以上的把握认为“某某与某某有关”.

上一篇:英语高考翻译类题型解答技巧 下一篇:他为何 学是不在状态