第34讲 随机抽样与用样本估计总体

时间:2022-09-02 09:57:37

第34讲 随机抽样与用样本估计总体

考情分析

随机抽样与用样本估计总体是高考考查的热点内容,主要以选择题、填空题的形式出现,主要考查对抽样方法的理解与选择,各种统计图表的识别以及有关样本数据、数字特征的计算等.从近几年高考可以发现,本讲内容一般都设置在选择题的比较靠前的位置,一般为中等偏下题.从考查内容上看,分层抽样是高考考查的重点,单独考查以选择、填空为主,近两年和其它知识综合考查出现的成为亮点,同时应加强系统抽样的复习.统计的基本思想方法就是用样本估计总体,而用样本估计总体是高考考查的重点,频率分布直方图,频率分布表,茎叶图在高考中都有考查,特别是频率分布直方图、方差(标准差)是高考的热点.各地文、理科试题在此部分差别不是特别大,往往以姊妹题的方式呈现,或是文、理科试题完全一样.

命题特点

随机抽样与用样本估计总体是统计中的重要内容,也是高考考查的一大热点,从基础知识和基本技能的考查到与概率等其它知识的交汇考查,都体现了新课标高考对该内容的重视.新课标高考对随机抽样与用样本估计总体的考查主要体现了以下三个特点:一是覆盖面广,几乎所有的考点都有所涉及,说明该内容的任何环节都不能遗漏;二是强化应用意识,试题一般以应用题的形式呈现,重在考查应用数学的能力,而且背景熟悉,切入点实际,注重概念的形成;三是强化识图、处理数据的能力,追溯概念的形成;四是与概率等其它知识交汇考查.

1. 随机抽样重基础

随机抽样注重基础知识的考查,主要考查抽样方法的选择及抽样中的计算,题目难度一般不大.

例1 (1)总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为 ( )

[7816 6572 0802 6314 0702 4369 9728 0198\&3204 9234 4935 8200 3623 4869 6938 7481\&]

A.08 B.07 C.02 D.01

(2)采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A,编号落入区间[451,750]的人做问卷B,其余的人做问卷C.则抽到的人中,做问卷B的人数为 ( )

A.7 B.9 C.10 D.15

(3)某个年级有男生560人,女生420人,用分层抽样的方法从该年级全体学生中抽取一个容量为280的样本,则此样本中男生人数为____________.

解析 (1)从第5列和第6列选出的两位数依次为65,72,08,02,63,14,07,02,43,69,97,28,01,98,但编号必须不大于20的且不和前面重复的只能是08,02,14,07,01.

(2)采用系统抽样方法从960人中抽取32人,将整体分成32组,每组30人,即[l=30],第[k]组的号码为[(k-1)30+9],令[450≤(k-1)30+9≤750],而[k∈Z],解得[16≤k≤25],则满足[16≤k≤25]的整数[k]有10个.

(3)总体中男生与女生的比例为4[∶]3,样本中男生人数为[280×47=160].

答案 (1)D (2)C (3)160

点拨 第(1)问,如果第5次选取02时,若不考虑重复编号只计一次而计入第五次,则易选C.第(2)问考查系统抽样方法和数列项数的计算方式,要注意由系统抽样抽出的数的编号是等差数列.第(3)问考查了随机抽样中的分层抽样,也是随机抽样中常考的形式,利用总体中的个体数比,确定样本中某一个体的样本容量.

2. 用样本估计总体重视图、处理数据能力

用样本估计总体主要考查频率分布直方图和茎叶图的识图与计算,重点考查看图、识图和计算的能力,对频率分布直方图中各参数的认识,以及在统计学中样本对总体的估计作用.

例2 (1)从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图1).由图中数据可知[a=]________.若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]上的学生中选取的人数应为________.

(2)从甲、乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图2所示).设甲、乙两组数据的平均数分别为[x甲],[x乙],中位数分别为[m甲],[m乙],则 ( )

A. [x甲m乙] B. [x甲

C. [x甲>x乙,m甲>m乙] D. [x甲>x乙,m甲

解析 (1)根据频率之和等于1可知,

(0.005+0.010+0.020+a+0.035)×10=1,

解得a=0.030.

身高在[120,130),[130,140),[140,150)三组频率分别为0.3,0.2,0.1,

故三组的人数比为3[∶]2[∶]1.

用分层抽样的方法从三组选取18人参加一项活动,

则从身高在[140,150]上的学生中选取的人数应为18×[16]=3,

故答案分别为0.030和3.

(2)[x甲=116(41+43+30+30+38+22+25+27+10][+10+14+18+18+5+6+8)=34516],[x乙=116(42+43+48+31+32+34+34+38+20+22+23][+23+27+10+12+18)=45716],所以[x甲

[m甲

答案 (1)0.030 3 (2)B

备考指南

(1)本讲复习时,应准确理解三种抽样方法的定义,搞清它们之间的联系与区别,灵活选择恰当的抽样方法抽取样本.

(2)新课标高考近几年常将抽样方法与频率分布直方图、概率等相结合进行综合考查,因此,复习时要加强这方面的训练,弄清图表中有关量的含义,并从中提炼出有用的信息,为后面的概率计算打好基础.

(3)由于高考对统计考查的覆盖面广,几乎所有的统计考点都有所涉及,其中频率分布直方图、均值与方差、茎叶图是核心考点,需要好好掌握,复习时,对于统计的任何环节都不能遗漏,最主要的是掌握好统计的基础知识,适度的题量练习.

限时训练

1. 现要完成下列3项抽样调查,则较为合理的抽样方法是 ( )

①从10盒酸奶中抽取3盒进行食品卫生检查.

②东方中学共有160名教职工,其中一般教师120名,行政人员16名,后勤人员24名.为了了解教职工对学校在校务公开方面的意见,拟抽取一个容量为20的样本.

③科技报告厅有32排,每排有40个座位,有一次报告会恰好坐满了听众,报告会结束后,为了听取意见,需要请32名听众进行座谈.

A. ①简单随机抽样,②系统抽样,③分层抽样

B. ①简单随机抽样,②分层抽样,③系统抽样

C. ①系统抽样,②简单随机抽样,③分层抽样

D. ①分层抽样,②系统抽样,③简单随机抽样

2. 在120个零件中,一级品24个,二级品36个,三级品60个,用系统抽样方法从中抽取一个容量为20的样本,则三级品a被抽到的可能性为 ( )

A. [15] B. [16] C. [12] D. [13]

3. 某工厂甲、乙、丙三个车间生产了同一种产品,数量分别为120件,80件,60件.为了解它们的产品质量是否存在显著差异,用分层抽样方法抽取了一个容量为n的样本进行调查,其中从丙车间的产品中抽取了3件,则n= ( )

A.9 B.10 C.12 D.13

4. 为了检查某超市货架上的饮料是否含有塑化剂,要从编号依次为1到50的塑料瓶装饮料中抽取5瓶进行检验,用每部分选取的号码间隔一样的系统抽样方法确定所选取的5瓶饮料的编号可能是 ( )

A.5,10,15,20,25 B.2,4,8,16,32

C.1,2,3,4,5 D.7,17,27,37,47

5. 总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为 ( )

[7816 6572 0801 6314 0701 4369 9728 0298\&3204 9234 4935 8200 3623 4869 6938 7481\&]

A.08 B. 02 C.07 D.01

6. 对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是 ( )

A.46,45,56 B.46,45,53

C.47,45,56 D.45,47,53

7. 某学校随机抽取[20]个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示.以组距为[5]将数据分组成[[0,5)],[[5,10)],…,[[30,35)],[[35,40]]时,所作的频率分布直方图是 ( )

[A] [B] [C] [D]

8. 对一批产品的长度(单位:mm)进行抽样检测, 如图为检测结果的频率分布直方图. 根据标准, 产品长度在区间[20,25)上的为一等品, 在区间[15,20)和区间[25,30)上的为二等品, 在区间[10,15)和[30,35)上的为三等品. 用频率估计概率, 现从该批产品中随机抽取一件, 则其为二等品的概率为 ( )

A.0.09 B.0.20 C.0.25 D.0.45

9. 为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分值的中位数为[me],众数为[mo],平均值为[x],则 ( )

A.[me=mo=x] B.[me=mo

C.[me

10. 根据某水文观测点的历史统计数据,得到某条河流水位的频率分布直方图如图.从图中可以看出,该水文观测点平均至少一百年才遇到一次的洪水的最低水位是 ( )

A.48米 B.49米 C.50米 D.51米

11. 某单位200名职工的年龄分布情况如图,现要从中抽取40名职工作样本,用系统抽样法,将全体职工随机按1~200编号,并按编号顺序平均分为40组(1~5号,6~10号,…,196~200号).若第5组抽出的号码为22,则第8组抽出的号码应是____________.若用分层抽样方法,则40岁以下年龄段应抽取____________人.

12. 某学员在一次射击测试中射靶10次,命中环数如下:7,8,7,9,5,4,9,10,7,4.则(1)平均命中环数为_______;(2)命中环数的标准差为__________.

13. 某地有居民100000户,其中普通家庭99000户,高收入家庭1000户.从普通家庭中以简单随机抽样方式抽取990户,从高收入家庭中以简单随机抽样方式抽取100户进行调查,发现共有120户家庭拥有3套或3套以上住房,其中普通家庭50户,高收入家庭70户.依据这些数据并结合所掌握的统计知识,你认为该地拥有3套或3套以上住房的家庭所占比例的合理估计是________.

14. 为了考查某校各班参加课外书法小组的人数,在全校随机抽取5个班级,把每个班级参加该小组的人数作为样本数据.已知样本平均数为7,样本方差为4,且样本数据互相不相同,则样本数据中的最大值为____________.

15. 从高三学生中抽取50名同学参加数学竞赛,成绩的分组及各组的频数如下(单位:分):[40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100],8.

(1)列出样本的频率分布表;

(2)画出频率分布直方图;

(3)估计成绩在[60,90)上的学生比例.

16. 在数学趣味知识培训活动中,甲、乙两名学生的6次培训成绩如下茎叶图所示:

(1)从甲、乙两人中选择1人参加数学趣味知识竞赛,你会选哪位?请运用统计学的知识说明理由;

(2)从乙的6次培训成绩中随机选择2个,试求选到123分的概率.

17. 如图是某市3月1日至14日的空气质量指数趋势图,空气质量指数小于100表示空气质量优良,空气质量指数大于200表示空气重度污染,某人随机选择3月1日至3月13日中的某一天到达该市,并停留2天.

(1)求此人到达当日空气质量优良的概率;

(2)求此人在该市停留期间只有1天空气重度污染的概率;

(3)由图判断从哪天开始连续三天的空气质量指数方差最大?(结论不要求证明)

18. 为了解学生身高情况,某校以10%的比例对全校700名学生按性别进行出样检查,测得身高情况的统计图如下:

(1)估计该校男生的人数;

(2)估计该校学生身高在170~185cm之间的概率;

(3)从样本中身高在180~190cm之间的男生中任选2人,求至少有1人身高在185~190cm之间的概率.

上一篇:第30讲 抛物线 下一篇:第35讲 变量间的相关关系