1、章末综合提升 第14章 统计 巩固层知识整合 NO.1提升层题型探究 NO.2类型1类型2类型3类型 1 抽样方法 本章主要学习了两种抽样方法:简单随机抽样和分层抽样其中简单随机抽样包括抽签法和随机数表法;分层抽样又叫按比例抽样,抽样比 p样本容量n总体容量N无论哪种抽样,抽到每个个体是等可能的【例 1】某商场有四类食品,食品类别和种数见下表:类别粮食类植物油类动物性食品类果蔬类 种数40103020现从中抽取一个容量为 20 的样本进行食品安全检测,若采用分层抽样方法抽取样本,则抽取的植物油类与果蔬类食品种数之和为_ 6 因为总体的个数为 40103020100,所以根据分层抽样的定义可知,
2、抽取的植物油类食品种数为 10100202,抽取的果蔬类食品种数为 20100204,所以抽取的植物油类与果蔬类食品种数之和为 246 跟进训练 1从 30 个个体(编号为 0029)中抽取 10 个样本,现给出某随机数表的第 11 行到第 15 行(见下表),如果某人选取第 12 行的第 6列和第 7 列的数作为第一个数并且由此数向右读,则选取的前 4 个的号码分别为_ 9264 4607 2021 3920 7766 3817 3256 1640 5858 7766 3170 0500 2593 0545 5370 7814 2889 6628 6757 8231 1589 0062 00
3、47 3815 5131 8186 3709 4521 6665 5325 5383 2702 9055 7196 2172 3207 1114 1384 4359 4488 17,00,02,07 在随机数表中,将处于 0029 的号码选出,满足要求的前 4 个号码为 17,00,02,07 2利用简单随机抽样,从 n 个个体中抽取一个容量为 10 的样本若第二次抽取时,余下的每个个体被抽到的概率为13,则在整个抽样过程中,每个个体被抽到的概率为_ 514 根据题意,9n113,解得 n28 故在整个抽样过程中每个个体被抽到的概率为1028 514 类型 2 用样本的频率估计总体分布(1)频
4、率频数样本容量,已知其中任意两个量就可以求出第三个量(2)各小组的频数和等于样本容量,频率和等于 1(3)由样本的频率可估计总体的频率,从而估计出总体的频数【例 2】有 1 个容量为 100 的样本,数据(均为整数)的分组及各组的频数如下:12.5,15.5),6;15.5,18.5),16;18.5,21.5),18;21.5,24.5),22;24.5,27.5),20;27.5,30.5),10;30.5,33.5,8(1)列出样本的频率分布表;(2)画出频率直方图;(3)估计数据小于 30 的数据约占的百分比 解(1)样本的频率分布表如下:分组频数频率 12.5,15.5)60.06
5、15.5,18.5)160.16 18.5,21.5)180.18 21.5,24.5)220.22 分组频数频率 24.5,27.5)200.20 27.5,30.5)100.10 30.5,33.580.08 合计1001.00(2)频率直方图如图(3)法一:小于 30 的数据占(0.060.160.180.220.200.10)100%92%法二:因为所有组的频率之和为 1,大于 30 的数据占 0.08,故小于 30 的数据占(10.08)100%92%跟进训练3为了了解某校高三学生的视力情况,随机地抽查了该校 100 名高三学生的视力情况,得到频率直方图如图,由于不慎将部分数据丢失,
6、但知道后 5 组频数和为 62,视力在 4.6 到 4.8 之间的学生数为 a,最大频率为 0.32,则 a 的值为_ 54 4.7,4.8)之间频率为 0.32,4.6,4.7)之间频率为 10.620.050.1110.780.22 所以 a(0.220.32)10054 4为了解高中一年级学生身高情况,某校按 10%的比例对全校700 名高中一年级学生按性别进行抽样检查,测得身高频数分布表如表 1,表 2 表 1:男生身高频数分布表 身高(cm)160,165)165,170)170,175)175,180)180,185)185,190频数25141342 表 2:女生身高频数分布表
7、身高(cm)150,155)155,160)160,165)165,170)170,175)175,180 频数1712631(1)求该校男生的人数并画出频率直方图;(2)估计该校学生身高在 165 cm180 cm 的人数占总人数的百分比 解(1)样本中男生人数为 40,分层抽样比例为 10%,可得全校男生人数为 400频率直方图如图(2)由表 1、表 2 知,样本中身高在 165 cm180 cm 的学生人数为 5141363142,样本容量为 70,所以样本中学生身高在 165 cm180 cm 的频率为427035,故估计该校学生身高在 165 cm180 cm 的人数占总人数的 60
8、%类型 3 用样本的特征数估计总体的特征数 样本的特征数可分为两大类:一类是反映样本数据集中趋势的,包括众数、中位数和平均数;另一类是反映样本波动大小的,包括方差及标准差我们常通过样本的特征数估计总体的特征数【例 3】甲、乙两机床同时加工直径为 100 cm 的零件,为检验质量,各从中抽取 6 件测量,数据为 甲:99,100,98,100,100,103;乙:99,100,102,99,100,100(1)分别计算两组数据的平均数及方差;(2)根据计算结果判断哪台机床加工零件的质量更稳定 解(1)x 甲16(9910098100100103)100,x 乙16(991001029910010
9、0)100 s2甲16(99100)2(100100)2(98100)2(100100)2(100100)2(103100)273,s2乙16(99100)2(100100)2(102100)2(99100)2(100100)2(100100)21(2)两台机床所加工零件的直径的平均数相同,又 s2甲s2乙,所以乙机床加工零件的质量更稳定 跟进训练5有容量为 100 的样本,数据分组及各组的频数、频率如下:12.5,14.5),6,0.06;14.5,16.5),16,0.16;16.5,18.5),18,0.18;18.5,20.5),22,0.22;20.5,22.5),20,0.20;2
10、2.5,24.5),10,0.10;24.5,26.5,8,0.08 试估计总体的平均数 解 法一:总体的平均数约为 1100(13.56 15.516 17.518 19.522 21.52023.51025.58)19.42 故总体的平均数约为 19.42 法二:求组中值与对应频率积的和 1350.0615.50.1617.50.1819.50.2221.50.2023.50.1025.50.0819.42 故总体的平均数约为 19.42 6对甲、乙的学习成绩进行抽样分析,各抽 5 门功课,得到的观测值如下:甲6080709070 乙8060708075 问:甲、乙谁的平均成绩好?谁的各门
11、功课发展较平衡?解 甲的平均成绩为 x 甲74,乙的平均成绩为 x 乙73所以甲的平均成绩好 甲的方差是 s2甲15(14)262(4)2162(4)2104,乙的方差是 s2乙1572(13)2(3)2722256 因为 s2甲s2乙,所以乙的各门功课发展较平衡 体验层真题感悟 NO.3类型1类型2类型3类型41(多选题)(2020新高考全国卷)我国新冠肺炎疫情防控进入常态化,各地有序推进复工复产,下面是某地连续 11 天复工复产指数折线图,下列说法正确的是()5 1 2 3 4 A这 11 天复工指数和复产指数均逐日增加 B这 11 天期间,复产指数增量大于复工指数的增量 C第 3 天至第
12、 11 天复工复产指数均超过 80%D第 9 天至第 11 天复产指数增量大于复工指数的增量 5 1 2 3 4 CD 由折线图知,第 1 天至第 2 天复工指数减少,第 7 天至第8 天复工指数减少,第 10 天至第 11 天复工指数减少,第 8 天至第 9天复产指数减少,故 A 错误;由折线图知,第 1 天的复产指数与复工指数的差大于第 11 天的复产指数与复工指数的差,所以这 11 天期间,复产指数增量小于复工指数的增量,故 B 错误;由折线图知,第 3 天至第 11 天复工复产指数均超过 80%,故 C 正确;由折线图知,第 9 天至第 11 天复产指数增量大于复工指数的增量,故 D
13、正确综上,选 CD 5 1 2 3 4 2(2020天津高考)从一批零件中抽取 80 个,测量其直径(单位:mm),将所得数据分为 9 组:5.31,5.33),5.33,5.35),5.45,5.47),5.47,5.49,并整理得到如下频率直方图,则在被抽取的零件中,直径落在区间5.43,5.47)内的个数为()5 1 2 3 4 A10 B18 C20 D36 5 1 2 3 4 B 由题知5.43,5.45)与5.45,5.47)所对应的小矩形的高分别为 6.25,5.00,所以5.43,5.47)的频率为(6.255.00)0.020.225,所以直径落在区间5.43,5.47)内的
14、个数为 800.22518,故选 B 5 1 2 3 4 3(2020全国卷)设一组样本数据 x1,x2,xn 的方差为 0.01,则数据 10 x1,10 x2,10 xn的方差为()A0.01 B0.1 C1 D10 C 由方差计算公式:x1,x2,xn 的方差为 s2,所以 s20.01,则 ax1,ax2,axn 的方差为 a2s2,则所求为 100s21 5 1 2 3 4 4(2019全国卷)演讲比赛共有 9 位评委分别给出某选手的原始评分,评定该选手的成绩时,从 9 个原始评分中去掉 1 个最高分、1 个最低分,得到 7 个有效评分7 个有效评分与 9 个原始评分相比,不变的数字特征是()A中位数 B平均数 C方差 D极差 A 记 9 个原始评分分别为 a,b,c,d,e,f,g,h,i(按从小到大的顺序排列),易知 e 为 7 个有效评分与 9 个原始评分的中位数,故不变的数字特征是中位数,故选 A 5 1 2 3 4 5(2020江苏高考)已知一组数据 4,2a,3a,5,6 的平均数为 4,则 a 的值是_ 2 一组数据 4,2a,3a,5,6 的平均数为 4,则 42a(3a)5645,解得 a25 1 2 3 4 点击右图进入 章 末 综 合 测 评 谢谢观看 THANK YOU!