1、章末综合提升 第九章 统计 巩固层知识整合 NO.1提升层题型探究 NO.2类型1 类型2 类型3 类型1 抽样方法 1高考对抽样方法考查的热点有二:一是两种抽样方法的判断问题,这就要求熟练地掌握两种抽样方法的特征;二是关于分层随机抽样的样本容量的计算问题,特别与其他的问题结合在一起的问题要引起重视 2应用各种抽样方法抽样时要注意以下问题:(1)利用抽签法时要注意把号签放在不透明的容器中且搅拌均匀;(2)利用随机数法时注意编号位数要一致;(3)在分层随机抽样中,若在某一层按比例应该抽取的个体数不是整数,应在该层剔除部分个体,使抽取个体数为整数【例1】(1)利用简单随机抽样,从n个个体中抽取一个
2、容量为10的样本若第二次抽取时,余下的每个个体被抽到的概率为13,则在整个抽样过程中,每个个体被抽到的概率为()A14 B13 C 514 D1027(2)假设要检查某企业生产的袋装牛奶的质量是否达标,现从500袋牛奶中抽取60袋进行检验,利用随机数表抽取样本时,先将500袋牛奶按000,001,499进行编号,使用随机数表中各个5位数组的后3位,选定第7行第5组数开始,取出047作为抽取的代号(从左向右读取数字),随后抽到的5袋牛奶的号码分别是(下面摘取了某随机数表第7行至第9行)_ 84421 75331 57245 50688 77047 44767 21763 35025 83921
3、20676 63016 47859 16955 56719 98105 07185 12867 35807 44395 23879 33211(1)C(2)025,016,105,185,395(1)根据题意,9n113,解得n28 故在整个抽样过程中每个个体被抽到的概率为1028 514(2)由已知读取号码的初始值为第7行第5组数中的后3位,第一个号码为047 凡不在000499中的数跳过去不取,前面已经取过的也跳过去不取,从而随后抽到的5袋牛奶的编号为025,016,105,185,395 跟进训练 1某学校有教师200人,男学生1 200人,女学生1 000人现用分层随机抽样的方法从全体
4、师生中抽取一个容量为n的样本,若女学生一共抽取了80人,则n的值为()A193 B192 C191 D190 B 1 000n2001 2001 00080,求得n192 2某品牌白酒公司在甲、乙、丙三个地区分别有30个、120个、180个代理商公司为了调查白酒销售的情况,需从这330个代理商中抽取一个容量为11的样本,记这项调查为;在甲地区有10个特大型超市代理销售该品牌的白酒,要从中抽取7个调查其销售收入和售后服务情况,记这项调查为则完成这两项调查宜采用的抽样方法依次是_ 分层随机抽样,简单随机抽样 由于甲、乙、丙三个地区有明显差异,所以在完成时,需用分层随机抽样在甲地区有10个特大型超市
5、代理销售该品牌的白酒,没有显著差异,所以完成宜采用简单随机抽样 类型2 频率分布直方图及应用 1频率分布直方图是高考的热点之一,难度比较小,考查根据频率分布直方图读取需要的数据,能够计算数字特征以及事件的概率,进而作出相应推断 2解题常见结论:(1)频率分布直方图中横坐标表示组距,纵坐标表示频率组距,频率组距频率组距频率分布直方图中各小长方形的面积之和为1(2)频数样本量 频率,此关系式变形为 频数频率 样本量,样本量频率频数【例2】某花木公司为了调查某种树苗的生长情况,抽取了一个容量为100的样本,测得树苗的高度(cm)数据的分组及相应频数如下:107,109),3株;109,111),9株
6、;111,113),13株;113,115),16株;115,117),26株;117,119),20株;119,121),7株;121,123),4株;123,125,2株(1)列出频率分布表;(2)画出频率分布直方图;(3)据上述图表,估计数据在109,121)范围内的可能性是百分之几?解 分组频数 频率 累积频率 107,109)30.030.03 109,111)90.090.12 111,113)130.130.25 113,115)160.160.41 115,117)260.260.67 分组频数 频率 累积频率 117,119)200.200.87 119,121)70.070
7、.94 121,123)40.040.98 123,12520.021.00 合计100 1.00(2)频率分布直方图如下:(3)由上述图表可知数据落在109,121)范围内的频率为:0.940.030.91,即数据落在109,121)范围内的可能性是91%在本例中由得到的频率分布直方图估计树苗的高度(cm)的平均数 解 由频率分布直方图可得树苗的高度(cm)的平均数的估计值为 0.031080.091100.131120.161140.261160.201180.071200.041220.02124115.46(cm)跟进训练 3从某小学随机抽取100名同学,将他们的身高(单位:cm)数据
8、绘制成频率分布直方图(如图)由图中数据可知a_若要从身高在120,130),130,140),140,150三组的学生中,用分层随机抽样的方法选取18人参加一项活动,则从身高在140,150的学生中选取的人数应为_ 0.030 3 0.005100.03510a100.020100.010101,a0.030 设身高在120,130),130,140),140,150三组的学生分别有x,y,z人,则x100 0.03010,解得x30同理,y20,z10故从140,150的学生中选取的人数为10302010183 类型3 数据的集中趋势和离散程度的估计 1这类题目大多直接根据已知数字特征,如众
9、数、中位数、平均数以及方差等的意义进行计算,考查学生对样本数字特征意义的理解,难度不大 2解答这类利用数字特征估计总体的问题时要认真审题,注意平均数、标准差、最大值、中位数的定义和意义的合理运用【例3】(2019全国卷)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液,每只小鼠给服的溶液体积相同、摩尔浓度相同经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比,根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.
10、70(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表)解(1)由已知得0.70a0.200.15,故 a0.35 b10.050.150.700.10(2)甲离子残留百分比的平均值的估计值为 20.1530.2040.3050.2060.1070.054.05 乙离子残留百分比的平均值的估计值为 30.0540.1050.1560.3570.2080.156.00 跟进训练 4从某项综合能力测试中抽取100人的成绩,统计如表,则这100人成绩的标准差为()分数 54321 人数 20 10 30 30 10 A3 B
11、2 105 C3 D85 B x100409060101003,s21n(x1 x)2(x2 x)2(xn x)2 1100(2022101230121022)16010085s2 105 5甲、乙两位学生参加数学竞赛培训,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取8次,记录如下:甲:82 81 79 78 95 88 93 84;乙:92 95 80 75 83 80 90 85(1)求甲成绩的80%分位数;(2)现要从中选派一人参加数学竞赛,从统计学的角度(在平均数、方差或标准差中选两个)考虑,你认为选派哪位学生参加合适?请说明理由 解(1)把甲的成绩按照从小到大的顺序排列可得:
12、78 79 81 82 84 88 93 95 因为一共有8个数据,所以880%6.4,不是整数,所以甲成绩的80%分位数是第7个数据93(2)x甲18(7879818284889395)85,x乙18(7580808385909295)85 s2甲 18(7885)2(7985)2(8185)2(8285)2(8485)2(8885)2(9385)2(9585)235.5,s 2乙 18(7585)2(8085)2(8085)2(8385)2(8585)2(9085)2(9285)2(9585)241,x 甲x 乙,s2甲s2乙,甲的成绩较稳定,派甲参赛比较合适体验层真题感悟 NO.31 2
13、 3 4 5 6 1(2020全国卷)设一组样本数据x1,x2,xn的方差为0.01,则数据10 x1,10 x2,10 xn的方差为()A0.01B0.1 C1D10 C 由方差计算公式:x1,x2,xn的方差为s2,所以s20.01,则ax1,ax2,axn的方差为a2s2,则所求为100s21 1 2 3 4 5 6 2(2019全国卷)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分7个有效评分与9个原始评分相比,不变的数字特征是()A中位数B平均数 C方差D极差 1 2 3 4 5 6 A 记9个原始评分分
14、别为a,b,c,d,e,f,g,h,i(按从小到大的顺序排列),易知e为7个有效评分与9个原始评分的中位数,故不变的数字特征是中位数,故选A 1 2 3 4 5 6 3(2018全国卷)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如图所示的饼图:1 2 3 4 5 6 则下面结论中不正确的是()A新农村建设后,种植收入减少 B新农村建设后,其他收入增加了一倍以上 C新农村建设后,养殖收入增加了一倍 D新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半 1 2 3 4 5
15、 6 A 设新农村建设前经济收入为a,则新农村建设后经济收入为2a,则由饼图可得建设前种植收入为0.6a,其他收入为0.04a,养殖收入为0.3a,养殖收入与第三产业收入的总和为0.36a建设后种植收入为0.74a,其他收入为0.1a,养殖收入为0.6a,养殖收入与第三产业收入的总和为1.16a,所以新农村建设后,种植收入减少是错误的故选A 1 2 3 4 5 6 4(多选题)(2020新高考全国卷)我国新冠肺炎疫情进入常态化,各地有序推进复工复产,下面是某地连续11天复工复产指数折线图,下列说法正确的是()1 2 3 4 5 6 A这11天复工指数和复产指数均逐日增加 B这11天期间,复产指
16、数增量大于复工指数的增量 C第3天至第11天复工复产指数均超过80%D第9天至第11天复产指数增量大于复工指数的增量 1 2 3 4 5 6 CD 由折线图知,第1天至第2天复工指数减少,第7天至第8天复工指数减少,第10天至第11天复工指数减少,第8天至第9天复产指数减少,故A错误;由折线图知,第1天的复产指数与复工指数的差大于第11天的复产指数与复工指数的差,所以这11天期间,复产指数增量小于复工指数的增量,故B错误;由折线图知,第3天至第11天复工复产指数均超过80%,故C正确;由折线图知,第9天至第11天复产指数增量大于复工指数的增量,故D正确综上,选CD 1 2 3 4 5 6 5(
17、2020全国卷)在一组样本数据中,1,2,3,4出现的频率分别为p1,p2,p3,p4,且4i1pi1,则下面四种情形中,对应样本的标准差最大的一组是()Ap1p40.1,p2p30.4 Bp1p40.4,p2p30.1 Cp1p40.2,p2p30.3 Dp1p40.3,p2p30.2 1 2 3 4 5 6 B 对于A,当p1p40.1,p2p30.4时,随机变量X1的分布列为 X11234 P 0.1 0.4 0.4 0.1 E(X1)10.120.430.440.12.5,D(X1)(12.5)20.1(22.5)20.4(32.5)20.4(42.5)20.11.520.10.520
18、.40.520.41.520.10.65,所以 DX1 0.65 1 2 3 4 5 6 对于B,当p1p40.4,p2p30.1时,随机变量X2的分布列为 X2 1234 P 0.4 0.1 0.1 0.4 E(X2)10.420.130.140.42.5,D(X2)(12.5)20.4(22.5)20.1(32.5)20.1(42.5)20.41.520.40.520.10.520.11.520.41.85,所以DX2 1.85 1 2 3 4 5 6 对于C,当p1p40.2,p2p30.3时,随机变量X3的分布列为 X3 1234 P 0.2 0.3 0.3 0.2 E(X3)10.2
19、20.330.340.22.5,D(X3)(12.5)20.2(22.5)20.3(32.5)20.3(42.5)20.21.520.20.520.30.520.31.520.21.05,所以DX3 1.05 1 2 3 4 5 6 对于D,当p1p40.3,p2p30.2时,随机变量X4的分布列为 X4 1234 P 0.3 0.2 0.2 0.3 E(X4)10.320.230.240.32.5,D(X4)(12.5)20.3(22.5)20.2(32.5)20.2(42.5)20.31.520.30.520.20.520.21.520.31.45,所以DX4 1.45所以B中的标准差最大
20、 1 2 3 4 5 6 6(2019全国卷)某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表 y的分组0.20,0)0,0.20)0.20,0.40)0.40,0.60)0.60,0.80)企业数22453147 1 2 3 4 5 6(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表)(精确到0.01)附:748.602 1 2 3 4 5 6 解(1)根据产值增长率频数分布表得,所调查
21、的100个企业中产值增长率不低于40%的企业频率为147100 0.21 产值负增长的企业频率为 21000.02 用样本频率分布估计总体分布得这类企业中产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%1 2 3 4 5 6(2)y 1100(0.1020.10240.30530.50140.707)0.30,s2 11005i1ni(yiy)2 1100(0.40)22(0.20)22402530.202140.4027 0.026 9,1 2 3 4 5 6 s 0.029 60.02 740.17 所以,这类企业产值增长率的平均数与标准差的估计值分别为0.30,0.17 点击右图进入 章 末 综 合 测 评 谢谢观看 THANK YOU!