1、第一节随机抽样、用样本估计总体最新考纲1理解随机抽样的必要性和重要性2会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样的方法3了解分布的意义和作用,能根据频率分布表画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点4理解样本数据标准差的意义和作用,会计算数据标准差5能从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释6会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想7会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题考向预测考情分析:简单随机抽样、系统抽样、分层抽样在高考中极少单独考查,有时
2、与概率问题相结合出现在题目的已知条件中;频率分布直方图、茎叶图等统计图表属于高考的常考内容,题型多为选择题,有时也与概率相结合出现在解答题中学科素养:通过随机抽样、统计图表、数字特征考查数据分析、数学运算的核心素养积 累 必备知识基础落实赢得良好开端一、必记5个知识点1简单随机抽样(1)抽取方式:逐个不放回地抽取(2)特点:每个个体被抽到的概率相等(3)常用方法:抽签法和随机数法2分层抽样(1)在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样(2)分层抽样的应用范围当总体是由差异明显的几个部分组成时
3、,往往选用分层抽样3作频率分布直方图的步骤(1)求极差(即一组数据中最大值与最小值的差);(2)决定组距与组数;(3)将数据分组;(4)列频率分布表;(5)画频率分布直方图4频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图(2)总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线5样本的数字特征(1)众数:一组数据中出现次数最多的那个数据,叫做这组数据的众数(2)中位数:把n个数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的
4、平均数)叫做这组数据的中位数(3)平均数:把a1+a2+ann称为a1,a2,an这n个数的平均数(4)标准差与方差:设一组数据x1,x2,x3,xn的平均数为x,则这组数据的标准差和方差分别是s1nx1-x2+x2-x2+xn-x2,s21n(x1x)2(x2x)2(xnx)2.二、必明2个常用结论1必记结论(1)众数的估计值是最高矩形底边中点的横坐标(2)平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和(3)中位数的估计值的左边和右边小矩形的面积和是相等的2常用公式(1)若数据x1,x2,xn的平均数是x,则mx1a,mx2a,mxna的平均数是mxa.(2
5、)若数据x1,x2,xn的方差为s2,则ax1b,ax2b,axnb的方差为a2s2,标准差为as.三、必练4类基础题(一)判断正误1判断下列说法是否正确(请在括号中打“”或“”)(1)简单随机抽样是一种不放回抽样()(2)在抽签法中,先抽的人抽中的可能性较大()(3)一组数据的方差越大,说明这组数据的波动越大()(4)在频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间内的频率越大()(5)频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观()(6)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数的估计值()(二)教材改编2选修3P64习题T5改编某公
6、司有员工500人,其中不到35岁的有125人,3549岁的有280人,50岁及50岁以上的有95人,为了调查员工的身体健康状况,从中抽取100名员工,则应在这三个年龄段分别抽取人数为()A33,34,33 B25,56,19C20,40,30 D30,50,203必修3P71练习T1改编如图所示是一样本的频率分布直方图若样本容量为100,则样本数据在15,20内的频数是_(三)易错易混4(忽视系统抽样中可以先剔除部分个体)某学校为了解高一年级1 203名学生对某项教改试验的意见,打算从中抽取一个容量为40的样本,若采用系统抽样,则分段间隔为_5(方差的性质不熟致误)若数据x1,x2,x3,xn
7、的平均数x5,方差s22,则数据3x11,3x21,3x31,3xn1的平均数和方差分别为_(四)走进高考62021全国甲卷为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:根据此频率分布直方图,下面结论中不正确的是()A该地农户家庭年收入低于4.5万元的农户比率估计为6%B该地农户家庭年收入不低于10.5万元的农户比率估计为10%C估计该地农户家庭年收入的平均值不超过6.5万元D估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间提 升 关键能力考点突破掌握类题通法考点一抽样方法基础性1利用简单随机抽样,从n个个体
8、中抽取一个容量为10的样本若第二次抽取时,余下的每个个体被抽到的概率为13,则在整个抽样过程中,每个个体被抽到的概率为()A14B13C514D102722022漳州质检某公司决定利用随机数表对今年新招聘的800名员工进行抽样调查他们对目前工作的满意程度,先将这800名员工进行编号,编号分别为001,002,799,800,从中抽取80名进行调查,下面提供随机数表的第4行到第6行:32 21 18 34 2978 64 54 07 3252 42 06 44 3812 23 43 56 7735 78 90 56 4284 42 12 53 3134 57 86 07 3625 30 07 3
9、2 8623 45 78 89 0723 68 96 08 0432 56 78 08 4367 89 53 55 7734 89 94 83 7522 53 55 78 3243 77 89 23 45若从表中第5行第6列开始向右依次读取3个数据,则抽到的第5名员工的编号是()A007 B253 C328 D73632022蚌埠模拟某市小学,初中,高中在校学生人数分别为7.5万,4.5万,3万为了调查全市中小学生的体质健康状况,拟随机抽取1 000人进行体质健康检测,则应抽取的初中生人数为()A750 B500 C450 D300反思感悟1应用随机数法的两个关键点(1)确定以表中的哪个数(哪
10、行哪列)为起点,以哪个方向为读数的方向;(2)读数时注意结合编号特点进行读取若编号为两位数字,则两位两位地读取;若编号为三位数字,则三位三位地读取,有超过总体号码或出现重复号码的数字舍去,这样继续下去,直到获取整个样本2解决分层抽样的常用公式先确定抽样比,然后把各层个体数乘以抽样比,即得各层要抽取的个体数(1)抽样比样本容量总体容量各层样本容量各层个体总量;(2)层1的容量层2的容量层3的容量样本中层1的容量样本中层2的容量样本中层3的容量考点二统计图表及应用基础性、应用性、创新性角度1扇形图例1全国卷某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番为更好地了解该地区农村的经济收
11、入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼状图:则下面结论中不正确的是()A新农村建设后,种植收入减少B新农村建设后,其他收入增加了一倍以上C新农村建设后,养殖收入增加了一倍D新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半听课笔记:角度2折线图例2空气质量指数AQI是反映空气状况的指数,AQI指数值越小,表明空气质量越好,其对应关系如下表:AQI指数05051100101150151200201300300空气质量优良轻度污染中度污染重度污染严重污染下图是某市10月1日20日AQI指数变化趋势,则下列叙述不正确的是()A这20天中AQI指数值的中位
12、数略高于100B这20天中的中度污染及以上的天数占14C该市10月的前半个月的空气质量越来越好D总体来说,该市10月上旬的空气质量比中旬的好听课笔记:角度3茎叶图例32022广东广雅中学、江西南昌二中联考某市重点中学奥数培训班共有14人,分为两个小组,在一次阶段考试中两个小组成绩的茎叶图如图所示,其中甲组学生成绩的平均数是88,乙组学生成绩的中位数是89,则mn的值是()A.10B11C12D13听课笔记:角度4频率分布直方图例42022长沙市统一模拟考试某学校对本校高三500名学生的视力进行了一次调查,随机抽取了100名学生的体检表,得到的频率分布直方图如图所示,若频率分布直方图后四组的频数
13、成等差数列,则估计本校高三这500名学生中视力在4.8以上(含4.8)的人数为()A185 B180 C195 D200听课笔记:反思感悟(1)通过扇形统计图可以很清楚地表示出各部分数量同总数之间的关系(2)折线图可以显示随时间(根据常用比例放置)而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的趋势(3)由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失,第二点是茎叶图便于记录和表示其缺点是当样本容量较大时,作图较烦琐(4)准确理解频率分布直方图的数据特点:频率分布直方图中纵轴上的数据是各组的频率除
14、以组距的结果,不要误以为纵轴上的数据是各组的频率,不要和条形图混淆频率分布直方图中各小长方形的面积之和为1,这是解题的关键,常利用频率分布直方图估计总体分布【对点训练】1已知我市某居民小区户主人数和户主对户型结构的满意率分别如图1和图2所示,为了解该小区户主对户型结构的满意程度,用分层抽样的方法抽取30%的户主进行调查,则样本容量和抽取的户主对四居室满意的人数分别为()A240,18 B200,20C240,20 D200,1822022德州模拟港珠澳大桥于2018年10月2日正式通车,它是中国境内一座连接香港、珠海和澳门的桥隧工程,桥隧全长55千米桥面为双向六车道高速公路,大桥通行限速100
15、 km/h,现对大桥某路段上1 000辆汽车的行驶速度进行抽样调查画出频率分布直方图(如图),根据直方图估计在此路段上汽车行驶速度在区间85,90)的车辆数和行驶速度超过90 km/h的频率分别为()A300,0.25 B300,0.35C60,0.25 D60,0.353某院校教师情况如下表所示: 类别年度老年中年青年男女男女男女202012060240120100402021210403202002001202022300150400270320280关于2020年、2021年、2022年这3年该院校的教师情况,下面说法不正确的是()A2021年男教师最多B该校教师最多的是2022年C20
16、21年中年男教师比2020年多80人D2020年到2022年,该校青年年龄段的男教师人数增长率为220%4某调查机构对全国互联网行业进行调查统计,得到整个互联网行业从业者年龄分布饼状图、90后从事互联网行业者岗位分布条形图,则下列结论中不正确的是()注:90后指1990年及以后出生,80后指19801989年之间出生,80前指1979年及以前出生A互联网行业从业人员中90后占一半以上B互联网行业中从事技术岗位的人数超过总人数的20%C互联网行业中从事运营岗位的人数90后比80前多D.互联网行业中从事技术岗位的人数90后比80后多考点三用样本的数字特征估计总体的数字特征应用性、创新性 例5202
17、0全国卷某厂接受了一项加工业务,加工出来的产品(单位:件)按标准分为A,B,C,D四个等级加工业务约定:对于A级品、B级品、C级品,厂家每件分别收取加工费90元,50元,20元;对于D级品,厂家每件要赔偿原料损失费50元该厂有甲、乙两个分厂可承接加工业务甲分厂加工成本费为25元/件,乙分厂加工成本费为20元/件厂家为决定由哪个分厂承接加工业务,在两个分厂各试加工了100件这种产品,并统计了这些产品的等级,整理如下:甲分厂产品等级的频数分布表等级ABCD频数40202020乙分厂产品等级的频数分布表等级ABCD频数28173421(1)分别估计甲、乙两分厂加工出来的一件产品为A级品的概率;(2)
18、分别求甲、乙两分厂加工出来的100件产品的平均利润,以平均利润为依据,厂家应选哪个分厂承接加工业务?听课笔记:反思感悟利用样本的数字特征解决优化决策问题的依据(1)平均数反映了数据取值的平均水平;标准差、方差描述了一组数据围绕平均数波动的大小标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定(2)用样本估计总体就是利用样本的数字特征来描述总体的数字特征【对点训练】2021全国甲卷某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:旧设备9.810.310.0
19、10.29.99.810.010.110.29.7新设备10.110.410.110.010.110.310.610.510.410.5旧设备和新设备生产产品的该项指标的样本平均数分别记为x和y,样本方差分别记为s12和s22.(1)求x,y,s12 ,s22;(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果y-x2s12+s22 10,则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高)微专题38 读取统计图表中的数据数据分析数据分析是指针对研究对象获得相关数据,运用统计方法对数据中的有用信息进行分析和推断,形成知识的过程主要包括:收集数据,整理
20、数据,提取信息,构建模型对信息进行分析、推断,获得结论例2022武汉调研测试某学校为了了解本校学生的上学方式,在全校范围内随机抽查部分学生,了解到上学方式主要有:A结伴步行,B自行乘车,C家人接送,D其他方式,并将收集的数据整理绘制成如下两幅不完整的统计图请根据图中信息,求本次抽查的学生中A类人数是()A30B40C42D48解析:由条形统计图知,B自行乘车上学的有42人,C家人接送上学的有30人,D其他方式上学的有18人,采用B,C,D三种方式上学的共90人,设A结伴步行上学的有x人,由扇形统计图知,A结伴步行上学与B自行乘车上学的学生占60%,所以x+42x+9060100,解得x30.答
21、案:A名师点评本例由条形图可以读出频数,由扇形图可读出频率,从而问题即可解决第十一章统计与统计案例第一节随机抽样、用样本估计总体积累必备知识三、1答案:(1)(2)(3)(4)(5)(6)2解析:因为12528095255619,所以抽取人数分别为25,56,19.答案:B3解析:因为15,20对应的小矩形的面积为10.0450.150.3,所以样本落在15,20内的频数为0.310030.答案:304解析:1 203除以40不是整数,先随机的去掉3个人,再除以40,得到每一段有30个人,则分段的间隔为30.答案:305解析:x1,x2,x3,xn的平均数为5,x1+x2+x3+xnn5,3x
22、1+3x2+3x3+3xnn135116,x1,x2,x3,xn的方差为2,3x11,3x21,3x31,3xn1的方差是32218.答案:16186解析:对于A:根据频率分布直方图知该地农户家庭年收入低于4.5万元的农户比率估计为(0.020.04)10.06,正确;对于B:根据频率分布直方图知该地农户家庭年收入不低于10.5万元的农户比率估计为(0.040.020.020.02)10.10,正确;对于C:根据频率分布直方图知该地农户家庭年收入的平均值估计为30.0240.0450.1060.1470.2080.2090.10100.10110.04120.02130.02140.027.6
23、8(万元),错误;对于D:根据频率分布直方图知该地农户家庭年收入介于4.5万元至8.5万元之间的农户比率估计为(0.100.140.200.20)10.64,正确答案:C提升关键能力考点一1解析:根据题意,9n-113,解得n28.故在整个抽样过程中每个个体被抽到的概率为1028514.答案:C2解析:由题意知,前五名员工的编号依次为253,313,457,736,007.答案:A3解析:初中生抽取的人数为1 0007.5+4.5+34.5300.答案:D考点二例1解析:设新农村建设前,农村的经济收入为a,则新农村建设后,农村经济收入为2a.新农村建设前后,各项收入的对比如下表:新农村建设前新
24、农村建设后新农村建设后变化情况结论种植收入60%a37%2a74%a增加A错其他收入4%a5%2a10%a增加一倍以上B对养殖收入30%a30%2a60%a增加了一倍C对养殖收入第三产业收入(30%6%)a36%a(30%28%)2a116%a超过经济收入2a的一半D对答案:A例2解析:A项,由题图知排序后第10个数据、第11个数据的平均数大于100,即中位数略高于100;B项,中度污染及以上的天数为5天,占14;由题图知C错误;D项,总体来说,该市10月上旬的空气质量比中旬的空气质量好答案:C例3解析:甲组学生成绩的平均数是88,由茎叶图可知788684889590m92887,m3,乙组学
25、生成绩的中位数是89,n9,mn12.答案:C例4解析:由题意得频率分布直方图前三组的频率依次为0.03,0.07,0.27,所以前三组的频数依次为3,7,27,则后四组的频数和为90,又后四组的频数成等差数列,所以后四组的频数依次为27,24,21,18,所以视力在4.8以上(含4.8)的频率为39%,故本校高三这500名学生中视力在4.8以上(含4.8)的人数约为50039%195.答案:C对点训练1解析:样本容量n(250150400)30%240,抽取的户主对四居室满意的人数为15030%40%18.答案:A2解析:由频率分布直方图得在此路段上汽车行驶速度在区间85,90)的频率为0.
26、0650.3,在此路段上汽车行驶速度在区间85,90)的车辆数为0.31 000300,行驶速度超过90 km/h的频率为(0.050.02)50.35.答案:B3解析:由题意知,2022年的男教师最多,A错误;将表中各年度人数横向求和可知,2022年共有1 720人,为人数最多的一年,B正确;2021年中年男教师比2020年多32024080(人),故C正确;20202022青年男教师增加了220人,增长率为220100100%220%,D正确答案:A4解析:由饼状图可知互联网从业人员中90后占56%,一半以上,故A项正确;由条形图知,90后从事技术岗位的人数占互联网行业为39.6%56%2
27、2.176%20%,所以互联网行业中从事技术岗位的人数占总人数的百分比大于等于22.176%,B项正确;由条形图知,90后从事运营岗位的人数占互联网行业为17%56%9.52%,大于80前互联网从业人数,C项正确;因为技术所占比例80后未知,且90后从事技术岗位的人数比22.176%41%,所以D项不一定正确答案:D考点三例5解析:(1)由试加工产品等级的频数分布表知,甲分厂加工出来的一件产品为A级品的概率的估计值为401000.4;乙分厂加工出来的一件产品为A级品的概率的估计值为281000.28. (2)由数据知甲分厂加工出来的100件产品利润的频数分布表为利润6525575频数40202
28、020因此甲分厂加工出来的100件产品的平均利润为6540+2520-520-752010015.由数据知乙分厂加工出来的100件产品利润的频数分布表为利润7030070频数28173421因此乙分厂加工出来的100件产品的平均利润为7028+3017+034-702110010.比较甲、乙两分厂加工的产品的平均利润,应选甲分厂承接加工业务对点训练解析:(1)由表格中的数据易得:x-0.2+0.3+0+0.2-0.1-0.2+0+0.1+0.2-0.31010.010.0,y0.1+0.4+0.1+0+0.1+0.3+0.6+0.5+0.4+0.51010.010.3,s12110(9.710.0)22(9.810.0)2(9.910.0)22(10.010.0)2(10.110.0)22(10.210.0)2(10.310.0)20.036,s22110(10.010.3)23(10.110.3)2(10.310.3)22(10.410.3)22(10.510.3)2(10.610.3)20.04.(2)由(1)中数据可得y-x10.310.00.3,而2 S12+S221025s12+s22 0.030 4,显然有y-x2 S12+S2210成立,所以认为新设备生产产品的该项指标的均值较旧设备有显著提高