1、第十章统计、统计案例第一讲随机抽样知识梳理双基自测知识点一总体、个体、样本、样本容量的概念统计中所考察对象的全体构成的集合看做总体,构成总体的每个元素作为个体,从总体中抽取的_一部分个体_所组成的集合叫做样本,样本中个体的_数目_叫做样本容量知识点二简单随机抽样一般地,设一个总体含有N个个体,从中逐个_不放回_地抽取n个个体作为样本(nN),如果每次抽取时总体内的各个个体被抽到的_机会都相等_,就把这种抽样方法叫做简单随机抽样最常用的简单随机抽样的方法有两种:_抽签法_和_随机数表法_.知识点三系统抽样当总体中的个体比较多且均衡时,首先把总体分成均衡的若干部分,然后_按照预先定出的规则_,从每
2、一部分中抽取一个个体,得到所需要的样本,这种抽样方法叫做系统抽样系统抽样的步骤一般地,假设要从容量为N的总体中抽取容量为n的样本(1)先将总体的N个个体_编号_;(2)确定_分段间隔k_,对编号进行_分段_.当(n是样本容量)是整数时,取k;(3)在第1段用_简单随机抽样_确定第一个个体编号l(lk);(4)按照一定的规则抽取样本通常是将l加上间隔k得到第2个个体编号_(lk)_,再加k得到第3个个体编号_(l2k)_,依次进行下去,直到获取整个样本知识点四分层抽样一般地,在抽样时将总体分成互不交叉的层,然后按照_一定的比例_,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,
3、这种抽样方法叫做分层抽样分层抽样的应用范围:当总体是由_差异明显的几个部分_组成时,往往选用分层抽样的方法1不论哪种抽样方法, 总体中的每一个个体入样的概率都是相同的2系统抽样一般也称为等距抽样,入样个体的编号相差分段时间隔k的整数倍3分层抽样是按比例抽样,每一层入样的个体数为该层的个体数乘抽样比题组一走出误区1判断下列结论是否正确(请在括号中打“”或“”)(1)简单随机抽样是从总体中逐个不放回的抽取样本()(2)简单随机抽样每个个体被抽到的机会不一样,与先后有关()(3)系统抽样在起始部分抽样时采用简单随机抽样()(4)抽签法中,先抽的人抽中的可能性大()(5)要从1 002个学生中用系统抽
4、样的方法选取一个容量为20的样本,需要剔除2个学生,这样对被剔除者不公平()(6)分层抽样中,每个个体被抽到的可能性与层数及分层有关()题组二走进教材2(P100A组T2)某公司有员工500人,其中不到35岁的有125人,3549岁的有280人,50岁以上的有95人,为了调查员工的身体健康状况,从中抽取100名员工,则应在这三个年龄段分别抽取人数为(B)A33,34,33B25,56,19C30,40,30D30,50,20解析因为12528095255619,所以抽取人数分别为25,56,19.3(P59T2)某班共有52人,现根据学生的学号,用系统抽样的方法,抽取一个容量为4的样本,已知3
5、号,29号,42号学生在样本中,那么样本中还有一个学生的学号是(D)A10B11C12D16解析从被抽中的3名学生的学号中可以看出学号间距为13,所以样本中还有一个学生的学号是16,故选D题组三走向高考4(2018课标全国)某公司有大量客户,且不同年龄段客户对其服务的评价有较大差异为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合适的抽样方法是_分层抽样_.解析因为不同年龄段客户对其服务的评价有较大差异,所以根据三种抽样方法的特点可知最合适的抽样方法是分层抽样5(2019课标全国)某学校为了解1 000名新生的身体素质,将这些学生编号为1,2
6、,1 000,从这些新生中用系统抽样方法等距抽取100名学生进行体质测验若46号学生被抽到,则下面4名学生中被抽到的是(C)A8号学生B200号学生C616号学生D815号学生解析将1 000名学生分成100组,每组10人,则每组抽取的号码构成公差为10的等差数列an,由题意知a546,则ana5(n5)1010n4,nN*,易知只有C选项满足题意故选C考点突破互动探究考点一简单随机抽样自主练透例1 (1)(2021陕西模拟)某班级有男生20人,女生30人,从中抽取10人作为样本,其中一次抽样结果是:抽到了4名男生、6名女生,则下列命题正确的是(A)A这次抽样可能采用的是简单随机抽样B这次抽样
7、一定没有采用系统抽样C这次抽样中每个女生被抽到的概率大于每个男生被抽到的概率D这次抽样中每个女生被抽到的概率小于每个男生被抽到的概率(2)(2019山西大同)用简单随机抽样的方法从含有10个个体的总体中,抽取一个容量为3的样本,其中某一个体a“第一次被抽到”的可能性与“第二次被抽到”的可能性分别是(A)A,B,C,D,(3)(2021山西大学附中诊断)某工厂利用随机数表对生产的600个零件进行抽样测试,先将600个零件进行编号,编号分别为001,002,599,600从中抽取60个样本,如下提供随机数表的第4行到第6行:32 21 18 34 29 78 64 54 07 32 52 42 0
8、6 44 38 12 23 43 56 77 35 78 90 56 42;84 42 12 53 31 34 57 86 07 36 25 30 07 32 86 23 45 78 89 07 23 68 96 08 04;32 56 78 08 43 67 89 53 55 77 34 89 94 83 75 22 53 55 78 32 45 77 89 23 45若从表中第6行第6列开始向右依次读取3个数据,则得到的第6个样本编号(D)A522B324C535D578解析(1)利用排除法求解这次抽样可能采用的是简单随机抽样,A正确;这次抽样可能采用系统抽样,男生编号为120,女生编号为
9、2150,间隔为5,依次抽取1号,6号,46号便可,B错误;这次抽样中每个女生被抽到的概率等于每个男生被抽到的概率,C和D均错误,故选A(2)在抽样过程中,个体a每一次被抽中的概率是相等的,因为总体容量为10,故个体a“第一次被抽到”的可能性与“第二次被抽到”的可能性均为.故选A(3)从第6行第6列开始向右依次读取3个数,依次得到的样本为436,535,577,348,522,578,故选D名师点拨(1)简单随机抽样满足:抽取的个体数有限;逐个抽取;不放回抽取;等可能抽取(2)抽签法适用于总体中个体数较少的情况,随机数表法适用于总体中个体数较多的情况变式训练1(2021赣州模拟)从某班50名同
10、学中选出5人参加户外活动,利用随机数表法抽取样本时,先将50名同学按01,02,50进行编号,然后从随机数表的第1行第5列和第6列数字开始从左往右依次选取两个数字,则选出的第5个个体的编号为(A)(注:表为随机数表的第1行与第2行)0347437386369647366146986371629774246792428114572042533237321676A24B36C46D47解析由题知从随机数表的第1行第5列和第6列数字开始,由表可知依次选取43,36,47,46,24.故选A考点二系统抽样师生共研例2 (1)(2021甘肃张掖诊断)某校高三科创班共48人,班主任为了解学生高考前的心理状
11、况,将学生按1至48的学号用系统抽样方法抽取8人进行调查,若抽到的最大学号为48,则抽到的最小学号为_6_.(2)(2021安徽江淮十校联考)某校阳光心理辅导室为了解高三同学们的心理状况,将高三年级20个班依次编号为1到20,现用系统抽样的方法抽取5个班进行调查,若抽到的编号之和为50,则抽到的最大编号为(C)A14B16C18D20(3)(2021湖北模拟)将参加数学竞赛决赛的500名学生编号为:001,002,500,采用系统抽样的方法抽取一个容量为50的样本,分组后,在第一组采用简单随机抽样抽得的号码为003.这500名学生分别在三个考点考试,从001到200在第一考点,从201到355
12、在第二考点,从356到500在第三考点,则第三考点被抽中的人数为(A)A14B15C16D21解析(1)系统抽样的抽取间隔为6,则48676,则抽到的最小学号为6,故答案为6.(2)由题意组距为4,设第一组抽到的编号为x,则抽到的编号之和为x(x4)(x8)(x12)(x16)50,解得x2,故最大编号为18.(3)解法一:按照系统抽样的规则,356号在第36组且为第6位,500号在第50组,又第36组抽到的考生没在第三考点,故第三考点被抽到的人数为503614.解法二:由题意可知,将500名学生平均分成50组,每组10人,第k(kN*)组抽到的号码为10(k1)3.令35610(k1)350
13、0(kN*),解得37k50,则满足37k50的正整数k有14个,故第三考点被抽中的学生人数为14人故选A名师点拨系统抽样的特点(1)适用于元素个数很多且均衡的总体(2)各个个体被抽到的机会均等(3)总体分组后,在起始部分抽样时采用的是简单随机抽样(4)如果总体容量N能被样本容量n整除,则抽样间隔为k.如果总体容量N不能被样本容量n整除,可随机地从总体中剔除余数,然后再按系统抽样的方法抽样(5)样本容量是几就是分几段,每段抽取一个个体变式训练2(2021安徽黄山质检)某校高三(1)班共有48人,学号依次为1,2,3,48,现用系统抽样的办法抽取一个容量为6的样本已知学号为3,11,19,35,
14、43的同学在样本中,那么还有一个同学的学号应为(A)A27B26C25D24解析根据系统抽样的规则“等距离”时抽取,也就是抽取的号码差相等,根据抽出的序号可知学号之间的差为8,所以在19与35之间还有27,故选A考点三分层抽样多维探究角度1求某层入样的个体数例3 (1)(2021广西桂林、崇左、贺州联考)某校为了解学生学习的情况,采用分层抽样的方法从高一2 400人、高二2 000人、高三n人中,抽取90人进行问卷调查已知高一被抽取的人数为36,那么高三被抽取的人数为_24_.(2)(2021宁波一模)调查某高中1 000名学生的身高情况得下表,已知从这批学生中随机抽取1名学生,抽到偏矮男生的
15、概率为0.12,若用分层抽样的方法,从这些学生中随机抽取50名,问应在偏高学生中抽取_11_名.偏矮正常偏高女生/人100273y男生/人x287z解析(1)由分层抽样的知识可得9036,即n1 600,所以高三被抽取的人数为9024,应填答案24.(2)由题意可知x1 0000.12120,所以yz220.所以偏高学生占学生总数的比例为,所以抽50名应抽偏高学生5011(人)角度2求总体或样本容量例4 (1)(2021湖南模拟)某工厂甲、乙、丙三个车间生产了同一种产品,数量分别为120件,80件,60件为了解它们的产品质量是否存在显著差异,用分层抽样方法抽取了一个容量为n的样本进行调查,其中
16、从丙车间的产品中抽取了3件,则n(D)A9B10C12D13(2)(2021吴忠模拟)某中学高一年级共有学生2 400人,为了解他们的身体状况,按性别用分层抽样的方法从中抽取一个容量为80的样本,若样本中共有男生42人,则该校高一年级共有女生(D)A1 260B1 230C1 200D1 140解析(1)由分层抽样可得,解得n13.故选D(2)高一年级共有学生2 400人,按性别用分层抽样的方法从中抽取一个容量为80的样本,样本中共有男生42人,则高一年级的女生人数约为:2 4001 140.故选D角度3分层抽样与概率结合例5 (2018天津)已知某单位甲、乙、丙三个部门的员工人数分别为24,
17、16,16.现采用分层抽样的方法从中抽取7人,进行睡眠时间的调查(1)应从甲、乙、丙三个部门的员工中分别抽取多少人?(2)若抽出的7人中有4人睡眠不足,3人睡眠充足,现从这7人中随机抽取3人做进一步的身体检查()用X表示抽取的3人中睡眠不足的员工人数,求随机变量X的分布列与数学期望;()设A为事件“抽取的3人中,既有睡眠充足的员工,也有睡眠不足的员工”,求事件A发生的概率解析(1)单位甲、乙、丙三个部门的员工人数分别为24,16,16.人数比为:322,从中抽取7人,应从甲、乙、丙三个部门的员工中分别抽取3,2,2人(2)若抽出的7人中有4人睡眠不足,3人睡眠充足,现从这7人中随机抽取3人做进
18、一步的身体检查()用X表示抽取的3人中睡眠不足的员工人数,随机变量X的取值为:0,1,2,3,P(Xk),k0,1,2,3.所以随机变量的分布列为:X0123P随机变量X的数学期望E(X)0 123;()设A为事件“抽取的3人中,既有睡眠充足的员工,也有睡眠不足的员工”,设事件B为:抽取的3人中,睡眠充足的员工有1人,睡眠不足的员工有2人,事件C为:抽取的3人中,睡眠充足的员工有2人,睡眠不足的员工有1人,则:ABC,且P(B)P(X2),P(C)P(X1),故P(A)P(BC)P(X2)P(X1).所以事件A发生的概率为.名师点拨(1)分层抽样的操作步骤:将总体按一定标准进行分层;计算各层的
19、个体数与总体数的比,按各层个体数占总体数的比确定各层应抽取的样本容量;在每一层进行抽样(可用简单随机抽样或系统抽样)(2)进行分层抽样的相关计算时,常利用以下关系式巧解:;总体中某两层的个体数之比等于样本中这两层抽取的个体数之比注:分层抽样与概率相结合的题目是高考的热点,解题时先根据分层抽样确定人数,再利用古典概型求解相应的概率变式训练3(1)(角度1)(2021广东广州模拟)某公司生产A,B,C三种不同型号的轿车,产量之比依次为234,为检验该公司的产品质量,用分层抽样的方法抽取一个容量为n的样本,若样本中A种型号的轿车比B种型号的轿车少8辆,则n(B)A96B72C48D36(2)(角度2
20、)某高中计划从全校学生中按年级采用分层抽样方法抽取20名学生进行心理测试,其中高三有学生900人,已知高一与高二共抽取了14人,则全校学生的人数为(C)A2 400B2 700C3 000D3 600(3)(角度3)某中学为了更好地开展社团活动,丰富同学们的课余生活,现用分层抽样的方法从“模拟法庭”“街舞”“动漫”“话剧”四个社团中抽取若干人组成校社团指导小组,有关数据见下表:社团相关人数抽取人数模拟法庭24a街舞305动漫b4话剧12c求a,b,c的值;若从“动漫”与“话剧”社团已抽取的人中选2人担任指导小组组长,求这2人分别来自这两个社团的概率解析(1)由题意得nn8,n72,故选B(2)
21、设全校学生人数为n,由题意可知,解得n3 000,故选C(3)由表可知抽取比例为,故a4,b24,c2.设“动漫”社团的4人分别为:A1,A2,A3,A4;“话剧”社团的2人分别为:B1,B2.则从中任选2人的所有基本事件为:(A1,A2),(A1,A3),(A1,A4),(A2,A3),(A2,A4),(A3,A4),(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(A4,B1),(A4,B2),(B1,B2)共15个其中2人分别来自这两个社团的基本事件为:(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,
22、B2),(A4,B1),(A4,B2),共8个所以这2人分别来自这两个社团的概率P.名师讲坛素养提升几种常用的统计图形一、扇形图例6 在疫情防控阻击战之外,另一条战线也日渐清晰恢复经济正常运行,国人万众一心,众志成城,防控疫情、复工复产,某企业对本企业1 000名职工关于复工的态度进行调查,调查结果如图所示,则(ABD)Ax34.8B从该企业中任取一名职工,该职工是倾向于在家办公的概率为0.178C不到50名职工倾向于继续申请休假D倾向于复工后在家办公或在公司办公的职工超过600名解析对于A,x1005.117.842.334.8,A正确;对于B,倾向于在家办公的人员占比为17.8%,故对应概
23、率为0.178,B正确;对于C,倾向于继续申请休假人数为1 0005.1%51人,C错误;对于D,倾向于在家办公或在公司办公的职工人数为1 000(17.8%42.3%)601人,D正确二、条形图(柱状图)例7 (2021山东日照联考、江西南昌摸底)爱美之心,人皆有之健身减肥已成为很多肥胖者业余选择的项目为了了解运动健身减肥的效果,某健身房调查了40名肥胖者,健身之前他们的体重(单位:kg)情况如柱状图1所示,经过四个月的健身后,他们的体重情况如柱状图2所示对比健身前后,关于这40名肥胖者,下面结论不正确的是(C)A他们健身后,体重在区间90,100)内的人数增加了4个B他们健身后,体重在区间
24、100,110)内的人数没有改变C因为体重在100,110)内所占比例没有发生变化,所以说明健身对体重没有任何影响D他们健身后,原来体重在区间110,120)内的肥胖者体重都有减少解析根据给定的健身前后的体重柱状图,可得健身前体重在区间90,100)内的有4030%12人,健身后有4040%16,所以体重在区间90,100)内的人数增加了4个,所以A正确;由健身前体重在100,110)的人数为4050%20人,健身后有4050%20,所以健身前后体重在100,110)的人数不变,所以B正确;由健身前后体重在90,100)和110,120)的人数有明显变化,所以健身对体重有明显效果,所以C不正确
25、;由健身前体重在110,120)的人数为4020%8人,健身后为0人,所以原来体重在区间110,120)内的肥胖者体重都有减少,所以D正确故选C三、雷达图例8 (2021湖南湘潭高三月考)某工厂组织员工进行专业技能比赛,下图是7位评委对甲、乙两位员工评分(满分10分)的雷达图根据图中信息,下列说法正确的是(CD)A甲得分的中位数大于乙得分的中位数B甲得分的众数大于乙得分的众数C甲得分的平均数与乙得分的平均数相等D甲得分的极差小于乙得分的极差解析由雷达图可知,甲的得分从小到大排列依次是8.8,9.1,9.3,9.5,9.5,9.7,9.9;乙的得分从小到大排列依次是8.5,8.9,9.4,9.6
26、,9.6,9.8,10.甲得分的中位数为9.5,乙得分的中位数为9.6,9.59.6,故A错误;甲得分的众数为9.5,乙得分的众数9.6,9.59.6,故B错误;甲得分的平均数为9.4,乙得分的平均数 9.4,平均数相等,故C正确;甲得分的极差为9.98.81.1,乙得分的极差108.51.5,1.11.5,故D正确变式训练4(1)(多选题)(2021江苏南京调研)5G时代已经到来,5G的发展将直接带动包括运营、制造、服务在内的通信行业整体的快速发展,进而对GDP增长产生直接贡献,并通过产业间的关联效应,间接带动国民经济各行业的发展,创造出更多的经济增加值如图,某单位结合近年数据,对今后几年的
27、5G经济产岀做出预测由上图提供的信息可知(ABD)A运营商的经济产出逐年增加B设备制造商的经济产出前期增长较快,后期放缓C设备制造商在各年的总经济产出中一直处于领先地位D信息服务商与运营商的经济产岀的差距有逐步拉大的趋势(2)(2018课标全国)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:则下面结论中不正确的是(A)A新农村建设后,种植收入减少B新农村建设后,其他收入增加了一倍以上C新农村建设后,养殖收入增加了一倍D新农村建设后,养殖收入与第三产业收入的总和超过了经济收入
28、的一半(3)(2021四川成都石室中学模拟)某商家统计了去年P,Q两种产品的月销售额(单位:万元),绘制了月销售额的雷达图,图中A点表示P产品2月份销售额约为20万元,B点表示Q产品9月份销售额约为25万元根据图中信息,下面统计结论错误的是(B)AP产品的销售额极差较大BP产品销售额的中位数较大CQ产品的销售额平均值较大DQ产品的销售额波动较小解析(1)从图表中可以看出2029年、2030年信息服务商在总经济产出中处于领先地位,C错误,故选ABD(2)解法一:设建设前经济收入为a,则建设后经济收入为2a,则由饼图可得建设前种植收入为0.6a,其他收入为0.04a,养殖收入为0.3a;建设后种植收入为0.74a,其他收入为0.1a,养殖收入为0.6a,养殖收入与第三产业收入的总和为1.16a,所以新农村建设后,种植收入减少是错误的故选A解法二:因为0.60.372.所以新农村建设后,种植收入增加,而不是减少,所以A是错误的,故选A(3)据图可以看出,P产品的销售额的波动较大,Q产品的销售额的波动较小,并且Q产品的销售额只有两个月的销售额比25万元稍小,其余都在25万元至30万元之间,所以P产品的销售额的极差较大,中位数较小,Q产品的销售的平均值较大,销售的波动较小,选B