1、10.2随机抽样、统计图表考试要求1.会用简单随机抽样的方法从总体中抽取样本,了解系统抽样和分层抽样.2.理解统计图表的含义知识梳理1随机抽样(1)简单随机抽样:一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(nN),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样(2)系统抽样:当总体中的个体数目较多时,可将总体分成均衡的几个部分,然后按照事先定出的规则,从每一部分抽取一个个体得到所需要的样本,这种抽样方法叫做系统抽样(3)分层抽样:一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出
2、的个体合在一起作为样本,这种抽样方法是一种分层抽样2用样本的频率分布估计总体分布(1)在频率分布直方图中,纵轴表示频率/组距,数据落在各小组内的频率用各小长方形的面积表示各小长方形的面积的总和等于1.(2)频率分布折线图和总体密度曲线频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,即总体密度曲线(3)茎叶图茎是指中间的一列数,叶是从茎的旁边生长出来的数常用结论1简单随机抽样和分层抽样在抽样过程中每个个体被抽取的机会相等,分层抽样中各层抽样时采用简单随机抽样
3、2利用分层抽样要注意按比例抽取,若各层应抽取的个体数不都是整数,可以进行一定的技术处理,比如将结果取成整数等3频率分布直方图中纵轴上的数据是各组的频率除以组距,不要和条形图混淆思考辨析判断下列结论是否正确(请在括号中打“”或“”)(1)简单随机抽样中,每个个体被抽到的机会,与先后有关()(2)抽签法和随机数法都是简单随机抽样()(3)分层抽样中,每个个体被抽到的可能性与层数及分层有关()(4)频率分布直方图中,小长方形的面积越大,表示样本数据落在该区间的频率越大()教材改编题1从某市参加升学考试的学生中随机抽查1000名学生的数学成绩进行统计分析,在这个问题中,下列说法正确的是()A总体指的是
4、该市参加升学考试的全体学生B样本是指1000名学生的数学成绩C样本量指的是1000名学生D个体指的是1000名学生中的每一名学生答案B解析对于A,总体指的是该市参加升学考试的全体学生的数学成绩,故A错误;对于B,样本是指1000名学生的数学成绩,故B正确;对于C,样本量是1000,故C错误;对于D,个体指的是每名学生的数学成绩,故D错误2为迎接2022年杭州亚运会,亚委会采用按性别分层抽样的方法从某高校报名的200名学生志愿者中抽取30人组成亚运会志愿小组,若30人中共有男生12人,则这200名学生志愿者中女生可能有()A12人B18人C80人D120人答案D解析所抽取的30人中,男生12人,
5、则女生有18人,女生占总人数的,所以这200名志愿者中女生人数为200120.3将一个容量为n的样本分成2组,已知第一组频数为8,第二组的频率为0.80,则n为()A20B40C60D80答案B解析因为将一个容量为n的样本分成2组,第二组的频率为0.80,所以第一组的频率为10.80.2,因为第一组频数为8,所以n40.题型一抽样方法例1(1)(2019全国)某学校为了解1000名新生的身体素质,将这些学生编号为1,2,1000,从这些新生中用系统抽样方法等距抽取100名学生进行体质测验若46号学生被抽到,则下面4名学生中被抽到的是()A8号学生B200号学生C616号学生D815号学生答案C
6、解析根据题意,系统抽样是等距抽样,所以抽样间隔为10.因为46除以10余6,所以抽到的号码都是除以10余6的数,结合选项知,616号学生被抽到(2)某校高一年级1000名学生的血型情况如图所示某课外兴趣小组为了研究血型与饮食之间的关系,决定采用分层抽样的方法从中抽取一个容量为50的样本,则从高一年级A型血的学生中应抽取的人数是(图中数据:A型22%,B型28%,O型38%,AB型12%)()A11B22C110D220答案A解析由图中数据可知高一年级A型血的学生占高一年级学生总体的22%,所以抽取一个容量为50的样本,从A型血的学生中应抽取的人数是5022%11.教师备选总体由编号为00,01
7、,28,29的30个个体组成利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第6列和第7列开始由左到右依次选取两个数字则选出来的第5个个体的编号为()08422689531964509303232090256015990190252909093767071528311311650280799970801573A.19B02C11D16答案C解析从随机数表的第1行的第6列和第7列开始从左往右依次选取两个数字,得到的在0029范围之内的两位数依次是09,09,02,01,19,02,11,其中09和02各重复了一次,去掉重复的数字后,前5个编号是09,02,01,19,11,则选出来的
8、第5个个体的编号为11.思维升华(1)简单随机抽样需满足:被抽取的样本总体的个体数有限;逐个抽取;等可能抽取(2)在分层抽样中,抽样比.跟踪训练1(1)(2022南昌模拟)从编号依次为01,02,20的20人中选取5人,现从随机数表的第一行第3列和第4列数字开始,由左向右依次选取两个数字,则第五个编号为()53083395550262152702436932181826099478465887352224683748168595271413872714955656A.09B02C15D18答案A解析从随机数表的第一行第3列和第4列数字开始,依次读取08,33(舍),95(舍),55(舍),02
9、,62(舍),15,27(舍),02(舍),43(舍),69(舍),32(舍),18,18(舍),26(舍),09,则第五个编号为09.(2)某企业生产甲、乙、丙三种不同型号的产品,产品数量之比依次为235,现用分层抽样方法抽取一个容量为n的样本,样本中甲型号产品有12件,则此样本的容量为()A40B60C80D120答案B解析由题意得,总体中甲型号产品所占的比例是.因为样本中甲型号产品有12件,由于样本容量为n,则n12,解得n60.题型二统计图表例2(1)(2022蚌埠质检)自中华人民共和国成立以来,我国共进行了七次全国人口普査,下图为我国历次全国人口普査人口性别构成及总人口性别比(以女性
10、为100,男性对女性的比例)统计图,则下列说法错误的是()A近三次全国人口普查总人口性别比呈递减趋势B我国历次全国人口普查总人口数呈逐次递增C第五次全国人口普查时,我国总人口数已经突破12亿D第七次人口普查时,我国总人口性别比最高答案D解析由统计图知,近三次全国人口普查总人口性别比呈递减趋势,A正确;总人口数逐次增加,B正确;第五次全国人口普查时,我国总人口数男女均超过6亿,总人口数已经突破12亿,C正确;全国总人口性别比最高是第一次人口普查,D错误(2)某校高二年级为选拔参加数学竞赛的学生组织了一次考试,最后选出13名男生和7名女生,这20名学生的考试成绩如茎叶图所示(单位:分),学校规定:
11、成绩不低于130分的人到A班培训,低于130分的人到B班培训,如果用分层抽样的方法从到A班的人和到B班的人中共选取5人,则5人中到A班的有()A1人B2人C3人D4人答案B解析根据给定的茎叶图中的数据,高于130分的有8人,低于130分的有12人,即A班8人,B班12人,所以抽取的5人中A班有52(人)教师备选(2022邯郸模拟)构建德智体美劳全面培养的教育体系是我国教育一直以来努力的方向某中学积极响应党的号召,开展各项有益于德智体美劳全面发展的活动如图所示的是该校高三(1)、(2)班两个班级在某次活动中的德智体美劳的评价得分对照图(得分越高,说明该项教育越好)下列说法正确的是()A高三(2)
12、班五项评价得分的极差为1.5B除体育外,高三(1)班的各项评价得分均高于高三(2)班对应的得分C高三(1)班五项评价得分的平均数比高三(2)班五项评价得分的平均数要高D各项评价得分中,这两个班的体育得分相差最大答案C解析对于A,高三(2)班德智体美劳各项得分依次为9.5,9,9.5,9,8.5,所以极差为9.58.51,A错误;对于B,两班的德育分相等,B错误;对于C,高三(1)班的平均数为9.35,高三(2)班的平均数为9.1,故C正确;对于D,两班的体育分相差9.590.5,而两班的劳育得分相差9.258.50.75,两个班的劳育得分相差最大,D错误思维升华统计图表的主要应用扇形图:直观描
13、述各类数据占总数的比例;折线图:描述数据随时间的变化趋势;条形图和直方图:直观描述不同类别或分组数据的频数和频率;茎叶图:清晰显示数据的分布情况跟踪训练2(1)(2022安庆模拟)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例得到扇形统计图如图所示,则下面结论中不正确的是()A新农村建设后,种植收入略有增加B新农村建设后,其他收入增加了一倍以上C新农村建设后,养殖收入不变D新农村建设后,种植收入在经济收入中所占比重大幅下降答案C解析因为该地区经过一年的新农村建设,农村的经济收入增加了一倍,
14、不妨设建设前的经济收入为m,则建设后的经济收入为2m,A选项,从扇形统计图中可以看到,新农村建设后,种植收入比建设前增加2m37%m60%m14%,故A正确;B选项,新农村建设后,其他收入比建设前增加2m5%m4%m6%m4%,即增加了一倍以上,故B正确;C选项,养殖收入的比重在新农村建设前与建设后相同,但建设后总收入为之前的2倍,所以建设后的养殖收入也是建设前的2倍,故C错误;D选项,新农村建设后,种植收入在经济收入中所占比重由建设前的60%降为37%,故D正确(2)(2022湖北九师联盟模拟)某企业2021年12个月的收入与支出数据的折线图如图,已知:利润收入支出,根据该折线图,下列说法不
15、正确的是()A该企业2021年1月至6月的总利润低于2021年7月至12月的总利润B该企业2021年1月至6月的平均收入低于2021年7月至12月的平均收入C该企业2021年8月至12月的支出持续增长D该企业2021年11月份的月利润最大答案D解析因为图中的实线与虚线的相对高度表示当月利润由折线统计图可知1月至6月的相对高度的总量要比7月至12月的相对高度总量少,故A正确;由折线统计图可知1月至6月的收入都普遍低于7月至12月的收入,故B正确;由折线统计图可知2021年8月至12月的虚线是上升的,所以支出持续增长,故C正确;由折线统计图可知11月的相对高度比7月、8月都要小,故D错误题型三频率
16、分布直方图例3随机抽取100名学生,测得他们的身高(单位:cm),按照区间160,165),165,170),170,175),175,180),180,185分组,得到样本身高的频率分布直方图如图所示(1)求频率分布直方图中x的值及身高在170cm及以上的学生人数;(2)将身高在170,175),175,180),180,185区间内的学生依次记为A,B,C三个组,用分层抽样的方法从这三个组中抽取6人,求这三个组分别抽取的学生人数解(1)由频率分布直方图可知5(0.07x0.040.020.01)1,解得x0.06,身高在170cm及以上的学生人数为1005(0.060.040.02)60.
17、(2)A组人数为10050.0630,B组人数为10050.0420,C组人数为10050.0210,由题意可知A组抽取人数为303,B组抽取人数为202,C组抽取人数为101.教师备选对某市“四城同创”活动中800名志愿者的年龄抽样调查统计后得到频率分布直方图(如图),但是年龄组为25,30)的数据不慎丢失,则依据此图回答下列问题:(1)25,30)年龄组对应小矩形的高度是多少?(2)据此估计该市“四城同创”活动中志愿者年龄在25,35)内的人数是多少?解(1)设25,30)年龄组对应小矩形的高度为h,则5(0.01h0.070.060.02)1,解得h0.04.(2)志愿者年龄在25,35
18、)内的频率为5(0.040.07)0.55,故志愿者年龄在25,35)内的人数约为0.55800440.思维升华频率分布直方图的相关结论(1)频率分布直方图中各小长方形的面积之和为1.(2)频率分布直方图中纵轴表示,故每组样本的频率为组距,即矩形的面积(3)频率分布直方图中每组样本的频数为频率总数跟踪训练3某城市实现了市区5G信号全覆盖,为了检查网络的质量,测试人员在市区随机选取了100个地点,测试这些地点处5G网络的平均速度(单位:Mbps),测试结果整理成频数分布表如下:平均速度/Mbps500,520)520,540)540,560)560,580)580,600频数824382010(
19、1)运营商要求市区75%以上的区域5G网络的平均速度不低于540Mbps,问:该城市的5G网络是否达到该标准?(2)在网格坐标系中作出表格中这些数据的频率分布直方图解(1)5G网络平均速度在540,600的频率为0.6810.8,4月份音乐手机销售额比3月份音乐手机销售额增加了,所以不同意小刚的看法10某网络研发公司为解决各种技术问题成立了一个专业技术研发团队,该团队中数学专业毕业与物理专业毕业的人数之比为21,按分层抽样的方法从团队中随机抽取了60人进行问卷调查进行统计后将这60人按数学专业、物理专业分为两组,再将每组人员每天使用某设备进行测试的时间(单位:分钟)分为0,10),10,20)
20、,20,30),30,40),40,505组,得到如图所示的频率分布直方图(假设所抽取的人员每天使用某设备进行测试的时间均不超过50分钟)(1)求出数学专业频率分布直方图中a的值;(2)求抽取的60人中每天使用某设备进行测试的时间不少于30分钟的人数解(1)由题意得,数学专业频率分布直方图中所有组的频率和为1,则有(0.0100.0150.0300.010a)101,解得a0.035.(2)60人中数学专业人数为6040,物理专业人数为6020,则根据图中计算出的频率可得,抽取的60人中每天使用某设备进行测试的时间不少于30分钟的人数为(0.0350.010)1040(0.0200.015)1
21、02018725,即抽取的60人中每天使用某设备进行测试的时间不少于30分钟的人数为25.11某家庭去年一年的各种费用的占比如图1所示,已知去年一年“衣食住”的费用如图2所示,则该家庭去年一年的教育费用为()图1图2A2.7万元B3.12万元C3.24万元D3.6万元答案C解析由图2知,该家庭去年一年衣、食、住的开支和为1.21.82.45.4(万元),所以该家庭去年一年的总开支为18(万元),结合图1可知,该家庭去年一年的教育费用为180.183.24(万元)12电力工业是一个国家的经济命脉,它在国民经济和人民生活中占有极其重要的地位目前开发的电力主要是火电、水电、风电、核电、太阳能发电,其
22、中,水电、风电、太阳能发电属于可再生能源发电,如图所示的是2020年各电力子行业发电量及增幅的统计图,下列说法错误的是()A其中火电发电量大约占全行业发电量的71%B在火电、水电、风电、核电、太阳能发电的发电量中,比上一年增幅最大的是风电C火电、水电、风电、核电、太阳能发电的发电量的极差是7.28D以上可再生能源发电量的增幅均跑赢全行业整体增幅答案C解析对于A,0.71,A正确;对于B,由题图可知风电增幅10.50%,是最大增幅,B正确;对于C,火电、水电、风电、核电、太阳能发电的发电量的极差是5.280.145.14,C错误;对于D,全行业整体增幅为2.70%,而可再生能源发电量的增幅中,增
23、幅最低的水电为5.30%,即可再生能源发电量的增幅均跑赢全行业整体增幅,D正确13某保险公司为客户定制了5个健康险种:甲,一年期短险;乙,长期医疗保险;丙,e生保;丁,定期寿险;戊,重大疾病保险险种推出一定时间后,该保险公司对5个险种的参保客户进行抽样调查,经数据处理得出统计图如图:若用该样本估计总体,则以下四个选项不正确的是()A1829周岁人群的人均参保费用最少B30周岁以上人群占参保人群的70%C51周岁以上人群的参保人数最少D丁险种更受参保人青睐答案B解析A选项中,参保费用问题,由不同年龄人均参保费用图可知,1829周岁人群的人均参保费用最少,即A正确;B,C选项中,参保人数问题,由参
24、保人数比例图可知,30周岁以上人群占参保人群的79%,51周岁以上人群的参保人数最少,即B错误,C正确;D选项中,由参保险种比例图可知,丁险种参保比例最高,即丁险种更受参保人青睐,即D正确14某单位招聘员工,有250名应聘者参加笔试,随机抽查了其中20名应聘者的笔试试卷,统计他们的成绩(单位:分)如下表:分数段60,65)65,70)70,75)75,80)80,85)85,90)90,95人数1345322若按笔试成绩择优录取50名参加面试,可预测参加面试的分数线为_答案85分解析因为有250名应聘者参加笔试,按笔试成绩择优录取50名参加面试所以录取的比例为15.随机抽查的20名应聘者被录取
25、的人数为204.由20名应聘者的成绩表可知,被录取的4人成绩不低于85分,故可预测参加面试的分数线为85分15百年大计,教育为本十四五发展纲要中,教育作为一个专章被提出教育部发布2020年全国教育事业统计主要结果其中关于高中阶段教育(含普通高中、中等职业学校及其他适龄教育机构)近六年的在校规模与毛入学率情况图表及2020年高中阶段教育在校生结构饼图如图(名词解释:高中阶段毛入学率在校生规模适龄青少年总人数100%)下列命题中:近六年,高中阶段在校生规模与毛入学率均持续增长;近六年,高中阶段在校生规模的平均数超过4000万人;2019年,未接受高中阶段教育的适龄青少年不足420万人;2020年,
26、普通高中的在校生超过2470万人其中真命题有()ABCD答案D解析对,高中在校生人数在前四年有下降的过程,故错误;对,近六年的高中在校生总数为24037万人,平均数为4006万人以上,故正确;对,0.105469(万人),大于420万人,故错误;对,41280.6012481(万人),故正确16已知某市2021年全年空气质量等级如下表所示空气质量等级(空气质量指数(AQI)频数频率优(AQI50)8322.8%良(50AQI100)12133.2%轻度污染(100AQI150)6818.6%中度污染(150AQI200)4913.4%重度污染(200300)143.8%合计365100%202
27、1年5月和6月的空气质量指数如下:5月2408056539212645875660191625558565389901251241038189443453798162116886月63921101221021168116315876331026553385552769912712080108333573829014695选择合适的统计图描述数据,并回答下列问题:(1)分析该市2021年6月的空气质量情况;(2)比较该市2021年5月和6月的空气质量,哪个月的空气质量较好?解(1)根据该市2021年6月的空气质量指数和空气质量等级标准,可以画出该市这个月的不同空气质量等级的频数与频率分布表(如下
28、表所示)空气质量等级合计优良轻度污染中度污染重度污染严重污染天数415920030比例13.33%50%30%6.67%00100%从表中可以看出,“优”“良”的天数达19天,占了整月的63.33%,没有出现“重度污染”和“严重污染”我们还可以用条形图和扇形图对数据作出直观的描述,如图1和图2.从条形图中可以看出,前三个等级的天数占绝大多数,空气质量等级为“良”的天数最多,后三个等级的天数很少,从扇形图中可以看出,空气质量为“良”的天数占了总天数的一半,大约有三分之二为“优”“良”,少数是“中度污染”和“轻度污染”因此,整体上6月的空气质量不错图1图2我们也可以用折线图展示空气质量指数随时间的变化情况,如图3.容易发现,6月的空气质量指数在100附近波动图3(2)根据该市2021年5月的空气质量指数和空气质量等级标准,可以画出该市这个月的不同空气质量等级的频数和频率分布表(如下表所示)空气质量等级合计优良轻度污染中度污染重度污染严重污染天数321511031频率10%68%16%3%3%0100%为了便于比较,我们选用复合条形图,将两组数据同时反映到一个条形图上通过条形图中柱的高低,可以更直观地进行两个月的空气质量的比较(图4)由上表和图4可以发现,5月空气质量为“优”和“良”的总天数比6月多所以,从整体上看,5月的空气质量略好于6月,但5月有重度污染,而6月没有图4