1、第十二章统计与统计案例第一讲随机抽样与用样本估计总体练好题考点自测 1.2020全国卷,3,5分文设一组样本数据x1,x2,xn的方差为0.01,则数据10x1,10x2,10xn的方差为()A.0.01B.0.1C.1D.102.2017全国卷,2,5分文为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,xn,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是()A.x1,x2,xn的平均数B.x1,x2,xn的标准差C.x1,x2,xn的最大值D.x1,x2,xn的中位数3.2020天津,4,5分从一批零件中抽取80个,测量其直径(单位:
2、mm),将所得数据分为9组:5.31,5.33),5.33,5.35),5.45,5.47),5.47,5.49,并整理得到如图12-1-1所示的频率分布直方图,则在被抽取的零件中,直径落在区间5.43,5.47)内的个数为()图12-1-1A.10B.18C.20D.364.2021贵阳摸底测试某网站为了解某“跑团”每月跑步的平均里程,收集并整理了2019年1月至2019年11月期间该“跑团”每月跑步的平均里程(单位:公里)的数据,绘制了如图12-1-2所示的折线图.根据折线图,下列结论正确的是()图12-1-2A.月跑步平均里程的中位数为6月份对应的里程数B.月跑步平均里程逐月增加C.月跑
3、步平均里程高峰期大致在8月、9月D.1月至5月的月跑步平均里程相对于6月至11月波动性更小5.2020安徽江淮十校第一次联考某创业公司共有36名职工,为了解该公司职工的年龄构成情况,随机采访了9名职工,得到的数据(单位:岁)为36,36,37,37,44,40,43,44,43,若用样本估计总体,则年龄在(x-s,x+s)(x为平均数,s为标准差)内的人数占公司总人数的百分比是(精确到1%)()A.56%B.14%C.25%D.67%6.2021贵阳模拟图12-1-3是某赛季甲、乙两名篮球运动员9场比赛所得分数的茎叶图,则下列说法错误的是()甲乙7514220320123812680221图1
4、2-1-3A.甲所得分数的极差为22 B.乙所得分数的中位数为18C.两人所得分数的众数相等D.甲所得分数的平均数低于乙所得分数的平均数7.2020江苏,3,5分已知一组数据4,2a,3-a,5,6的平均数为4,则a的值是.8.2018全国卷,14,5分文某公司有大量客户,且不同年龄段客户对其服务的评价有较大差异.为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合适的抽样方法是.9.2019全国卷,14,5分文我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车
5、次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为.拓展变式1.2021江苏模拟为了了解某市某校不同年级的学生对垃圾分类的了解程度,拟采用分层抽样的方法,从该校三个年级的学生中抽取一个容量为320的样本进行调查.已知该校高一年级、高二年级、高三年级的人数之比为655,则应从高一年级的学生中抽取名.2.2018全国卷,19,12分文某家庭记录了未使用节水龙头50天的日用水量数据(单位:m3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:未使用节水龙头50天的日用水量频数分布表日用水量0,0.1)0.1,0.2)0.2,0.3)0.3,0.4)0.4,0.5)0.5
6、,0.6)0.6,0.7)频数13249265使用了节水龙头50天的日用水量频数分布表日用水量0,0.1)0.1,0.2)0.2,0.3)0.3,0.4)0.4,0.5)0.5,0.6)频数151310165 (1)在图12-1-6中作出使用了节水龙头50天的日用水量数据的频率分布直方图;图12-1-6 (2)估计该家庭使用节水龙头后,日用水量小于0.35 m3的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表.)3.2020全国卷,18,12分文某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该
7、地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(xi,yi)(i=1,2,20),其中xi和yi分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得i=120xi=60,i=120yi=1 200,i=120(xi-x)2=80,i=120(yi-y)2=9 000,i=120(xi-x)(yi-y)=800.(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求样本(xi,yi)(i=1,2,20)的相关系数(精确到0.01);
8、(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.附:相关系数r=i=1n(xi-x)(yi-y)i=1n(xi-x)2i=1n(yi-y)2,21.414.答 案第十二章统计与统计案例第一讲随机抽样与用样本估计总体1.C样本数据x1,x2,xn的方差为0.01,D(aX)=a2D(X),样本数据10x1,10x2,10xn的方差为1020.01=1,故选C.2.B标准差能反映一组数据的稳定程度.故选B.3.B由题知5.43,5.45)与5.45,5.47)所对应的小矩形的高分别为6.
9、25,5.00,所以5.43,5.47)的频率为(6.25+5.00)0.02=0.225,所以直径落在区间5.43,5.47)内的个数为800.225=18,故选B.4.D由折线图可知,对于A,月跑步平均里程的中位数为5月份对应的里程数,故A错误;对于B,月跑步平均里程在2月、7月、8月和11月较上月减少,故B错误;对于C,月跑步平均里程高峰期大致在9月、10月,故C错误;对于D,1月至5月的月跑步平均里程相对于6月至11月,变化比较平稳,波动性更小,故D正确.故选D.5.Ax=36+36+37+37+44+40+43+44+439=40,s2=16+16+9+9+16+0+9+16+99=
10、1009,s=103,所以年龄在(x-s,x+s)即(1103,1303)内的人数为5,5956%,故选A.6.D甲的最高分为33,最低分为11,极差为22,A正确;乙所得分数的中位数为18,B正确;甲、乙所得分数的众数都为22,C正确;甲的平均分为x甲=11+15+17+20+22+22+24+32+339=1969,乙的平均分为x乙=8+11+12+16+18+20+22+22+319=1609,甲所得分数的平均数高于乙所得分数的平均数,D错误,故选D.7.2由平均数公式可得4+2a+(3-a)+5+65=4,解得a=2.【题型风向】统计题以频率分布直方图等统计图表或平均数、方差等数字特征
11、为主要考向,本题对平均数的考查是主要考向之一.8.分层抽样因为不同年龄段的客户对公司的服务评价有较大差异,所以需按年龄进行分层抽样,这样才能了解到不同年龄段的客户对公司服务的客观评价,所以最合适的抽样方法是分层抽样.9.0.98经停该站高铁列车所有车次的平均正点率的估计值为100.97+200.98+100.9910+20+10=0.98.1.120因为该校高一年级、高二年级、高三年级的人数之比为655,所以应从高一年级的学生中抽取32066+5+5=120(名).2.(1)频率分布直方图如图D 12-1-1所示.图D 12-1-1(2)根据(1)中的频率分布直方图,知该家庭使用节水龙头50天
12、日用水量小于0.35 m3的频率为0.20.1+10.1+2.60.1+20.05=0.48,因此该家庭使用节水龙头后,日用水量小于0.35 m3的概率的估计值为0.48.(3)该家庭未使用节水龙头50天日用水量的平均数为x1=150(0.051+0.153+0.252+0.354+0.459+0.5526+0.655)=0.48.该家庭使用了节水龙头后50天日用水量的平均数为x2=150(0.051+0.155+0.2513+0.3510+0.4516+0.555)=0.35.估计该家庭使用节水龙头后,一年能节省水(0.48-0.35)365=47.45(m3).3.(1)由已知得样本平均数
13、y=120i=120yi=60,从而该地区这种野生动物数量的估计值为60200=12 000.(2)样本(xi,yi)(i=1,2,20)的相关系数r=i=120(xi-x)(yi-y)i=120(xi-x)2i=120(yi-y)2=800809000=2230.94.(3)分层抽样:根据植物覆盖面积的大小对地块分层,再对200个地块进行分层抽样.理由如下:由(2)知各样区的这种野生动物数量与植物覆盖面积有很强的正相关.由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物数量差异也很大,采用分层抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,从而可以获得该地区这种野生动物数量更准确的估计.