1、天天练 39统计案例小题狂练 小题是基础练小题提分快一、选择题1一个年级有12个班,每个班有50名同学,随机编号为150,为了了解他们的课外兴趣,要求每班编号为40的同学留下来进行问卷调查,这里运用的抽样方法是()A抽签法B分层抽样C随机数法 D系统抽样答案:D解析:根据系统抽样的定义知选D.22019云南玉溪一中模拟总体由编号为01,02,03,49,50的50个个体组成,利用随机数表(以下摘取了随机数表中第1行和第2行)选取5个个体,选取方法是从随机数表第1行的第9列和第10列数字开始由左向右读取,则选出来的第4个个体的编号为()666740671464057195861105640968
2、76832037905716001166149084451175738805905227411486A05 B09C11 D20答案:B解析:从随机数表第1行的第9列和第10列数字开始,依次是14,05,11,09,则第四个数字是09,故选B.32019贵州遵义联考某校高三年级有1 000名学生,随机编号为0001,0002,1 000.现按系统抽样方法,从中抽出200人,若0122号被抽到了,则下列编号也被抽到的是()A0927 B0834C0726 D0116答案:A解析:系统抽样就是等距抽样,被抽到的编号满足01225k,kZ.因为092701225161,故选A.42019江西九校联考
3、一组数据共有7个数,其中有10,2,5,2,4,2,还有一个数没记清,但知道这组数据的平均数、中位数、众数依次成等差数列,则这个数的所有可能值的和为()A3 B17C11 D9答案:D解析:设这个数是x,则平均数为,众数为2,若x2,则中位数为2,此时x11,若2x0,产品的生产能耗与产量成正相关,故B正确;(2.5t44.5)3.5,t3,故C错误;A产品每多生产1吨,相应的生产能耗约增加0.7吨,故D正确故选C.72019山西太原模拟已知某产品的广告费用x(单位:万元)与销售额y(单位:万元)具有线性相关关系,其统计数据如下表:x3456y25304045由上表可得线性回归方程x,据此模型
4、预测广告费用为8万元时的销售额是()参考公式:,.A59.5万元 B52.5万元C56万元 D63.5万元答案:A解析:由表可知4.5,35,所以计算得7,3.5,所以线性回归方程为7x3.5,所以广告费用为8万元时销售额的预测值为59.5万元,故选A.82019武汉调研某选手的7个得分去掉1个最高分,去掉1个最低分,剩余5个得分的平均数为91,如图,该选手的7个得分的茎叶图有一个数据模糊,无法辨认,在图中用x表示,则剩余5个得分的方差为()A. B.C6 D30答案:C解析:由茎叶图知,最低分为87分,最高分为99分依题意得,(879390910x91)91,解得x4.则剩余5个得分的方差s
5、2(8791)2(9391)2(9091)2(9491)2(9191)2(16419)6.故选C.二、非选择题92018全国卷某公司有大量客户,且不同年龄段客户对其服务的评价有较大差异为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合适的抽样方法是_答案:分层抽样解析:因为客户数量大,且不同年龄段客户对其服务的评价有较大差异,所以最合适的抽样方法是分层抽样102019山西实验中学模拟某电子产品的成本价格由两部分组成,一是固定成本,二是可变成本,为确定该产品的成本,进行5次试验,收集到的数据如表:产品数x个1020304050产品总成本(元)6
6、2a758189由最小二乘法得到回归方程0.67x54.9,则a_.答案:68解析:计算可得,30,所以0.673054.9,解得a68.112019江苏南京调研为了解某一段公路汽车通过时的车速情况,现随机抽测了通过这段公路的200辆汽车的时速,所得数据均在区间40,80中,其频率分布直方图如图所示,则在抽测的200辆汽车中,时速在区间40,60)内的汽车有_辆答案:80解析:时速在区间40,60)内的汽车有200(0.010.03)1080辆122019广东东莞模拟某班收集了50位同学的身高数据,每一个学生的性别与其身高是否高于或低于中位数的列联表如下:高于中位数低于中位数总计男20727女
7、101323总计302050为了检验性别是否与身高有关系,根据表中的数据,得到K2的观测值k4.84,因为K23.841,所以在犯错误的概率不超过_的前提下认为性别与身高有关系答案:0.05解析:由于K2的观测值k4.84,P(K23.841)0.05,在犯错误的概率不超过0.05的情况下认为性别与身高有关系课时测评 综合提能力课时练赢高分一、选择题12019桂林月考完成下列两项调查:从某社区125户高收入家庭、280户中等收入家庭、95户低收入家庭中选出100户,调查社会购买能力的某项指标;从某中学的15名艺术特长生中选出3名调查学习负担情况宜采用的抽样方法依次是()A简单随机抽样,系统抽样
8、B分层抽样,简单随机抽样C系统抽样,分层抽样D都用分层抽样答案:B解析:因为社会购买能力的某项指标受到家庭收入的影响,而社区中各个家庭收入差别明显,所以用分层抽样法;从某中学的15名艺术特长生中选出3名调查学习负担情况,个体之间差别不大,且总体和样本容量较小,所以用简单随机抽样法,故选B.22019山西长治四校联考某班组织学生参加数学测试,成绩的频率分布直方图如图,数据的分组依次为20,40),40,60),60,80),80,100若低于60分的人数是15,则该班的学生人数是()A45 B50C55 D60答案:B解析:由题图可知,数据落在20,40),40,60)内的频率为(0.0050.
9、010)200.3,该班的学生人数是50.32019吉林长春质检下面四个残差图中反映出回归模型的拟合精度较高的为()A图B图 C图D图答案:A解析:根据残差图显示的分布情况即可看出,图显示的残差点比较均匀地落在水平的带状区域中,且带状区域的宽度最窄,所以拟合精度较高,故选A.42019长春质检某学校为了制订治理学校门口上学、放学期间家长接送孩子乱停车现象的措施,对全校学生家长进行了问卷调查根据从中随机抽取的50份调查问卷,得到了如下的列联表:同意限定区域停车不同意限定区域停车合计男20525女101525合计302050则认为“是否同意限定区域停车与家长的性别有关”的把握约为()A0.1% B
10、0.5%C99.5% D99.9%附:K2,其中nabcd.P(K2k0)0.150.100.050.0250.0100.0050.001k02.0722.7063.8415.0246.6357.87910.828答案:C解析:因为K28.3337.879,所以约有99.5%的把握认为“是否同意限定区域停车与家长的性别有关”52019吉林长春质检已知某班级部分同学一次测验的成绩统计如图,则其中位数和众数分别为()A95,94 B92,86C99,86 D95,91答案:B解析:由茎叶图可知,此组数据由小到大排列依次为76,79,81,83,86,86,87,91,92,94,95,96,98,
11、99,101,103,114,共17个,故92为中位数,出现次数最多的为众数,故众数为86,故选B.62019云南曲靖月考下表是x,y的对应数据,由表中数据得线性回归方程为0.8x.那么,当x60时,相应的为()x1520253035y612142023A.38 B43C48 D52答案:B解析:由表中数据,得25,15.回归直线必过点(,),150.825,解得5,线性回归方程为0.8x5.当x60时,相应的0.860543.7.某赛季甲、乙两名篮球运动员各13场比赛得分情况用茎叶图表示如右图:根据右图,对这两名运动员的成绩进行比较,下列四个结论中不正确的是()A甲运动员得分的极差大于乙运动
12、员得分的极差B甲运动员得分的中位数大于乙运动员得分的中位数C甲运动员得分的平均值大于乙运动员得分的平均值D甲运动员的成绩比乙运动员的成绩稳定答案:D解析:根据茎叶图可知,甲运动员的13场比赛得分分别为19,18,18,26,21,20,35,33,32,30,47,41,40;乙运动员的13场比赛得分分别为17,17,19,19,22,25,26,27,29,29,30,32,33.对于A,极差是数据中最大值与最小值的差,由茎叶图中的数据可得甲运动员得分的极差为471829,乙运动员得分的极差为331716,故甲运动员得分的极差大于乙运动员得分的极差,因此A正确;对于B,甲运动员的得分从低到高
13、依次为18,18,19,20,21,26,30,32,33,35,40,41,47,处于中间的数是30,所以甲运动员得分的中位数是30,同理得乙运动员得分的中位数是26,因此甲运动员得分的中位数大于乙运动员得分的中位数,故B正确;对于C,不难得出甲运动员得分的平均值约为29.2,乙运动员得分的平均值为25,因此甲运动员得分的平均值大于乙运动员得分的平均值,故C正确;对于D,甲的方差s(1929.2)2(1829.2)2(4029.2)288.18,同理,得乙的方差s29.54,因为乙的方差小于甲的方差,所以乙运动员的成绩比甲运动员的成绩稳定,故D不正确故选D.82019河北石家庄二中模拟下列说
14、法正确的个数为()在回归分析中,可用指数系数R2的值判断模型的拟合效果,R2越大,模型的拟合效果越好在回归分析中,可用残差平方和判断模型的拟合效果,残差平方和越大,模型的拟合效果越好在回归分析中,可用相关系数r的值判断模型的拟合效果,r越大,模型的拟合效果越好在回归分析中,可用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适,带状区域的宽度越窄,说明模型的拟合精度越高A1 B2C3 D4答案:B解析:用指数系数R2的值判断模型的拟合效果,R2越大,模型的拟合效果越好,故(1)正确;可用残差平方和判断模型的拟合效果,残差平方和越小,模型的拟合效果越好,故(2
15、)不正确;可用相关系数r的值判断两个变量的相关性,|r|越大,说明相关性越强,故(3)不正确;残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适带状区域的宽度越窄,说明模型的拟合精度越高,故(4)正确综上可知有2个命题正确,故选B.二、非选择题9某班级有50名学生,现要采取系统抽样的方法在这50名学生中抽出10名学生,将这50名学生随机编号150,并分组,第一组15号,第二组610号,第十组4650号,若在第三组中抽得号码为12的学生,则在第八组中抽得号码为_的学生答案:37解析:组距为5,(83)51237.102019济南模拟2017年2月20日,摩拜单车在某市推出“做文明骑士,
16、周一摩拜单车免费骑”活动,为了解单车使用情况,记者随机抽取了五个投放区域,统计了半小时内被骑走的单车数量,绘制了如图所示的茎叶图,则该组数据的方差为_答案:4解析:由茎叶图得,该组数据分别是87,89,90,91,93,平均数是90,故方差s2(91019)4.112018全国卷下图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型根据2000年至2016年的数据(时间变量t的值依次为1,2,17)建立模型:30.413.5t;根据2010年至2016年的数据(时间变量t的值依次为1,2,
17、7)建立模型:9917.5t.(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;(2)你认为用哪个模型得到的预测值更可靠?并说明理由解析:(1)利用模型,可得该地区2018年的环境基础设施投资额的预测值为30.413.519226.1(亿元)利用模型,可得该地区2018年的环境基础设施投资额的预测值为9917.59256.5(亿元)(2)利用模型得到的预测值更可靠理由如下:(i)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y30.413.5t上下,这说明利用2000年至2016年的数据建立的线性模型不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型9917.5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型得到的预测值更可靠(ii)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型得到的预测值226.1亿元的增幅明显偏低,而利用模型得到的预测值的增幅比较合理,说明利用模型得到的预测值更可靠(以上给出了2种理由,考生答出其中任意一种或其他合理理由均可)