1、课时规范练47成对数据的统计分析基础巩固组1.对四组数据进行统计,获得以下散点图,关于其样本相关系数的比较,正确的是()A.r2r40r3r1B.r4r20r1r3C.r4r20r3r1D.r2r40r10,b0,b0C.a0,b0D.a04.(2021山东济南二模)第24届冬季奥林匹克运动会将于2022年在北京举办.为了解某城市居民对冰雪运动的关注情况,随机抽取了该市100人进行调查统计,得到如下22列联表.关注情况性别总计男女关注冰雪运动352560不关注冰雪运动152540总计5050100根据列联表可知()附:2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),n=a+b+
2、c+d.P(2k)0.100.050.01k2.7063.8416.635A.该市女性居民中大约有5%的人关注冰雪运动B.该市男性居民中大约有95%的人关注冰雪运动C.有95%的把握判断认为该市居民是否关注冰雪运动与性别有关D.有99%的把握判断认为该市居民是否关注冰雪运动与性别有关5.(2021安徽合肥一模)某商场2020年部分月份销售金额如下表:月份X246810销售金额Y/万元64132a286368若用最小二乘法求得线性回归方程为Y=38.1X-17.6,则a=()A.198.2B.205C.211D.213.56.给出以下四个说法,其中正确的说法是()A.线性回归方程适用于一切样本和
3、总体B.线性回归方程得到的值影响实际观测值C.在线性回归方程Y=0.2X+12中,当变量X每增加一个单位时,变量Y平均增加0.2个单位D.对分类变量X与Y,若它们的随机变量2的取值越小,则判断X与Y有关时的把握越大7.为了解阅读量多少与幸福感强弱之间的关系,一个调查机构根据所得到的数据,绘制了如下的22列联表(个别数据暂用字母表示):阅读量多少幸福感强弱总计幸福感强幸福感弱阅读量多m1872阅读量少36n78总计9060150计算得212.981,参照下表:P(2k)0.100.050.01k2.7063.8416.635下列选项正确的有()A.“阅读量多少与幸福感强弱无关”B.m=42C.有
4、99%的把握判断“阅读量多少与幸福感强弱有关”D.n=528.已知变量Y与X线性相关,若x=5,y=50,且Y关于X的回归直线的斜率为6.5,则Y关于X的线性回归方程是.综合提升组9.某校团委对“学生性别和喜欢某热门软件是否有关”进行了一次调查,其中被调查的女生人数是男生人数的12,男生喜欢该软件的人数占男生人数的16,女生喜欢该软件的人数占女生人数的23.若有95%的把握判断是否喜欢该软件和性别有关,则男生至少有()P(2k)0.100.050.01k2.7063.8416.635A.12人B.6人C.10人D.18人10.(2021湖南衡阳一模)5G技术的运营不仅提高了网络传输速度,更拓宽
5、了网络资源的服务范围.目前,我国加速了5G技术的融合与创新,前景美好!某手机商城统计了5个月的5G手机销量,如表所示:月份2021年3月2021年4月2021年5月2021年6月2021年7月月份编号X12345销量Y/部5295a185227若Y与X线性相关,由上表数据求得线性回归方程为Y=44X+10,则下列说法错误的是()A.5G手机的销量逐月增加,平均每个月增加约10台B.a=151C.Y与X正相关D.预计2021年9月份该手机商城的5G手机销量约为318部11.某校计划在课外活动中新增攀岩项目,为了解学生喜欢攀岩和性别是否有关,面向学生开展了一次随机调查,其中参加调查的男生、女生人数
6、相同,并绘制如下等高堆积条形图,则()参考公式:附:2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),n=a+b+c+d.P(2k)0.100.050.01k2.7063.8416.635A.参与调查的学生中喜欢攀岩的男生人数比喜欢攀岩的女生人数少B.参与调查的女生中喜欢攀岩的人数比不喜欢攀岩的人数多C.若参与调查的男生、女生人数均为100,则有99%的把握判断学生喜欢攀岩和性别有关D.无论参与调查的男生、女生人数为多少,都有99%的把握判断学生喜欢攀岩和性别有关12.蟋蟀鸣叫的频率Y(单位:次/分钟)与气温X(单位:)存在着较强的线性关系.某地研究人员根据当地的气温和蟋蟀鸣叫的
7、频率得到了如下数据:X21222324252627Y24283139434754利用上表中的数据求得线性回归方程为Y=bX+a,若利用该方程知,当该地的气温为30 时,蟋蟀每分钟鸣叫次数的估计为68,则b的值为.13.某公司为了解某产品的研发费X(单位:万元)对销售量V(单位:百件)的影响,收集了该公司以往的5组数据,发现用模型Y=aekX(e为自然对数的底数)拟合比较合适.令Z=ln Y得到Z=bX+4.06.经计算,X,Z对应的数据如表所示:X58121520Z=lnY4.55.25.55.86.5则aek=.14.甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床
8、产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:分类产品质量总计一级品二级品甲机床15050200乙机床12080200总计270130400(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?(2)能否认为甲机床的产品质量与乙机床的产品质量有差异?附:2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),n=a+b+c+d.P(2k)0.100.050.01k2.7063.8416.635创新应用组15.如图是我国2013年至2019年生活垃圾无害化处理量(单位:亿吨)的折线图.注:年份代码17分别对应年份20132019.(1)由折线图看出,可用线性
9、回归模型拟合年生活垃圾无害化处理量Y与年份代码T的关系,请用相关系数加以说明.(2)建立Y关于T的线性回归方程(系数精确到0.01),预测2021年我国生活垃圾无害化处理量.参考数据:i=17yi=9.32,i=17tiyi=40.17,i=17(yi-y)2=0.55,72.646.参考公式:相关系数r=i=1n(ti-t)(yi-y)i=1n(ti-t)2i=1n(yi-y)2,线性回归方程Y=a+bT的系数分别为:b=i=1n(ti-t)(yi-y)i=1n(ti-t)2,a=y-bt.课时规范练47成对数据的统计分析1.A解析: 由给出的四组数据的散点图可以看出,r1,r3大于0,r2
10、,r4小于0,题图1和题图2的点相对更加集中,所以r1接近于1,r2接近于-1,由此可得r2r40r3r1.故选A.2.B解析: 因为样本相关系数的绝对值越接近1拟合效果越好,由题意得r2的绝对值更接近1,所以指数函数模型拟合效果更好.故选B.3.A解析: 由图表中的数据可得,变量Y随着X的增大而减小,则b0,故选A.4.C解析: 由22列联表中的数据可得2=(3525-1525)2100604050504.1673.841,有95%的把握判断该市居民是否关注冰雪运动与性别有关.故选C.5.B解析: 由表格数据知x=2+4+6+8+105=6,y=64+132+a+286+3685=850+a
11、5,则850+a5=38.16-17.6,解得a=205.故选B.6.C解析: 样本或总体具有线性关系时,才可求线性回归方程,而且由线性回归方程得到的函数值是近似值,而非精确值,因此线性回归方程有一定的局限性,所以A,B错误;在线性回归方程Y=0.2X+12中,当变量X每增加一个单位时,变量Y平均增加0.2个单位,故C正确;对分类变量X与Y,它们的随机变量2的取值越小,判断X与Y有关时的把握越大,故D错误.故选C.7.C解析: 212.981,又12.9816.635,有99%的把握判断“阅读量多少与幸福感强弱有关”,故A错误,C正确;m+36=90,18+n=60,m=54,n=42,故B,
12、D错误,故选C.8.Y=6.5X+17.5解析: 设Y关于X的线性回归方程为Y=bX+a,x=5,y=50,Y关于X的回归直线的斜率为6.5,a=50-6.55=17.5.Y关于X的线性回归方程为Y=6.5X+17.5.9.A解析: 设男生人数为x,则女生人数为x2,则列联表如下:性别喜欢该软件不喜欢该软件总计男生x65x6x女生x3x6x2总计x2x3x2若有95%的把握判断是否喜欢该软件和性别有关,则23.841,即2=3x2x6x6-5x6x32xx2x2x=3x83.841,解得x10.2426.又因为x2,x3,x6,5x6为整数,所以男生至少有12人.故选A.10.A解析: 线性回
13、归方程为Y=44X+10,5G手机的销量逐月增加,平均每个月增加约44台,故A不正确;根据表中数据,可得x=1+2+3+4+55=3,y=443+10=142.于是,52+95+a+185+227=1425=710,即a=151,故B正确;由线性回归方程中X的系数大于0,可知Y与X正相关,且相关系数r0,故C正确;9月份时,X=7,Y=447+10=318(部),故D正确.11.C解析: 由题意设参加调查的男生、女生人数均为m,则性别喜欢攀岩不喜欢攀岩总计男生0.8m0.2mm女生0.3m0.7mm总计1.1m0.9m2m所以参与调查的学生中喜欢攀岩的男生人数比喜欢攀岩的女生人数多,参与调查的
14、女生中喜欢攀岩的人数比不喜欢攀岩的人数少,故A,B错误;计算得2=2m(0.56m2-0.06m2)21.1m0.9mmm=50m99,当m=100时,2=50m99=501009950.5056.635,所以若参与调查的男生、女生人数均为100,有99%的把握判断学生喜欢攀岩和性别有关,故C正确,D错误.故选C.12.5解析: 由题得x=17(21+22+23+24+25+26+27)=24,y=17(24+28+31+39+43+47+54)=38,所以38=24b+a.又68=30b+a,联立得b=5.13.e4.18解析: x=5+8+12+15+205=12,z=4.5+5.2+5.
15、5+5.8+6.55=5.5,所以5.5=b12+4.06,解得b=0.12,所以Z=0.12X+4.06.所以Y=e0.12X+4.06=e4.06e0.12X,所以aek=e4.06e0.12=e4.18.14.解(1)由表格数据得甲机床生产的产品中一级品的频率为150200=75%;乙机床生产的产品中一级品的频率为120200=60%.(2)2=400(15080-12050)2270130200200=40039106.635.所以有99%的把握判断甲机床的产品与乙机床的产品质量有差异.15.解(1)由折线图看出,Y与T具有很强的正相关性.理由如下:r=i=17(ti-t)(yi-y)i=17(ti-t)2i=17(yi-y)2=i=17tiyi-7tyi=17(ti-t)2i=17(yi-y)240.17-49.32270.552.892.91060.99,样本相关系数r0.99,故Y与T具有很强的正相关性.(2)b=i=17(ti-t)(yi-y)i=17(ti-t)2=i=17tiyi-7tyi=17ti2-7t22.89280.10,a=y-bt1.33-0.104=0.93,Y关于T的线性回归方程为Y=0.10T+0.93,由最小二乘法得出的线性回归方程可得0.109+0.93=1.83,故预测2021年我国生活垃圾无害化处理量为1.83亿吨.