1、课时规范练47统计模型基础巩固组1.对四组数据进行统计,获得以下散点图,关于其相关系数的比较,正确的是()A.r2r40r3r1B.r4r20r1r3C.r4r20r3r1D.r2r40r10,b0,b0C.a0,b0D.a04.为大力提倡“厉行节约,反对浪费”,某市通过随机询问100名性别不同的居民是否能做到“光盘”,得到如下的列联表:性别做不到“光盘”能做到“光盘”男4510女3015附:=P(2k)0.100.050.025k2.7063.8415.0242=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),n=a+b+c+d.参照附表,得到的正确结论是()A.在犯错误的概率不
2、超过1%的前提下认为“该市居民能否做到光盘与性别有关”B.在犯错误的概率不超过1%的前提下,认为“该市居民能否做到光盘与性别无关”C.有90%的把握认为“该市居民能否做到光盘与性别有关”D.有90%的把握认为“该市居民能否做到光盘与性别无关”5.(2021安徽合肥一模)某商场2020年部分月份销售金额如下表:月份x246810销售金额y/万元64132a286368若用最小二乘法求得回归直线方程为y=38.1x-17.6,则a=()A.198.2B.205C.211D.213.56.(多选)给出以下四个说法,其中正确的说法是()A.残差分布的带状区域的宽度越窄,R2越小B.在刻画模型的拟合效果
3、时,R2越大,说明拟合的效果越好C.在回归直线方程y=0.2x+12中,当解释变量x每增加一个单位时,响应变量y平均增加0.2个单位D.对分类变量X与Y,若它们的随机变量2的取值越小,则推断X与Y有关联时犯错误的概率越小7.(多选)某大学为了解学生对学校食堂服务的满意度,随机调查了50名男生和50名女生,每位学生对食堂的服务给出满意或不满意的评价,得到如图所示的列联表.经计算24.762,则可以推断出()性别满意不满意男3020女4010=P(2k)0.100.050.01k2.7063.8416.635A.该学校男生对食堂服务满意的概率的估计值为35B.调研结果显示,该学校男生比女生对食堂服
4、务更满意C.有95%的把握认为男、女生对该食堂服务的评价有差异D.有99%的把握认为男、女生对该食堂服务的评价有差异8.已知变量y与x线性相关,若x=5,y=50,且y关于x的回归直线的斜率为6.5,则y关于x的回归直线方程是.综合提升组9.某校团委对“学生性别和喜欢某热门软件是否有关联”进行了一次调查,其中被调查的女生人数是男生人数的12,男生喜欢该软件的人数占男生人数的16,女生喜欢该软件的人数占女生人数的23.若有95%的把握认为是否喜欢该软件和性别有关,则男生至少有()=P(2k)0.050.01k3.8416.635A.12人B.6人C.10人D.18人10.(多选)(2021河北衡
5、水月考)下图是某小区2019年12月至2020年12月间,当月在售二手房均价(单位:万元/平方米)的散点图.(图中月份代码113分别对应2019年12月2020年12月)根据散点图选择y=a+bx和y=c+dln x两个模型进行拟合,经过数据处理得到的两个回归方程分别为y=0.936 9+0.028 5x和y=0.955 4+0.030 6ln x,并得到以下一些统计量的值:回归直线方程y=0.936 9+0.028 5xy=0.955 4+0.030 6ln xR20.9230.973则下列说法正确的是()(注:x是样本数据中x的平均数,y是样本数据中y的平均数)A.当月在售二手房均价y与月
6、份代码x负相关B.由y=0.936 9+0.028 5x预测2021年3月在售二手房均价约为1.050 9万元/平方米C.曲线y=0.936 9+0.028 5x与y=0.955 4+0.030 6ln x都经过点(x,y)D.模型y=0.955 4+0.030 6ln x的拟合效果比模型y=0.936 9+0.028 5x的好11.(多选)某校计划在课外活动中新增攀岩项目,为了解学生喜欢攀岩和性别是否有关联,面向学生开展了一次随机调查,其中参加调查的男生、女生人数相同,并绘制如下等高堆积条形图,则()参考公式:2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),n=a+b+c+d
7、=P(2k)0.050.01k3.8416.635A.参与调查的学生中喜欢攀岩的男生人数比喜欢攀岩的女生人数多B.参与调查的女生中喜欢攀岩的人数比不喜欢攀岩的人数多C.若参与调查的男女生人数均为100人,则有99%把握认为喜欢攀岩和性别有关D.无论参与调查的男女生人数为多少,都有99%的把握认为喜欢攀岩和性别有关12.蟋蟀鸣叫的频率y(单位:次/分钟)与气温x(单位:)存在着较强的线性相关关系.某地研究人员根据当地的气温和蟋蟀鸣叫的频率得到了如下数据:x/21222324252627y/(次/分钟)24283139434754利用上表中的数据求得回归直线方程为y=bx+a,若利用该方程知,当该
8、地的气温为30 时,蟋蟀每分钟鸣叫次数的预测值为68,则b的值为.13.某公司为了解某产品的研发费x(单位:万元)对销售量v(单位:百件)的影响,收集了该公司以往的5组数据,发现用模型y=aekx(e为自然对数的底数)拟合比较合适.令z=ln y得到z=bx+4.06.经计算,x,z对应的数据如表所示:x58121520z=lny4.55.25.55.86.5则aek=.14.(2021全国甲,理17)甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:产品质量一级品二级品总计甲机床15050200
9、乙机床12080200总计270130400(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?(2)能否有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异?附:2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d).=P(2k)0.050.010.001k3.8416.63510.828创新应用组15.BMI指数是用体重公斤数除以身高米数的平方得出的数字,是国际上常用的衡量人体胖瘦程度以及是否健康的一个标准.对于高中男体育特长生而言,当BMI数值大于或等于20.5时,我们说体重较重,当BMI数值小于20.5时,我们说体重较轻,身高大于或等于170 cm我们说身高较高,身高
10、小于170 cm我们说身高较矮.(1)已知某高中共有32名男体育特长生,其身高与BMI指数的数据如散点图所示,请根据所得信息,完成下述列联表,并判断是否有95%的把握认为男体育特长生的身高对BMI指数有影响.体重情况身高较矮身高较高总计体重较轻体重较重总计(2)从上述32名男体育特长生中随机选取8名,其身高和体重的数据如表所示:编号12345678身高x/cm166167160173178169158173体重y/kg5758536166575066利用最小二乘法求得回归直线方程为y=0.8x-75.9.利用已经求得的回归直线方程,请完善下列残差表,并求R2(保留两位有效数字).编号12345
11、678体重y/kg5758536166575066残差e/kg0.10.30.9-1.5-0.5-2.3-0.5通过残差分析,对于残差的绝对值最大的那组数据,需要确认在数据的采集中是否有人为的错误,已知通过重新采集发现,该组数据的体重应该为58 kg.小明重新根据最小二乘法算出y=0.675x+a,请在小明所算的基础上求出男体育特长生的身高与体重的回归直线方程.参考数据:(0.1)2+(0.3)2+(0.9)2+(-1.5)2+(-0.5)2+(-2.3)2+(-0.5)2=8.95,x=168,i=18(yi-y)2=226,0.675168=113.4.参考公式:R2=1-i=1n(yi-
12、yi)2i=1n(yi-y)2,b=i=1n(xi-x)(yi-y)i=1n(xi-x)2=i=1nxiyi-nxyi=1nxi2-nx2,a=y-bx,ei=yi-bxi-a,2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),n=a+b+c+d.=P(2k)0.100.050.010.005k2.7063.8416.6357.879课时规范练47统计模型1.A解析:由给出的四组数据的散点图可以看出,r1,r3大于0,r2,r4小于0,题图1和题图2的点相对更加集中,所以r1接近于1,r2接近于-1,由此可得r2r40r3r1.故选A.2.B解析:因为相关系数的绝对值越接近1拟合
13、效果越好,由题意得r2的绝对值更接近1,所以指数函数模型拟合效果更好.故选B.3.A解析:由图表中的数据可得,变量y随着x的增大而减小,则b0,故选A.4.C解析:由题意可知2=100(4515-3010)2554575253.03.又因为查表可得P(22.706)=0.1,由于3.032.706,所以有90%的把握认为“该市居民能否做到光盘与性别有关”.故选C.5.B解析:由表格数据知x=2+4+6+8+105=6,y=64+132+a+286+3685=850+a5,则850+a5=38.16-17.6,解得a=205.故选B.6.BC解析:回归分析时,残差图中残差分布的带状区域的宽度越窄
14、,说明拟合精度越高,R2越大,故A错误;R2来刻画模型的拟合效果,R2越大,说明模型的拟合效果越好,故B正确;在回归直线方程y=0.2x+12中,当解释变量x每增加一个单位时,响应变量平均增加0.2个单位,故C正确;对分类变量X与Y,它们的随机变量2的取值越小,推断X与Y有关时犯错误的概率越大,故D错误.故选BC.7.AC解析:对于选项A,该学校男生对食堂服务满意的概率的估计值为3030+20=35,故A正确;对于选项B,该学校女生对食堂服务满意的概率的估计值为4040+10=4535,故B错误;因为24.7623.841,所以有95%的把握认为男、女生对该食堂服务的评价有差异,故C正确,D错
15、误.8.y=6.5x+17.5解析:设y关于x的回归直线方程为y=bx+a,x=5,y=50,y关于x的回归直线的斜率为6.5,a=50-6.55=17.5.y关于x的回归直线方程为y=6.5x+17.5.9.A解析:设男生人数为x,则女生人数为x2,则列联表如下:性别喜欢该软件不喜欢该软件总计男生x65x6x女生x3x6x2总计x2x3x2若有95%的把握认为是否喜欢该软件和性别有关,又查表可得P(23.841)=0.05,则23.841,即2=3x2x6x6-5x6x32xx2x2x=3x83.841,解得x10.2426.又因为x2,x3,x6,5x6为整数,所以男生至少有12人.故选A
16、.10.BD解析:对于A,散点从左下到右上分布,所以当月在售二手房均价y与月份代码x正相关,故A错误;对于B,令x=16,得y=0.936 9+0.028 516=1.050 9,所以可以预测2021年3月在售二手房均价约为1.050 9万元/平方米,故B正确;对于C,非线性回归方程的曲线不一定经过(x,y),故C错误;对于D,R2越大,拟合效果越好,由于0.9236.635,所以若参与调查的男生、女生人数均为100,则有99%的把握认为学生喜欢攀岩和性别有关,故C正确,D错误.故选AC.12.5解析:由题得x=17(21+22+23+24+25+26+27)=24,y=17(24+28+31
17、+39+43+47+54)=38,所以38=24b+a.又68=30b+a,联立得b=5.13.e4.18解析:x=5+8+12+15+205=12,z=4.5+5.2+5.5+5.8+6.55=5.5,所以5.5=b12+4.06,解得b=0.12,所以z=0.12x+4.06.所以y=e0.12x+4.06=e4.06e0.12x,所以aek=e4.06e0.12=e4.18.14.解(1)由表格数据得甲机床生产的产品中一级品的频率为150200=75%;乙机床生产的产品中一级品的频率为120200=60%.(2)由题意可知2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)=4
18、00(15080-12050)220020027013010.256.又因为查表可得P(26.635)=0.01,由于10.2566.635,所以有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异.15.解(1)体重情况身高较矮身高较高总计体重较轻61521体重较重6511总计122032经计算得到2=32(65-615)212202111=160772.13.841,所以没有95%的把握认为男体育特长生身高对BMI指数有影响.(2)对编号为8的数据e8=66-0.8173+75.9=3.5,完成残差表如下所示:编号12345678体重y/kg5758536166575066残差e/kg0.10.30.9-1.5-0.5-2.3-0.53.5i=18(yi-yi)2=(0.1)2+(0.3)2+(0.9)2+(-1.5)2+(-0.5)2+(-2.3)2+(-0.5)2+(3.5)2=21.2,R2=1-i=18(yi-yi)2i=18(yi-y)2=1-21.22260.91.由可知,第八组数据的体重应为58.由已知x=168,又因为y=18(57+58+53+61+66+57+50+58)=57.5,代入y=0.675x+a可得a=57.5-0.675168=-55.9,所以重新采集数据后,男体育特长生的身高与体重的回归直线方程为y=0.675x-55.9.