1、考点规范练49相关性、最小二乘估计与统计案例考点规范练A册第38页基础巩固组1.根据如下样本数据x345678y4.02.5-0.50.5-2.0-3.0得到的回归方程为y=bx+a,则() A.a0,b0B.a0,b0C.a0D.a0,b0答案:B解析:由表中数据画出散点图,如图,由散点图可知b0,选B.2.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是()A.若2的观测值为6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99个患有肺病B.由独立性检验知,有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患肺病C.若统计量中
2、求出有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误D.以上三种说法都不正确答案:C解析:独立性检验只表明两个分类变量的相关程度,而不是事件是否发生的概率估计.3.(2015湖北七市联考)为研究语文成绩和英语成绩之间是否具有线性相关关系,统计两科成绩得到如图所示的散点图(两坐标轴单位长度相同),用回归直线y=bx+a近似地刻画其相关关系,根据图形,以下结论最有可能成立的是()A.线性相关关系较强,b的值为3.25B.线性相关关系较强,b的值为0.83C.线性相关关系较强,b的值为-0.87D.线性相关关系太弱,无研究价值答案:B解析:依题意,注意到题中的相关的点均集中在
3、某条直线的附近,且该直线的斜率小于1,结合各选项知,故选B.4.(2015山东东营二模)某商品的销售量y(件)与销售价格x(元/件)存在线性相关关系,根据一组样本数据(xi,yi)(i=1,2,n),用最小二乘法建立的回归方程为y=-10x+200,则下列结论正确的是()A.y与x具有正的线性相关关系B.若r表示变量y与x之间的线性相关系数,则r=-10C.当销售价格为10元时,销售量为100件D.当销售价格为10元时,销售量为100件左右答案:D解析:当销售价格为10元时,y=-1010+200=100,即销售量为100件左右.5.2016年春节期间,“厉行节约,反对浪费”之风悄然吹开,某市
4、通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:做不到“光盘”能做到“光盘”男4510女3015则下面的正确结论是()A.有90%的把握认为“该市居民能否做到光盘与性别有关”B.有99%的把握认为“该市居民能否做到光盘与性别无关”C.有99%的把握认为“该市居民能否做到光盘与性别有关”D.有90%的把握认为“该市居民能否做到光盘与性别无关”答案:A解析:由22列联表得到a=45,b=10,c=30,d=15,则a+b=55,c+d=45,a+c=75,b+d=25,ad=675,bc=300,n=100,计算得2的观测值k=3.030.因为2.7063.03010.
5、828,所以有99.9%的把握认为X与Y之间有关系.7.某单位为了了解用电量y(千瓦时)与气温x()之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表:气温/181310-1用电量/千瓦时24343864由表中数据得回归直线方程y=bx+a中 b=-2,预测当气温为-4 时,用电量的度数约为.导学号32470535答案:68解析:=10,=40,回归直线方程过点(),40=-210+a.a=60.y=-2x+60.令x=-4,得y=(-2)(-4)+60=68.8.(2015大连高三质检)假设关于某设备的使用年限x(年)和所支出的维修费用y(万元),有如下表的统计资料:使用年限x(
6、年)23456维修费用y(万元)2.23.85.56.57.0若由资料可知y对x呈线性相关关系,试求:(1)线性回归直线方程;(2)根据回归直线方程,估计使用年限为12年时,维修费用是多少?解:(1)列表i12345合计xi2345620yi2.23.85.56.57.025xiyi4.411.422.032.542.0112.34916253690=4,=5;=90;xiyi=112.3b=1.23,于是a=-b=5-1.234=0.08.所以线性回归直线方程为y=1.23x+0.08.(2)当x=12时,y=1.2312+0.08=14.84(万元),即估计使用12年时,维修费用是14.8
7、4万元.9.某高校共有学生15 000人,其中男生10 500人,女生4 500人,为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时间的样本数据(单位:时).(1)应收集多少位女生的样本数据?(2)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据的分组区间为0,2),2,4),4,6),6,8),8,10),10,12.估计该校学生每周平均体育运动时间不少于4小时的概率;(3)在样本数据中,有60位女生的每周平均体育运动时间不少于4小时,请完成每周平均体育运动时间与性别列联表,并判断是否有95%的把握
8、认为“该校学生的每周平均体育运动时间与性别有关”.附2=P(2k0)0.100.050.0100.0050.001k02.7063.8416.6357.87910.828解:(1)300=90,所以应收集90位女生的样本数据.(2)由频率分布直方图得1-2(0.100+0.025)=0.75,所以该校学生每周平均体育运动时间不少于4小时的概率的估计值为0.75.(3)由(2)知,300位学生中有3000.75=225人的每周平均体育运动时间不少于4小时,75人的每周平均体育运动时间少于4小时.又因为样本数据中有210份是关于男生的,90份是关于女生的.所以每周平均体育运动时间与性别列联表如下:
9、每周平均体育运动时间与性别列联表男生女生总计每周平均体育运动时间不超过4小时453075每周平均体育运动时间超过4小时16560225总计21090300结合列联表可算得2=4.7623.841.所以,有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”.导学号32470536能力提升组10.(2015郑州质量预测)通过随机询问110名性别不同的学生是否爱好某项运动,得到如下的列联表:男女总计爱好402060不爱好203050总计6050110附表:P(2k0)0.0500.0100.001k03.8416.63510.828参照附表,得到的正确结论是()A.有99%的把握认为“爱好
10、该项运动与性别有关”B.有99%的把握认为“爱好该项运动与性别无关”C.有99.9%的把握认为“爱好该项运动与性别有关”D.有99.9%的把握认为“爱好该项运动与性别无关”答案:A解析:依题意,由2=,得2=7.8.因为P(7.86.635)=0.010,因此有99%的把握认为“爱好该项运动与性别有关”,故选A.11.已知x与y之间的几组数据如下表:x123456y021334假设根据上表数据所得线性回归直线方程y=bx+a,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y=bx+a,则以下结论正确的是()A.bb,aaB.bb,aaC.baD.bb,aa导学号32470
11、537答案:C解析:由题意可知,b=2,a=-2,b=.a=-b=-,ba,选C.12.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下非优秀统计成绩,得到如下所示的列联表:优秀非优秀总计甲班10b乙班c30总计已知在全部105人中随机抽取1人,成绩优秀的概率为,则下列说法正确的是.列联表中c的值为30,b的值为35列联表中c的值为15,b的值为50根据列联表中的数据,有97.5%的把握认为“成绩与班级有关系”根据列联表中的数据,有97.5%的把握不能认为“成绩与班级有关系”答案:解析:由题意知,成绩优秀的学生数是30,成绩非优秀的学生数是75,所以c=20,b=45,错误.根据列联表中的数据,得到2=6.65.024,因此有97.5%的把握认为“成绩与班级有关系”.