1、核心素养测评 六十一变量的相关性与统计案例(20分钟50分)一、选择题(每小题5分,共25分)1.为了判定两个分类变量X和Y是否有关系,应用独立性检验法算得2等于5,又已知P(23.841)=0.05,P(26.635)=0.01,则下列说法正确的是()A.有95%的把握认为“X和Y有关系”B.有95%的把握认为“X和Y没有关系”C.有99%的把握认为“X和Y有关系”D.有99%的把握认为“X和Y没有关系”【解析】选A.依题意2=5,且P(23.841)=0.05,因此有95%的把握认为“X和Y有关系”.2.下面四个图中反映出回归模型的拟合精度较高的为()A.图B.图C.图D.图【解析】选A.
2、根据图中显示的分布情况即可看出,图显示的点比较均匀地落在水平的带状区域中,所以拟合精度较高.3.(多选)“吸烟有害健康,吸烟会对身体造成伤害”.美国癌症协会研究表明,开始吸烟年龄X分别为16岁、18岁、20岁和22岁者,其得肺癌的相对危险度Y依次为15.10,12.81,9.72,3.21;每天吸烟支数U分别为10,20,30者,其得肺癌的相对危险度V分别为7.5,9.5和16.6,用r1表示变量X与Y之间的线性相关系数,用r2表示变量U与V之间的线性相关系数,则下列说法错误的是()A.r1=r2B.r1r20C.0r1r2D.r10r2【解析】选ABC.由题意可知,开始吸烟年龄递增时,得肺癌
3、的相对危险度呈递减趋势,所以吸烟年龄与得肺癌的危险度呈负相关,所以r10.因此可得r100,r20=0.1200,r20,且r1r2,故,故正确,不正确.又回归直线l1:=0.68x+必经过样本点的中心(3.5,2.5),所以=2.5-0.683.5=0.12,正确.回归直线l2:=x+0.68必经过样本点的中心(3,2),所以2=3+0.68,所以=0.44,也可直接根据图象判断00.68(比较两直线的倾斜程度),故正确.答案:7.某学校社团为调查学生课余学习围棋的情况,随机抽取了100名学生进行调查.根据调查结果绘制的学生日均学习围棋时间的频率分布直方图如图所示,将日均学习围棋时间不低于4
4、0分钟的学生称为“围棋迷”.世纪金榜导学号根据已知条件完成下面的22列联表,并据此资料判断_(填“有”或“没有”)95%的把握认为“围棋迷”与性别有关.非围棋迷围棋迷合计男女1055合计【解析】由频率分布直方图可知,在抽取的100人中,“围棋迷”有1000.25=25人,从而22列联表如下所示:非围棋迷围棋迷合计男301545女451055合计7525100将22列联表中的数据代入公式计算,得2=3.030,因为3.0303,所以点(4,3)在回归直线=0.7x+0.35的下方;当x=5时,=0.75+0.35=3.854.5,所以点(6,4.5)在回归直线=0.7x+0.35的下方.综上,三
5、个样本点中落在回归直线=0.7x+0.35上方的有1个.答案:1三、解答题9.(10分)(2018全国卷)下图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至2016年的数据(时间变量t的值依次为1,2,17)建立模型:=-30.4+13.5t;根据2010年至2016年的数据(时间变量t的值依次为1,2,7)建立模型:=99+17.5t.(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值.(2)你认为用哪个模型得到的预测值更可靠?并说明理由.世
6、纪金榜导学号【解析】(1)利用模型,该地区2018年的环境基础设施投资额的预测值为=-30.4+13.519=226.1(亿元).利用模型,该地区2018年的环境基础设施投资额的预测值为=99+17.59=256.5(亿元).(2)利用模型得到的预测值更可靠.理由如下:方法一:从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y=-30.4+13.5t上下.这说明利用2000年至2016年的数据建立的线性模型不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2
7、010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型=99+17.5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型得到的预测值更可靠.方法二:从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型得到的预测值226.1亿元的增幅明显偏低,而利用模型得到的预测值的增幅比较合理.说明利用模型得到的预测值更可靠.(15分钟35分)1.(5分)已知某次考试之后,班主任从全班同学中随机抽取一个容量为8的样本,他们的数学、物理成绩(单位:分)对应如表:学生编号12345678数学成绩6065707580859095
8、物理成绩7277808488909395给出散点图如图:根据以上信息,判断下列结论:根据散点图,可以判断数学成绩与物理成绩具有线性相关关系;根据散点图,可以判断数学成绩与物理成绩具有一次函数关系;从全班随机抽取甲、乙两名同学,若甲同学数学成绩为80分,乙同学数学成绩为60分,则甲同学的物理成绩一定比乙同学的物理成绩高.其中正确的个数为()A.0B.1C.2D.3【解析】选B.由散点图知,各点都分布在一条直线附近,故可以判断数学成绩与物理成绩具有线性相关关系,但不能判断数学成绩与物理成绩具有一次函数关系,故正确,错误;若甲同学数学成绩为80分,乙同学数学成绩为60分,则甲同学的物理成绩可能比乙同
9、学的物理成绩高,故错误.综上,正确的个数为1.2.(5分)通过随机询问110名性别不同的学生是否爱好某项运动,得到如下的列联表:男女合计爱好402060不爱好203050合计6050110由2=算得,2=7.8.可以得到的正确结论是()A.有99%以上的把握认为“爱好该项运动与性别有关”B.有99%以上的把握认为“爱好该项运动与性别无关”C.有99.9%的把握认为“爱好该项运动与性别有关”D.有99.9%的把握认为“爱好该项运动与性别无关”【解析】选A.根据独立性检验的定义,由27.86.635,可知我们在犯错误的概率不超过0.01的前提下,即有99%以上的把握认为“爱好该项运动与性别有关”.
10、3.(5分)在2019年3月15日那天,某市物价部门对本市的5家商场的某商品的一天销售量及其价格进行调查,5家商场的售价x元和销售量y件之间的一组数据如表所示:价格x99.5m10.511销售量y11n865由散点图可知,销售量y与价格x之间有较强的线性相关关系,其线性回归方程是=-3.2x+40,且m+n=20,则其中的n=_.【解析】=8+,=6+.回归直线一定经过样本点的中心(,),即6+=-3.2+40,即3.2m+n=42.又因为m+n=20,即解得答案:104.(10分)已知某企业近3年的前7个月的月利润(单位:百万元)如折线图所示:世纪金榜导学号(1)试问这3年的前7个月中哪个月
11、的月平均利润最高?(2)通过计算判断这3年的前7个月的总利润的发展趋势.(3)试以第3年的前4个月的数据(如表),用线性回归的拟合模式估计第3年8月份的利润.月份x1234利润y(单位:百万元)4466相关公式:=,=-.【解析】(1)由折线图可知5月和6月的月平均利润最高.(2)第1年前7个月的总利润为1+2+3+5+6+7+4=28(百万元),第2年前7个月的总利润为2+5+5+4+5+5+5=31(百万元).第3年前7个月的总利润为4+4+6+6+7+6+8=41(百万元),所以这3年的前7个月的总利润呈上升趋势.(3)因为=2.5,=5,12+22+32+42=30,14+24+36+
12、46=54,所以=0.8,所以=5-2.50.8=3.因此线性回归方程为=0.8x+3.当x=8时,=0.88+3=9.4.所以估计第3年8月份的利润为9.4百万元.5.(10分)(2020珠海模拟)某种仪器随着使用年限的增加,每年的维护费相应增加. 现对一批该仪器进行调查,得到这批仪器自购入使用之日起,前5年平均每台仪器每年的维护费用大致如表:年份x(年)12345维护费y(万元)0.71.21.62.12.4(1)根据表中所给数据,试建立y关于x的线性回归方程=x+.(2)若该仪器的价格是每台12万元,你认为应该使用满五年换一次仪器,还是应该使用满八年换一次仪器?并说明理由.参考公式:用最小二乘法求线性回归方程=x+的系数公式:= ,=-.世纪金榜导学号【解析】(1)=3,=1.6,=9, =4.8,xiyi=0.7+2.4+4.8+8.4+12=28.3, =1+4+9+16+25=55.所以,=0.43, =-=1.6-0.433=0.31. 所以回归方程为=0.43x+0.31.(2)若满五年换一次仪器,则每年每台仪器的平均费用为:y1=4(万元)若满八年换一次设备,则每年每台设备的平均费用为:y2=3.745(万元).因为y1y2,所以应该使用满八年换一次仪器.