1、课后素养落实(四十七)成对数据的线性相关性1下列数据x,y符合哪一种函数模型()x12345678910y22.6933.383.63.844.084.24.3Ay2xBy2exCy2eDy2ln xD分别将x的值代入解析式判断知满足y2ln x2两个变量满足如下表关系X510152025Y103105110111114则两个变量线性相关程度()A较高B较低C不相关D不确定Axi75,yi543,x1 375,xiyi8 285,y59 051,15,108.6r0.982 6故两个变量间的线性相关程度较高3对相关系数r,下列说法正确的是()Ar越大,相关程度越大Br越小,相关程度越大C|r|
2、越大,相关程度越小,|r|越小,相关程度越大D|r|1且|r|越接近于1,相关程度越大,|r|越接近0,相关程度越小D|r|越接近于1,偏差越小,相关程度越大,|r|越接近于0,偏差越大,相关程度越小,故选D4对变量X,Y有观测数据(xi,yi)(i1,2,10),得散点图;对变量U,V有观测数据(ui,vi)(i1,2,10),得散点图由这两个散点图可以判断()A变量X与Y正相关,U与V正相关B变量X与Y正相关,U与V负相关C变量X与Y负相关,U与V正相关D变量X与Y负相关,U与V负相关C由题图可知,各点整体呈递减趋势,X与Y负相关,由题图可知,各点整体呈递增趋势,U与V正相关5若回归直线方
3、程中的回归系数b0,则相关系数为()Ar1Br1Cr0D无法确定C当b0时,有 (xi)(yi)0,故相关关系r0二、填空题6某单位为了了解用电量Y(度)与气温X()之间的关系,随机统计了某4天的用电量与当天气温,并制作了如下对照表:气温()1813101用电量(度)24343864由表中数据得线性回归直线方程x中的2,预测当气温为4 时,用电量为_度68回归直线方程过点(,),根据题意得10,40,将(10,40)代入2x,解得60,则2x60,当x4时,(2)(4)6068,即当气温为4 时,用电量约为68度7面对竞争日益激烈的消费市场,众多商家不断扩大自己的销售市场,以降低生产成本某白酒
4、酿造企业市场部对该企业9月份的产品销量(单位:千箱)与单位成本(单位:元)的资料进行线性回归分析,结果如下:,71,x79,xiyi1 4811.818 2,71(1.818 2)77.36,则销量每增加1 000箱,单位成本下降_元1.818 2由已知可得,1.818 2x77.36,销量每增加1千箱,则单位成本下降1.818 2元8在研究教育与贫穷两个因素之间的关系时,收集了美国50个州的成年人受过9年或更少教育的百分比(X)和收入低于官方规定的贫困线的人数占本州人数的百分比(Y)的数据,建立的回归直线方程如下:Y0.8X4.6,斜率的估计值等于0.8,说明_;成年人受过9年或更少教育的百
5、分比(X)和收入低于官方的贫困线的人数占本州人数的百分比(Y)之间的相关系数_(填“大于0”或“小于0”)答案一个地区受过9年或更少教育的百分比每增加1%,收入低于官方规定的贫困线的人数占本州人数的百分比将增加0.8%左右大于0三、解答题9测得10对父子身高(单位:英寸)如下:父亲身高(X)60626465666768707274儿子身高(Y)63.665.26665.566.967.167.468.370.170(1)对变量Y与X进行相关性检验;(2)如果Y与X之间具有相关关系,求回归直线方程;(3)如果父亲身高为73英寸,试估计儿子的身高参考数据:66.8,67.01,x44 794,y4
6、 494 1.93,24 462.24,24 490.34,xiyi44 842.4,解(1)r0.980 4,因为r0.980 4非常接近于1,所以Y与X之间具有较强的线性相关关系(2)设回归直线方程为YbXa,0.464 6,35.97,所以回归直线方程为Y0.464 6X35.97(3)x73时,y69.9,所以父亲身高为73英寸时,儿子的身高约为69.9英寸10下面的数据是年龄在40到60岁的男子中随机抽出的6个样本,分别测定了心脏的功能水平Y(满分100),以及每天花在看电视上的平均时间X(小时)看电视的平均时间x4.44.62.75.80.24.6心脏功能水平y5253695789
7、65(1)求心脏功能水平Y与每天花在看电视上的平均时间X之间的相关系数r;(2)求心脏功能水平Y与每天花在看电视上的平均时间X的线性回归方程,并讨论方程是否有意义;(系数保留两位小数)(3)估计平均每天看电视3小时的男子的心脏功能水平解n6,(4.44.62.75.80.24.6)3.716,(525369578965)64.166 7,x62(4.424.622.725.820.224.62)63.716219.798 0,y62(522532692572892652)664.166 72964.833 3,xiyi6(4.4524.6534.665)63.71664.166 7124.36
8、0 7(1)心脏功能水平Y与每天花在看电视上的平均时间X之间的相关系数:r0.899 8(2)6.28,87.50,心脏功能水平Y与每天花在看电视上的平均时间x的线性回归方程为Y6.28X87.50因为|r|0.898,所以有相当大的把握认为Y与X之间有线性关系,这个方程是有意义的(3)将x3代入线性回归方程,可得y68.66,即平均每天看电视3小时,心脏功能水平约为68.6611两个变量Y与X的回归模型中,分别选择了4个不同模型,它们的相关系数r如下,其中拟合效果最好的模型是()A模型1的相关系数r为0.98B模型2的相关系数r为0.80C模型3的相关系数r为0.50D模型4的相关系数r为0
9、.25A在两个变量Y与X的回归模型中,它们的相关系数|r|越近于1,模拟效果越好,在四个选项中A的相关系数最接近1,所以拟合效果最好的是模型112已知两个变量X和Y之间具有线性相关性,甲、乙两个同学各自独立地做了10次和15次试验,并且利用线性回归的方法求得回归直线分别为l1和l2,已知两个人在试验中发现对变量X的观测数据的平均数都为s,对变量Y的观测数据的平均数都是t,则下列说法正确的是()Al1与l2一定有公共点(s,t)Bl1与l2相交,但交点一定不是(s,t)Cl1与l2必定平行Dl1与l2必定重合A由于回归直线YbXa恒过(,)点,又两人对变量X的观测数据的平均值为s,对变量Y的观测
10、数据的平均值为t,所以l1和l2恒过点(s,t)13(多选题)下列说法中正确的是()A线性相关系数r1,1B在线性回归分析中,偏差越小,线性相关系数的绝对值越大C相关系数r越小,说明变量之间的线性相关程度越小D在散点图中,若n个点在一条直线上,|r|1ABD由线性相关系数的定义知,只有C不正确14(一题两空)某市居民20152019年家庭年平均收入X(单位:万元)与年平均支出Y(单位:万元)的统计资料如下表所示:年份20152016201720182019收入X11.512.11313.315支出Y6.88.89.81012根据统计资料,居民家庭年平均收入的中位数是_,家庭年平均收入与年平均支出有_相关关系(填“正”或“负”)13正中位数是13由相关性知识,根据统计资料可以看出,当年平均收入增多时,年平均支出也增多,因此两者之间具有正相关关系15在一组样本数据(x1,y1),(x2,y2),(x6,y6)的散点图中,若所有样本点(xi,yi)(i1,2,6)都在曲线ybx2附近波动经计算xi12,yi14,x23,则实数b的值为_令tx2,则曲线的回归方程变为线性的回归方程,即ybt,此时,代入ybt,得b,解得b