1、第3讲变量间的相关关系与统计案例组基础关1观察下列各图形:其中两个变量x,y具有相关关系的图是()A B C D答案C解析观察散点图可知,两个变量x,y具有相关关系的图是.2甲、乙、丙、丁四位同学各自对A,B两变量的线性相关性做试验,并用回归分析方法分别求得相关系数r与残差平方和m如下表:甲乙丙丁r0.820.780.690.85m106115124103则哪位同学的试验结果体现A,B两变量有更强的线性相关性()A甲 B乙 C丙 D丁答案D解析在验证两个变量之间的线性相关关系时,相关系数的绝对值越接近1,相关性越强,在四个选项中只有丁的相关系数最大;残差平方和越小,相关性越强,只有丁的残差平方
2、和最小,综上可知丁的试验结果体现了A,B两个变量有更强的线性相关性故选D.3(2019湖北省七市(州)教科研协作体联考)为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验,得到5组数据:(x1,y1),(x2,y2),(x3,y3),(x4,y4),(x5,y5)根据收集到的数据可知x1x2x3x4x5100,用最小二乘法求得回归直线方程为0.67x54.8,则y1y2y3y4y5的值为()A68.2 B341 C355 D366.2答案B解析由题意,得20,将其代入回归直线方程0.67x54.8中,得0.672054.868.2,所以y1y2y3y4y55341.故选B.4(
3、2020兰州模拟)根据如下样本数据:x12345ya110.5b12.5得到的回归方程为bxa.样本点的中心为(3,0.1),当x增加1个单位,则y近似()A增加0.8个单位 B减少0.8个单位C增加2.3个单位 D减少2.3个单位答案A解析由题意,知(12345)3,(a1)(1)0.5(b1)2.50.1,又回归直线方程过样本中心点(3,0.1),得3ba0.1,由联立,解得a2.3,b0.8,所以回归直线方程为0.8x2.3,所以当x增加1个单位时,y近似增加0.8个单位5已知两个随机变量x,y之间的相关关系如下表所示:x42124y5310.51根据上述数据得到的回归方程为x,则大致可
4、以判断()A.0,0 B.0,0C.0 D.0,0,1.70.20,0.故选C.6(2019湛江二模)有人认为在机动车驾驶技术上,男性优于女性这是真的么?某社会调查机构与交警合作随机统计了经常开车的100名驾驶员最近三个月内是否有交通事故或交通违法事件发生,得到下面的列联表:男女合计无403575有151025合计5545100附:K2P(K2k0)0.500.400.250.150.10k00.4550.7081.3232.0722.706据此表,可得()A认为机动车驾驶技术与性别有关的可靠性不足50%B认为机动车驾驶技术与性别有关的可靠性超过50%C认为机动车驾驶技术与性别有关的可靠性不足
5、60%D认为机动车驾驶技术与性别有关的可靠性超过60%答案A解析由表中数据,计算K20.33670.455,认为机动车驾驶技术与性别有关的可靠性不足50%.故选A.7在一组样本数据(x1,y1),(x2,y2),(x6,y6)的散点图中,若所有样本点(xi,yi)(i1,2,6)都在曲线ybx2附近波动经计算xi11,yi13,x21,则实数b的值为_答案解析令tx2,则曲线的回归方程变为线性的回归方程,即ybt,此时,代入ybt,得b,解得b.8(2019厦门二模)某种细胞的存活率y(%)与存放温度x()之间具有线性相关关系,其样本数据如表所示:存放温度x()20151050510存活率y(
6、%)6142633436063计算得5,35,iyi175,875,并求得回归直线为2x45.但实验人员发现表中数据x5的对应值y60录入有误,更正为y53.则更正后的回归直线方程为_参考公式:回归方程x中斜率和截距的最小二乘估计公式分别为, .答案1.9x43.5解析由题意,更正后,5,(3576053)34,iyi175560553140,875,1.9, 34(1.9)543.5.更正后的回归直线方程为1.9x43.5.组能力关1变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U与V相对应的一组数据为(10,5),(11.
7、3,4),(11.8,3),(12.5,2),(13,1)r1表示变量Y与X之间的线性相关系数,r2表示变量V与U之间的线性相关系数,则()Ar2r10 B0r2r1Cr200;对于变量V与U而言,V随U的增大而减小,故V与U负相关,即r23.841,即k3.841,解得x10.243.因为,为整数,所以若有95%的把握认为是否喜欢韩剧和性别有关,则男生至少有12人5(2019惠州市第二次调研)某商场为了了解毛衣的月销量y(件)与月平均气温x()之间的关系,随机统计了某4个月的月销售量与当月平均气温,其数据如下表:月平均气温x/171382月销售量y/件24334055由表中数据算出线性回归方
8、程x中的2,则_;气象部门预测下个月的平均气温约为6 ,据此估计该商场下个月毛衣销售量约为_件答案5846解析由题中数据,得10,38,回归直线x过点(,),且2,代入得58,则回归方程2x58,所以当x6时,y46.6(2018全国卷)下图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型根据2000年至2016年的数据(时间变量t的值依次为1,2,17)建立模型:30.413.5t;根据2010年至2016年的数据(时间变量t的值依次为1,2,7)建立模型:9917.5t.(1)分别利
9、用这两个模型,求该地区2018年的环境基础设施投资额的预测值;(2)你认为用哪个模型得到的预测值更可靠?并说明理由解(1)利用模型,该地区2018年的环境基础设施投资额的预测值为30.413.519226.1(亿元)利用模型,该地区2018年的环境基础设施投资额的预测值为9917.59256.5(亿元)(2)利用模型得到的预测值更可靠理由如下:()从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y30.413.5t上下,这说明利用2000年至2016年的数据建立的线性模型不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,
10、2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型9917.5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型得到的预测值更可靠()从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型得到的预测值226.1亿元的增幅明显偏低,而利用模型得到的预测值的增幅比较合理,说明利用模型得到的预测值更可靠(以上给出了两种理由,考生答出其中任意一种或其他合理理由均可)组素养关1某职称晋级评定机构对参加某次专业技术考试的100人的成绩进行了统计,绘制了
11、频率分布直方图(如图所示),规定80分及以上者晋级成功,否则晋级失败(满分为100分)(1)求图中a的值;(2)估计该次考试的平均分(同一组中的数据用该组的区间中点值代表);(3)根据已知条件完成下面的22列联表,并判断能否有85%的把握认为“晋级成功”与性别有关晋级成功晋级失败合计男16女50合计参考公式:P(K2k0)0.400.250.150.100.050.025k00.7801.3232.0722.7063.8415.024K2,其中nabcd.解(1)由频率分布直方图中各小长方形的面积总和为1,可知(2a0.0200.0300.040)101,故a0.005.(2)由频率分布直方图
12、知各小组的区间中点值分别为55,65,75,85,95,对应的频率分别为0.05,0.30,0.40,0.20,0.05,故可估计平均数550.05650.3750.4850.2950.0574.(3)由频率分布直方图知,晋级成功的频率为0.200.050.25,故晋级成功的人数为1000.2525,故填表如下:晋级成功晋级失败合计男163450女94150合计2575100K22.6132.072,所以有85%的把握认为“晋级成功”与性别有关2(2019银川一中模拟)某餐厅通过查阅了最近5次食品交易会参会人数x(万人)与餐厅所用原材料数量y(袋),得到如下统计表:第一次第二次第三次第四次第五
13、次参会人数x(万人)13981012原材料y(袋)3223182428(1)根据所给5组数据,求出y关于x的线性回归方程yx;(2)已知购买原材料的费用C(元)与数量t(袋)的关系为C投入使用的每袋原材料相应的销售收入为700元,多余的原材料只能无偿返还,据悉本次交易大会大约有15万人参加根据(1)中求出的线性回归方程,预测餐厅应购买多少袋原材料,才能获得最大利润,最大利润是多少?(注:利润L销售收入原材料费用)参考公式:, .参考数据:iyi1343,558,3237.解(1)由所给数据,得10.4,25,2.5, 252.510.41,则y关于x的线性回归方程为2.51.(2)由(1)中求出的线性回归方程知,当x15时,y36.5,即预计需要原材料36.5袋,因为C所以当t36时,利润L700t(400t20)300t20,当t35时,利润L300352010520;当t36时,利润L700t380t,当t36时,利润L700363803611520,因为预计需要原材料36.5袋,且多余的原材料只能无偿返还,所以当t37时,利润L70036.53803711490.综上所述,餐厅应该购买36袋原材料,才能使利润获得最大,最大利润为11520元