1、课后限时集训(六十二)变量间的相关关系、统计案例建议用时:40分钟一、选择题1如图是相关变量x,y的散点图,现对这两个变量进行线性相关分析,方案一:根据图中所有数据,得到线性回归方程1x1,相关系数为r1;方案二:剔除点(10,21),根据剩下数据得到线性回归直线方程2x2,相关系数为r2.则()A0r1r21 B0r2r11C1r1r20 D1r2r10D根据相关变量x,y的散点图知,变量x,y具有负线性相关关系,且点(10,21)是离群值方案一中,没剔除离群值,线性相关性弱些,成负相关;方案二中,剔除离群值,线性相关性强些,也是负相关所以相关系数1r2r10.故选D2(2020全国卷)某校
2、一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(xi,yi)(i1,2,20)得到下面的散点图:由此散点图,在10 至40 之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是()Ayabx Byabx2Cyabex Dyabln xD根据散点图,用光滑的曲线把图中各点依次连起来(图略),由图并结合选项可排除A,B,C,故选D3为了研究某班学生的脚长x(单位:厘米)和身高y(单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y与x之间有线性相关关系设其回归直线方程为x.已知.该
3、班某学生的脚长为24,据此估计其身高为()A160 cm B163 cm C166 cm D170 cm4现行普通高中学生在高一时面临着选科的问题,学校抽取了部分男、女学生意愿的一份样本,制作出如下两个等高堆积条形图:根据这两幅图中的信息,下列哪个统计结论是不正确的()A样本中的女生数量多于男生数量B样本中有两理一文意愿的学生数量多于有两文一理意愿的学生数量C样本中的男生偏爱两理一文D样本中的女生偏爱两文一理D由条形图知女生数量多于男生数量,有两理一文意愿的学生数量多于有两文一理意愿的学生数量,男生偏爱两理一文,女生中有两理一文意愿的学生数量多于有两文一理意愿的学生数量,故选D5某医疗所为了检
4、查新开发的流感疫苗对甲型H1N1流感的预防作用,把1 000名注射疫苗的人与另外1 000名未注射疫苗的人半年的感冒记录作比较,提出假设H0:“这种疫苗不能起到预防甲型H1N1流感的作用”,并计算得P(K26.635)0.01,则下列说法正确的是()A这种疫苗能起到预防甲型H1N1流感的有效率为1%B若某人未使用疫苗,则他在半年中有99%的可能性得甲型H1N1流感C有99%的把握认为“这种疫苗能起到预防甲型H1N1流感的作用”D有1%的把握认为“这种疫苗能起到预防甲型H1N1流感的作用”C因为P(K26.635)0.01,这说明假设不合理的程度为99%,即这种疫苗不能起到预防甲型H1N1流感的
5、作用不合理的程度约为99%,所以有99%的把握认为“这种疫苗能起到预防甲型H1N1流感的作用”,故选C二、填空题6对具有线性相关关系的变量x,y有一组观测数据(xi,yi)(i1,2,8),其线性回归方程是x,且x1x2x3x82(y1y2y3y8)6,则实数的值为 依题意可知样本点的中心为,则,解得.7甲、乙、丙、丁四位同学各自对A,B两个变量的线性相关性做试验,并用回归分析方法分别求得相关系数r与残差平方和m,如下表:甲乙丙丁r0.820.780.690.85m106115124103则 同学的试验结果体现A,B两变量有更强的线性相关性丁r越大,m越小,线性相关性越强8某医疗研究所为了检验
6、某种血清预防感冒的作用,把500名使用血清的人与另外500名未使用血清的人一年中的感冒记录作比较,提出假设H0:“这种血清不能起到预防感冒的作用”,利用22列联表计算得K23.918,经查临界值表知P(K23.841)0.05.则下列结论中,正确结论的序号是 有95%的把握认为“这种血清能起到预防感冒的作用”;若某人未使用该血清,那么他在一年中有95%的可能性得感冒;这种血清预防感冒的有效率为95%;这种血清预防感冒的有效率为5%.K23.9183.841,而P(K23.841)0.05,所以有95%的把握认为“这种血清能起到预防感冒的作用”要注意我们检验的假设是否成立和该血清预防感冒的有效率
7、是没有关系的,不是同一个问题,不要混淆三、解答题9某厂商为了解用户对其产品是否满意,在使用该产品的用户中随机调查了80人,结果如下表:满意不满意男用户3010女用户2020(1)根据上表,现用分层抽样的方法抽取对产品满意的用户5人,在这5人中任选2人,求被选中的恰好是男、女用户各1人的概率;(2)有多大把握认为用户对该产品是否满意与用户性别有关?请说明理由P(K2k)0.1000.0500.0250.010k2.7063.8415.0246.635注:K2,nabcd.解(1)用分层抽样的方法在满意产品的用户中抽取5人,则抽取比例为.所以在满意产品的用户中应抽取女用户202(人),男用户303
8、(人)抽取的5人中,三名男用户记为a,b,c,两名女用户记为r,s,则从这5人中任选2人,共有10种情况:ab,ac,ar,as,bc,br,bs,cr,cs,rs.其中恰好是男、女用户各1人的有6种情况:ar,as,br,bs,cr,cs.故所求的概率为P0.6.(2)由题意,得K2的观测值为k5.3335.024.又P(K25.024)0.025.故有97.5%的把握认为“产品用户是否满意与性别有关”10调查某公司的五名推销员,其工作年限与年推销金额如下表:推销员ABCDE工作年限x(年)23578年推销金额y(万元)33.546.58(1)在图中画出年推销金额关于工作年限的散点图,并从散
9、点图中发现工作年限与年推销金额之间关系的一般规律;(2)利用最小二乘法求年推销金额关于工作年限的回归直线方程;(3)利用(2)中的回归方程,预测工作年限为10年的推销员的年推销金额附:,.解(1)年推销金额关于工作年限的散点图如图:从散点图可以看出,各点散布在从左下角到右上角的区域里,因此,工作年限与年推销金额正相关,即工作年限越长,年推销金额越大(2)由表中数据可得:(23578)5,(33.546.58)5,55,年推销金额关于工作年限的回归直线方程为x.(3)当x10时, 10,预测工作年限为10年的推销员的年推销金额为万元1已知变量x,y之间的线性回归方程为0.7x10.3,且变量x,
10、y之间的一组相关数据如下表所示,则下列说法错误的是()x681012y6m32A变量x,y之间呈负相关关系B可以预测,当x20时,3.7Cm4D该回归直线必过点(9,4)C由0.72.706,所以有90%的把握认为是否是评分良好用户与性别有关某芯片公司为制定下一年的研发投入计划,需了解年研发资金投入量x(单位:亿元)对年销售额y(单位:亿元)的影响该公司对历史数据进行对比分析,建立了两个函数模型:yx2,yext,其中,t均为常数,e为自然对数的底数现该公司收集了近12年的年研发资金投入量xi和年销售额yi的数据,i1,2,12,并对这些数据作了初步处理,得到了如图所示的散点图及一些统计量的值
11、令uix,viln yi(i1,2,12),经计算得如下数据: (xi)2 (yi)220667702004604.20 (ui)2 (ui)(yi) (vi)2 (xi)(vi)3 125 00021 5000.30814(1)设ui和yi的相关系数为r1,xi和vi的相关系数为r2,请从相关系数的角度,选择一个拟合程度更好的模型;(2)()根据(1)的选择及表中数据,建立y关于x的回归方程(系数精确到0.01);()若下一年销售额y需达到90亿元,预测下一年的研发资金投入量x是多少亿元附:相关系数r,回归直线x中斜率和截距的最小二乘估计公式分别为:,;参考数据:308477,9.486 8,e4.499 890.解(1)由题意,r10.86,r20.91,则|r1|r2|,因此从相关系数的角度,模型yext的拟合程度更好(2)()先建立v关于x的线性回归方程,由yext,得ln ytx,即vtx,由于0.0180.02,t4.200.018203.84,所以v关于x的线性回归方程为0.02x3.84,所以ln 0.02x3.84,则e0.02x3.84.()下一年销售额y需达到90亿元,即y90,代入e0.02x3.84,得90e0.02x3.84,又e4.499 890,所以4.499 80.02x3.84,所以x32.99,所以预测下一年的研发资金投入量约是32.99亿元