1、高考资源网() 您身边的高考专家章末复习提升课线性回归分析以下是某地收集到的新房屋的销售价格y和房屋面积x的数据:房屋面积x(m2)11511080135105销售价格y(万元)248216184292220(1)画出数据对应的散点图;(2)求线性回归方程,并在散点图中画出回归直线;(3)据(2)的结果估计当房屋面积为150 m2时的销售价格【解】(1)数据对应的散点图如图所示:(2) xi109, (xi)21 570,yi232, (xi)(yi)3 080.设所求回归直线方程为x,则1.962,2321091.96218.142.故所求线性回归方程为1.962x18.142.回归直线如图
2、所示(3)据(2),当x150时,销售价格的估计值为1.96215018.142312.442(万元)求线性回归方程的基本步骤提醒只有在散点图大致呈直线时,求出的线性回归方程才有实际意义,否则求出的回归方程毫无意义 (2018高考全国卷)下图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型根据2000年至2016年的数据(时间变量t的值依次为1,2,17)建立模型:30.413.5 t;根据2010年至2016年的数据(时间变量t的值依次为1,2,7)建立模型:9917.5t.(1)分别
3、利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;(2)你认为用哪个模型得到的预测值更可靠?并说明理由解:(1)利用模型,可得该地区2018年的环境基础设施投资额的预测值为30.413.519226.1(亿元)利用模型,可得该地区2018年的环境基础设施投资额的预测值为9917.59256.5(亿元)(2)利用模型得到的预测值更可靠理由如下:()从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y30.413.5t上下,这说明利用2000年至2016年的数据建立的线性模型不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额
4、有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型9917.5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型得到的预测值更可靠()从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型得到的预测值226.1亿元的增幅明显偏低,而利用模型得到的预测值的增幅比较合理,说明利用模型得到的预测值更可靠非线性回归分析某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)
5、的影响对近8年的年宣传费xi和年销售量yi(i1,2,8)数据作了初步处理,得到下面的散点图及一些统计量的值表中wi,wi.(1)根据散点图判断,yabx与ycd哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;(3)已知这种产品的年利润z与x,y的关系为z0.2yx.根据(2)的结果回答下列问题:年宣传费x49时,年销售量及年利润的预报值是多少?年宣传费x为何值时,年利润的预报值最大?附:对于一组数据(1,v 1),(2,v 2),(n,v n),其回归直线的斜率和截距的最小二乘估计分别为,v.【
6、解】(1)由散点图可以判断,ycd适宜作为年销售量y关于年宣传费x的回归方程类型(2)令w,先建立y关于w的线性回归方程563686.8100.6,所以y关于w的线性回归方程为100.668w,因此y关于x的回归方程为100.668.(3)由(2)知,当x49时,年销售量y的预报值100.668576.6,年利润z的预报值576.60.24966.32.根据(2)的结果知,年利润z的预报值0.2(100.668)xx13.620.12.所以当6.8,即x46.24时,取得最大值故年宣传费为46.24千元时,年利润的预报值最大非线性回归问题的求解策略(1)画散点图:首先画出已知数据的散点图(2)
7、拟合数据:把散点图与学过的各种函数(幂函数、指数函数、对数函数等)图象进行比较,挑选一种跟这些散点拟合得最好的函数(3)变量代换:采用适当的变量置换,把问题化为线性回归分析问题,使之得到解决 在试验中得到变量y与x的数据如下:x0.066 70.038 80.033 30.027 30.022 5y39.442.941.043.149.2由经验知,y与之间具有线性相关关系,试求y与x之间的回归曲线方程;当x00.038时,预测y0的值解:令u,由题目所给数据可得下表所示的数据:序号uiyiuuiyi115.039.4225591225.842.9665.641 106.82330.041.09
8、001 230436.643.11 339.561 577.46544.449.21 971.362 184.48合计151.8215.65 101.566 689.76计算得0.29,34.32,34.320.29u,所求回归曲线方程为34.32,当x00.038时,034.3241.95.独立性检验思想的应用(2018高考全国卷节选)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人第一组工人用第一种生产方式,第二组工人用第二种生产方式根据工人完成生产任务的工作时间(单位:min)绘制了如
9、图所示的茎叶图:(1)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m的工人数填入下面的列联表:超过m不超过m第一种生产方式第二种生产方式(2)根据(1)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?附:K2,P(K2k)0.0500.0100.001k3.8416.63510.828【解】(1)由茎叶图知m80.列联表如下:超过m不超过m第一种生产方式155第二种生产方式515(2)由于K2的观测值k106.635,所以有99%的把握认为两种生产方式的效率有差异解决一般的独立性检验问题的步骤(1)通过列联表确定a,b,c,d,n的值,根据实际
10、问题需要的可信程度确定临界值k0.(2)利用K2求出K2的观测值k.(3)如果kk0,就推断“两个分类变量有关系”,这种推断犯错误的概率不超过;否则就认为在犯错误的概率不超过的前提下不能推断“两个分类变量有关系” 某淘宝店经过对“十一”七天假期的消费情况进行统计,发现在金额不超过1 000元的消费者中男女之比约为14,该店按此比例抽取了100名消费者进行进一步分析,得到下表女性消费情况:消费金额/元(0,200)200,400)400,600)600,800)800,1 000人数51015473男性消费情况:消费金额/元(0,200)200,400)400,600)600,800)800,1
11、 000人数231032若消费金额不低于600元的消费者称为“网购达人”、低于600元的消费者称为“非网购达人”(1)分别计算女性和男性消费的平均数,并判断平均消费水平高的一方“网购达人”出手是否更阔绰?(2)根据以上统计数据填写如下22列联表,并回答能否在犯错误的概率不超过0.005的前提下认为“是否为网购达人与性别有关”女性男性总计“网购达人”“非网购达人”总计附:K2,其中nabcd.P(K2k0)0.100.050.0250.0100.005k02.7063.8415.0246.6357.879解:(1)女性消费的平均数为(10053001050015700479003)582.5(元
12、)男性消费的平均数为(100230035001070039002)500(元)虽然女性消费者的平均消费水平较高,但“女网购达人”的平均消费水平(为712元)低于“男网购达人”的平均消费水平(为780)元,所以平均消费水平高的一方“网购达人”出手不一定更阔绰(2)22列联表如下表:女性男性总计“网购达人”50555“非网购达人”301545总计8020100K2的观测值k9.091,因为9.0917.879,所以在犯错误的概率不超过0.005的前提下可以认为“是否为网购达人与性别有关”1如果某地的财政收入x与支出y满足线性回归方程xe(单位:亿元)其中,0.8,2,|e|0.5.若今年该地区财政
13、收入10亿元,则年支出预计不会超过()A9亿元B.10亿元C9.5亿元D10.5亿元解析:选D.因为回归方程为0.8x2e,所以当x10时,y0.8102e100.510.5.故选D.2某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验根据收集到的数据(如表),由最小二乘法求得回归方程0.67x54.9.零件数x(个)1020304050加工时间y(min)62758189现发现表中有一个数据看不清,请你推断出该数据的值为_解析:由表格知30,得0.673054.975.设表中的“模糊数字”为a.则a62758189755,所以a68.答案:683根据下表,计算K2的观测
14、值k_(保留两位小数)又发病未发病做移植手术39157未做移植手术29167解析:k1.78.答案:1.784已知x,y之间的一组数据如下表:x13678y12345(1)从x,y中各取一个数,求xy10的概率;(2)对于表中数据,甲、乙两同学给出的拟合直线分别为甲x1与乙x,试利用最小平方法(也称最小二乘法)判断哪条直线拟合程度更好解:(1)从x,y各取一个数组成数对(x,y),共有25对,其中满足xy10的有(6,4),(6,5),(7,3),(7,4),(7,5),(8,2),(8,3),(8,4),(8,5),共9对,故所求概率P,所以使xy10的概率为.(2)用甲x1作为拟合直线时,
15、所得y值与y的实际值的差的平方和为S1(22)2(33)2.用乙x作为拟合直线时,所得y值与y的实际值的差的平方和为S2(11)2(22)2(44)2.因为S2S1,故用直线乙x拟合程度更好5我们经常听到这种说法:“如果数学学得好,物理就没有什么大的问题了”,为了验证这句话的科学性,某班甲、乙两位同学根据高中所学的统计知识,用两种不同的方案对班上学生的数学和物理成绩进行了统计和分析,请补充完成他们的工作(1)甲调查了班上6名同学某次考试的数学和物理成绩,得到下面的表格:123456数学成绩x130120109959080物理成绩y918576686355甲通过画出散点图和计算相关系数发现,y与
16、x有一定的线性相关关系,并设回归直线方程为x,且根据表中数据求得0.714,求的值;若从参与调查数学成绩不低于90分的同学中随机抽取2名,则他们的物理成绩均超过70分的概率为多少?(2)乙同学统计全班60名学生的数学和物理成绩情况,了解到班上数学成绩好的同学有36人,物理成绩好的有30人,数学和物理都好的有24人,填写下列22列联表,并判断能否在犯错误的概率不超过0.01的前提下认为物理成绩好与否和数学成绩有关物理成绩好物理成绩不好总计数学成绩好数学成绩不好总计附:K2,nabcd.P(K2k0)0.0500.0250.0100.0050.001k03.8415.0346.6357.87910.828解:(1)通过计算易得104,73,回归直线x一定经过点(,),又0.714,代入可得1.256.参与调查的6名同学中有5名数学成绩不低于90分,随机抽取2名有10种情况,而同时物理成绩均超过70分的有3种情况,故所求概率为.(2)填表如下:物理成绩好物理成绩不好总计数学成绩好241236数学成绩不好61824总计303060由公式可得K2的观测值k106.635,故在犯错误的概率不超过0.01的前提下认为物理成绩好与否和数学成绩有关高考资源网版权所有,侵权必究!