1、高考资源网() 您身边的高考专家第一章 统计案例章末总结 新人教A版选修1-2回归方程及其应用对所抽取的样本数据进行分析,分析两个变量之间的关系线性关系或非线性关系,并由一个变量的变化去推测另一个变量的变化,这就是对样本进行回归分析某商场经营一批进价是30元/台的小商品,在市场试验中发现,此商品的销售单价x(x取整数)元与日销售量y台之间有如下对应数据:单位x/元35404550日销售量y/台56412811(1)画出散点图并说明y与x是否具有线性相关关系如果有,求出线性回归方程(方程的斜率保留一个有效数字)(2)设经营此商品的日销售利润为P元,根据(1)写出P关于x的函数关系式,并预测当销售
2、单价x为多少元时,才能获得最大日销售利润分析:作出散点图,根据散点图观察是否具有线性相关关系解析:(1)散点图如图所示:从图中可以看出这些点大致分布在一条直线附近,因此两个变量具有线性相关关系(2)设回归直线方程为x.42.5,34,3,b34(3)42.5161.5.161.53x.(2)由题意,有P(161.53x)(x30)3x2251.5x4 845.当x42时,P有最大值即预测销售单价为42元时,能获得最大日销售利润判断两个变量之间是否有线性相关关系一般有两种方法:一是计算样本相关系数;二是画散点图两种方法要结合题目的要求合理选取,也可同时使用,则判断更加准确变式训练1从某居民区随机
3、抽取10个家庭,获得i个家庭的月收入xi(单位:千元)与月储蓄yi(单位:千元)的数据资料,算得720.(1)求家庭的月储蓄y对月收入x的线性回归方程x;(2)判断变量x与y之间是正相关还是负相关;(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄附:线性回归方程ybxa中,b,ab,其中,为样本平均值,线性回归方程也可写为x.解析:(1)由题意知:n10,i8,i2.又Lxxiyin184108224,由此得0.3,20.380.4.故所求回归方程为:y0.3x0.4.(2)由于变量y的值随x的值增加而增加(0.30),故x与y之间是正相关(3)将x7代入回归方程,可以预测该家庭的月储
4、蓄为:y0.370.41.7(千元)测得一个随机样本的数据如下表所示:x21232527293235y711212466115325(1)作出x与y的散点图,并猜测x与y之间的关系;(2)建立x与y的关系,并预报回归模型;(3)利用所得回归模型预报x40时y的值解析:(1)x与y的散点图如下图,有散点分布猜测样本数据分布在一条曲线的附近,这条曲线接近指数函数曲线yc1ec2x,其中c1,c2为常数(2)对yc1ec2x两边取对数的ln yln c1c2x.令Aln y,则Abxa,其中aln c1,bc2.将y与x之间的数据转化为A与x之间的数据:x21232527293235A1.9462.
5、3983.0453.1784.1904.7455.784可以求得回归直线方程为A0.272x3.849,所以e0.272x3.849.(3)当x40时,ye0.272403.8491 131.根据样本数据描出散点图,再由散点图直观地观察散点分布符合的函数模型,再根据有关公式进行计算变式训练2在一化学反应过程中,化学物质的反应速度y(g/min)与一种催化剂的量x(g)有关,现收集了8组观测数据列于下表:催化剂的量x/g1518212427303336化学物质的反应速度y(gmin1)6830277020565350试建立y与x之间的回归方程解析:根据收集的数据,作出散点图(如下图所示),根据已
6、有的函数知识,可以发现样本点分布在某一条指数函数曲线yaebx的周围,其中a和b是待定的参数令zln y,则zln ybxln a,即变换后的样本点应该分布在直线zbxc(cln a)附近有y与x的数据表可得到变换后的z与x的数据表:x1518212427303336z1.7922.0793.4013.2964.2485.3234.1745.858由z与x的数据表,可得线性回归方程:0.181x0.848,所以y与x之间的非线性回归方程为:e0.181x0.848.独立性检验及其应用在日常生活中,分类变量是大量存在的,例如吸烟与患肺癌等,在实际问题中,我们常常关心两个变量之间是否有关系为观察药
7、物A、B治疗某病的疗效,某医生将100例该病病人随机地分成两组,一组40人,服用A药;另一组60人,服用B药结果发现:服用A药的40人中有30人治愈,服用B药的60人中有11治愈,问A、B两药对该疾病的治愈率之间是否有显著差别?解析:为便于将数据代入公式计算,先列出22列联表:治愈未愈总计A药301040B药114960总计4159100由公式得k31.859.因为31.85910.828,所以我们在犯错误的概率不超过0.001的前提下,认为A、B两药对该病的治愈率之间有显著差别变式训练3某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名为研究工人的日平均生产量是否与年龄
8、有关,现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分为5组:50,60),60,70),71,80),80,90),90,100分别加以统计,得到如图所示的频率分布直方图 (1)求样本中日平均生产件数不足60件的工人人数(2)规定日平均生产件数不少于80件者为“生产能手”,请你根据已知条件完成22列联表,并判断是否有90%的把握认为“生产能手与工人所在的年龄组有关”?P(K2k)0.1000.0500.0100.001k2.7063.8416.63510.8
9、28附:K2解析:(1)由已知得,样本中有“25周岁以上组”工人60名,“25周岁以下组”工人40名由频率分布直方图知,样本中日平均生产件数不足60件的工人中,“25周岁以上组”工人有60(0.00510)3(人),“25周岁以下组”工人有40(0.00510)2(人),所以样本中日平均生产件数不足60件的工人有5人(2)由频率分布直方图知,在抽取的100名工人中,“25周岁以上组”中的生产能手有600.2515(人),“25周岁以下组”中的生产能手有400.37515(人),据此可得22列联表如下:生产能手非生产能手合计25周岁以上组15456025周岁以下组152540合计3070100所以得K21.79.因为1.792.706,所以没有90%的把握认为“生产能手与工人所在的年龄组有关”- 7 - 版权所有高考资源网