1、章末复习提升课,1回归分析对于一组数据(xi,yi),i1,2,n,如果它们线性相关,则线性回归方程为 x,其中.222列联表22列联表如表所示:B总计Aababcdcd总计acbdn其中nabcd为样本容量32检验常用随机变量2来检验两个变量是否有关系1回归分析的两个关注点(1)回归分析是建立在两个具有相关性的变量之间的一种模拟分析,因此先判断其是否具有相关性(2)并非只有线性相关关系,还可能存在非线性相关关系2通过独立性检验得到的结论未必正确,它只是对一种可靠性的预测线性回归方程的求解及相关性检验在某种产品表面进行腐蚀刻线试验,得到腐蚀深度y与腐蚀时间x之间的一组观察值如下表.x(s)51
2、01520304050607090120y(m)610101316171923252946(1)画出散点图;(2)求y对x的线性回归方程;(3)利用线性回归方程预测时间为100 s时腐蚀深度为多少解(1)散点图如图所示(2)从散点图中,我们可以看出y对x的样本点分布在一条直线附近,因而求回归直线方程有意义x(51015120),y(6101046),0.304.ab0.3045.36.故腐蚀深度对腐蚀时间的线性回归方程为y0.304x5.36.(3)根据(2)求得的线性回归方程,当腐蚀时间为100 s时,y5.360.30410035.76(m),即腐蚀时间为100 s时腐蚀深度大约为35.7
3、6 m.可线性化的非线性相关问题某地区不同身高的未成年男性的体重平均值如下表所示:身高x(cm)60708090100110体重y(kg)6.137.909.9912.1515.0217.50身高x(cm)120130140150160170体重y(kg)20.9226.8631.1138.8547.2555.05试建立体重y与身高x之间的回归方程解根据已知表中的数据画出散点图,如图所示由图可看出,样本点分布在某条指数曲线yc1ec2x的周围,于是可令zln y,那么有x60708090100110z1.812.072.302.502.712.86x120130140150160170z3.0
4、43.293.443.663.864.01作出上表中数据的散点图,如图所示:由表中数据可得z与x之间的线性回归方程为z0.6930.020x,即y与x之间的回归方程为ye0.6930.020x.22列联表与独立性检验某学生对其亲属30人的饮食习惯进行了一次调查,并用茎叶图表示30人饮食指数,如图所示(说明:图中饮食指数低于70的人,饮食以蔬菜为主;饮食指数高于70的人,饮食以肉类为主)(1)根据茎叶图,帮助这位同学说明其亲属30人的饮食习惯;(2)根据以上数据完成如表所示的22列联表:主食蔬菜主食肉类总计50岁以下50岁以上总计(3)是否有99%的把握认为“其亲属的饮食习惯与年龄有关”?并写出
5、简要分析解(1)30位亲属中50岁以上的人多以食蔬菜为主,50岁以下的人多以食肉为主(2)22列联表如表所示:主食蔬菜主食肉类总计50岁以下481250岁以上16218总计201030(3)2106.635,故有99%的把握认为“其亲属的饮食习惯与年龄有关”1对两个变量进行独立性检验的主要作用是()A判断模型的拟合效果B对两个变量进行相关分析C给出两个变量有关系的可靠程度D估计预报变量的平均值解析:选C.独立性检验的目的就是明确两个变量有关系的可靠程度2某学校开展研究性学习活动,某同学获得一组实验数据如下表:x1.99345.16.12y1.54.047.51218.01对于表中数据,现给出以
6、下拟合曲线,其中拟合程度最好的是()Ay2x2ByCylog2x Dy(x21)解析:选D.对于A:y2x2为直线,不符合要求;对于B:y单调递减,不符合要求;对于C:增长缓慢,也不符合要求;将表中数据代入D中,基本符合要求3为了探究电离辐射的剂量与人体的受损程度是否有关,用两种不同剂量的电离辐射照射小白鼠在照射14天内的结果如表所示:死亡存活总计第一种剂量141125第二种剂量61925总计203050进行统计分析时的统计假设是_解析:根据独立性检验的基本思想可知类似反证法,即要确认“两个分类变量有关系”成立的可信程度,首先假设该结论不成立,即假设结论“两个分类变量没有关系”成立,对本题,进
7、行统计分析的统计假设为“小白鼠的死亡与剂量无关”答案:小白鼠的死亡与剂量无关4根据两个变量x,y之间的观测数据画成散点图如图所示,这两个变量_线性相关关系(填“具有”或“不具有”)解析:从散点图看,其分布成团状,无任何规律,故这两个变量不具有线性相关关系答案:不具有5为了对新产品进行合理定价,对该产品进行了试销试验,以观察需求量y(单位:千件)对于价格x(单位:千元)的反应,得数据如下:x5070804030909597y1008060120135555048若y与x之间具有线性相关关系,求线性回归方程解:b1.286 6,ab169.775 4.所以线性回归方程为y169.775 41.286 6x.6在对人们的休闲方式的一次调查中,共调查了124人,其中女性70人,男性54人女性中有43人主要的休闲方式是看电视,另外27人主要的休闲方式是运动;男性中有21人主要的休闲方式是看电视,另外33人主要的休闲方式是运动(1)根据以上数据建立一个22的列联表;(2)判断性别与休闲方式是否有关系解:(1)22列联表如下:休闲方式性别看电视运动总计女432770男213354总计6460124(2)假设“休闲方式与性别无关”,计算26.201.因为23.841,所以有95%的把握认为性别与休闲方式有关系