1、阶段提升课 第一课 统 计 案 例 思维导图构建网络 考点整合素养提升 题组训练一 线性回归分析 【典例1】从某居民区随机抽取10个家庭,获得第i个家庭的月收入xi(单位:千 元)与月储蓄yi(单位:千元)的数据资料,算得 xi=80,yi=20,xiyi=184,=720.(1)求家庭的月储蓄y关于月收入x的线性回归方程 (2)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.10i 110i 110i 1102ii 1xybxa;【解析】(1)由题意知n=10,=xi=80=8,=yi=20=2,所以 =0.3,=2-0.38=-0.4,故所求线性回归方程为=0.3x-0.4.(2)将x
2、=7代入回归方程,可以预测家庭的月储蓄约为 =0.37-0.4=1.7(千元).x10i 11n110y10i 11n110b2184 10 8 224720 10 880 ay bxyy【方法技巧】解决回归分析问题的一般步骤(1)画散点图.根据已知数据画出散点图.(2)判断变量的相关性并求回归方程.通过观察散点图,直观感知两个变量是否具有相关关系;在此基础上,利用最小二乘法求回归系数,然后写出回归方程.(3)回归分析.画残差图或计算R2,进行残差分析.(4)实际应用.依据求得的回归方程解决实际问题.题组训练二 残差分析 【典例2】已知某种商品的价格x(元)与需求量y(件)之间的关系有如下一组
3、数据:求y对x的回归直线方程,并说明回归模型拟合效果的好坏.x(元)1416182022y(件)1210753【解析】(14+16+18+20+22)=18,(12+10+7+5+3)=7.4,=142+162+182+202+222=1 660,xiyi=1412+1610+187+205+223=620,所以 =-1.15.=7.4+1.1518=28.1,所以所求回归直线方程为 =-1.15x+28.1.1x51y552ii 1x5i 15iii 15222ii 1x y5xy620 5 18 7.4b1 660 5 18x5xa y bx y列出残差表:所以 R2=1-0.994,故回
4、归模型的拟合效果很好.0 0.3-0.4-0.1 0.2 4.6 2.6-0.4-2.4-4.4 iiyyiyy5522iiii 1i 1(yy)0.3(yy)53.2,52iii 152ii 1yyyy【方法技巧】刻画回归效果的三个方式(1)残差图法:残差点比较均匀地落在水平的带状区域内说明选用的模型比较 合适.(2)残差平方和法:残差平方和 越小,模型的拟合效果越好.(3)相关指数法:R2=1-越接近1,表明回归的效果越好.n2iii 1(yy)52iii 152ii 1yyyy 题组训练三 独立性检验 【典例3】为了了解青少年的肥胖是否与常喝碳酸饮料有关,现对30名青少年 进行调查,得到
5、如下列联表:已知从这30名青少年中随机抽取1名,抽到肥胖青少年的概率为 .项目常喝不常喝总计肥胖2不肥胖18总计30415(1)请将上面的列联表补充完整;(2)能否在犯错误的概率不超过0.005的前提下认为青少年的肥胖与常喝碳酸饮料有关?【解析】(1)设常喝碳酸饮料且肥胖的青少年有x名,则 解得x=6.x243015,列联表如下:(2)由第一问中列联表中的数据可求得随机变量K2的观测值k=8.5237.879,因此在犯错误的概率不超过0.005的前提下认为青少年的肥胖与常喝碳酸饮料 有关.项目常喝不常喝总计肥胖628不肥胖41822总计1020302306 182 410 20 8 22()【方法技巧】独立性检验的两个关键(1)弄清问题中的两个分类变量及其取值分别是什么,其次掌握22列联表的结构特征.(2)利用22列联表计算K2的观测值,再结合临界值表来分析相关性的大小.