1、第一章 统计案例章末综合提升 巩 固 层 知 识 整 合 提 升 层 题 型 探 究 回归分析【例 1】为研究某种图书每册的成本费 y(元)与印刷数 x(千册)的关系,收集了一些数据并作了初步处理,得到了下面的散点图及一些统计量的值xyu8i1(xix)28i1(xix)(yiy)8i1(uiu)28i1(uiu)(yiy)15.25 3.63 0.2692 085.5230.30.7877.049其中 ui1xi,u188i1ui.(1)根据散点图判断:yabx 与 ycdx哪一个更适合作为每册成本费 y(元)与印刷数 x(千册)的回归方程类型?(只要求给出判断,不必说明理由)(2)根据(1
2、)的判断结果及表中数据,建立 y 关于 x 的回归方程(回归系数的结果精确到 0.01);(3)若每册书定价为 10 元,则至少应该印刷多少千册才能使销售利润不低于 78 840 元?(假设能够全部售出,结果精确到 1)(附:对于一组数据(1,v1),(2,v2),(n,vn),其回归直线 v a 的 斜 率 和 截 距 的 最 小 二 乘 法 估 计 分 别 为 ni1 ivivni1 i2,v)思路探究:(1)借助散点图求解;(2)令 u1x建立 y 关于 u 的线性回归方程建立 y 关于 x的线性回归方程;(3)建立利润函数 f(x),解 f(x)78.840 得 x 的范围 解(1)由
3、散点图判断,ycdx适合作为每册成本费 y(元)与印刷册数 x(千册)的回归方程(2)令 u1x,先建立 y 关于 u 的线性回归方程,由于d8i1 uiuyiy8i1 uiu27.0490.7878.9578.96,cyd u3.638.9570.2691.22,y 关于 u 的线性回归方程为y1.228.96u,从而 y 关于 x 的线性回归方程为 y1.228.96x.(3)假设印刷 x 千册,依题意:10 x1.228.96xx78.840.即 8.78x87.8,解得 x10,至少印刷 10 千册才能使销售利润不低于 78 840 元求线性回归方程的基本步骤注意:对非线性回归问题应利
4、用变量代换,把问题化为线性回归分析问题,使之得到解决跟进训练1在一段时间内,某种商品的价格 x 元和需求量 y 件之间的一组数据为:x(元)14 16 18 20 22 y(件)12 10753 且知 x 与 y 具有线性相关关系,求出 y 关于 x 的线性回归方程,并说明拟合效果的好坏解 x15(1416182022)18,y15(1210753)7.4,i15x2i1421621822022221 660,i15y2i122102725232327,i15xiyi14121610187205223620,所以bi15xiyi5 x yi15x2i5x 26205187.41 6605182
5、 1.15,所以a7.41.151828.1,所以 y 关于 x 的线性回归方程为y1.15x28.1,列出残差表为 yiyi00.3 0.4 0.10.2 yi y4.6 2.6 0.4 2.4 4.4 所以i15(yiyi)20.3,i15(yi y)253.2,R21i15yiyi2i15yiy20.994.所以 R20.994,拟合效果较好.独立性检验【例 2】户外运动已经成为一种时尚运动,某单位为了了解员工喜欢户外运动是否与性别有关,决定从本单位全体 650 人中采用分层抽样的办法抽取 50 人进行问卷调查,得到了如下列联表:喜欢户外运动 不喜欢户外运动 总计 男性5女性10 总计5
6、0 已知在这 50 人中随机抽取 1 人,抽到喜欢户外运动的员工的概率是35.(1)请将上面的列联表补充完整;(2)求该公司男、女员工各多少人;(3)在犯错误的概率不超过 0.005 的前提下能否认为喜欢户外运动与性别有关?并说明你的理由下面的临界值表仅供参考:P(K2k0)0.150.100.050.025 0.010 0.0050.001 k02.072 2.706 3.841 5.024 6.635 7.879 10.828(参考公式:K2nadbc2abcdacbd,其中 nabcd)解(1)因为在全部 50 人中随机抽取 1 人抽到喜欢户外运动的员工的概率是35,所以喜欢户外运动的男
7、女员工共 30 人,其中男员工20 人,列联表补充如下:喜欢户外运动 不喜欢户外运动 总计 男性20525女性101525总计302050(2)该公司男员工人数为 2550650325(人),则女员工有 325人(3)K2 的观测值 k5020151052302025258.3337.879,所以在犯错误的概率不超过 0.005 的前提下认为喜欢户外运动与性别有关独立性检验的一般步骤 1提出假设 H0:和没有关系;2根据 22 列联表计算 K2 的观测值;3根据 K2 的观测值与临界值的大小关系作统计推断.跟进训练2研究人员选取 170 名青年男女大学生的样本,对他们进行一种心理测验发现有 6
8、0 名女生对该心理测验中的最后一个题目的反应是:作肯定的有 22 名,否定的有 38 名;男生 110 名在相同的项目上作肯定的有 22 名,否定的有 88 名问:性别与态度之间是否存在某种关系?分别用条形图和独立性检验的方法判断解 建立性别与态度的 22 列联表如下:肯定 否定 总计 男生2288110 女生223860总计44126170 根据列联表中所给的数据,可求出男生中作肯定态度的频率为 221100.2,女生中作肯定态度的频率为22600.37.作等高条形图如图,其中两个深色条形的高分别表示男生和女生中作肯定态度的频率,比较图中深色条形的高可以发现,女生中作肯定态度的频率明显高于男生中作肯定态度的频率,因此可以认为性别与态度有关系 根据列联表中的数据得到 K2 的观测值 k17022382288211060441265.6225.024.因此,在犯错误的概率不超过 0.025 的前提下认为性别和态度有关系点击右图进入 专 题 强 化 训 练 Thank you for watching!