1、章末复习提升课第二章 统计 一汽车厂生产 A,B,C 三类轿车,每类轿车均有舒适型和标准型两种型号,某月的产量(单位:辆)如下表:轿车 A轿车 B轿车 C舒适型100150z标准型300450600抽样方法按类用分层抽样的方法在这个月生产的轿车中抽取 50 辆,其中A 类轿车有 10 辆(1)求 z 的值;(2)用分层抽样的方法从 C 类轿车中抽取一个容量为 5 的样本,则舒适型、标准型的轿车应分别抽取多少辆?【解】(1)设该厂本月生产轿车 n 辆,由题意得50n 10100300,所以 n2 000,则 z2 000100300150450600400.(2)设所抽取的样本中有 m 辆舒适型
2、轿车,因为用分层抽样的方法从 C 类轿车中抽取一个容量为 5 的样本,所以由(1)知 4001 000m5,解得 m2,则在 C 类轿车中抽取 2 辆舒适型轿车,3 辆标准型轿车应用抽样方法抽取样本应注意的问题(1)用随机数表法抽样时,对个体所编的号码位数要相等当问题所给位数不相等时,以位数较多的为准,在位数较少的数前面添“0”,凑齐位数(2)用系统抽样法抽样时,如果总体容量 N 能被样本容量 n 整除,则抽样间隔为 kNn;如果总体容量 N 不能被样本容量 n 整除,则 先 用 简 单 随 机 抽 样 剔 除 多 余 个 体,抽 样 间 隔 为 k Nn.Nn 表示取Nn的整数部分 (3)三
3、种抽样方法的适用范围:当总体容量较小,样本容量也较小时,可采用抽签法;当总体容量较大,样本容量较小时,可采用随机数表法;当总体容量较大,样本容量也较大时,可采用系统抽样;当总体中个体差异较显著时,可采用分层抽样 在 100 个零件中,有一级品 20 个,二级品 30个,三级品 50 个,现从中抽取 20 个作为样本(1)采用简单随机抽样,抽签取出 20 个;(2)采用系统抽样,将零件随机编号为 00,01,02,99,分成 20 组,每组 5 个,然后抽取 20 个;(3)采用分层抽样,从一级品中随机抽取 4 个,从二级品中随机抽取 6 个,从三级品中随机抽取 10 个对于上述三种抽样方法,下
4、列说法中正确的是_(填序号)三种抽样方法中每个个体被抽到的概率都是15;只有(1)(2)的抽样方法中每个个体被抽到的概率是15;只有(1)(3)的抽样方法中每个个体被抽到的概率是15;三种抽样方法中每个个体被抽到的概率各不相同解析:三种抽样方法中每个个体被抽到的概率都相同,因为只要是随机编号、随机抽取,不管采用什么方法,每个个体被抽到的概率都相等,因此只有是正确的 答案:下表给出了某校 500 名 12 岁男孩中用随机抽样得出的 120人的身高资料(单位:cm):区间界限 122,126)126,130)130,134)134,138)138,142)人数58102233区间界限 142,14
5、6)146,150)150,154)154,158人数201165(1)列出样本的频率分布表(频率保留两位小数);(2)画出频率分布直方图;(3)估计身高低于 134 cm 的人数占总人数的百分比用样本的频率分布估计总体的分布【解】(1)列出样本频率分布表:分组频数频率122,126)50.04126,130)80.07130,134)100.08134,138)220.18138,142)330.28142,146)200.17146,150)110.09150,154)60.05154,15850.04 合计1201.00(2)画出频率分布直方图,如图所示(3)因为样本中身高低于 134
6、cm 的人数的频率为 5810120 231200.19.所以估计身高低于 134 cm 的人数约占总人数的 19%.与频率分布直方图有关问题的常见类型及解题策略(1)已知频率分布直方图中的部分数据,求其他数据,可根据频率分布直方图中的数据求出样本与整体的关系,利用频率和等于 1就可求出其他数据(2)已知频率分布直方图,求某种范围内的数据,可利用图形及某范围结合求解 对某校高三年级学生参加社区服务的次数进行统计,随机抽取 M 名学生,得到这 M 名学生参加社区服务的次数,根据此数据作出了频率分布表和频率分布直方图,如图所示:分组频数频率10,15)100.2515,20)24n20,25)mp
7、25,3020.05合计M1(1)求表中 M,p 及图中 a 的值;(2)若该校高三学生有 240 人,试估计该校高三学生参加社区服务的次数在区间10,15)内的人数解:(1)由分组10,15)的频数是 10,频率是 0.25,知 10M0.25,解得 M40.因为频数之和为 40,所以 1024m240,得 m4,pmM 4400.10.因为 a 是对应分组15,20)的频率与组距的商,所以 a 244050.12.(2)因为该校高三学生有 240 人,分组10,15)的频率是 0.25,所以估计该校高三学生参加社区服务的次数在区间10,15)内的人数为2400.2560.从某企业生产的某种
8、产品中抽取 100 件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:质量指标值分组75,85)85,95)95,105)105,115)115,125频数62638228用样本的数字特征估计总体的数字特征(1)根据上表画出产品质量指标的频率分布直方图;(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于 95 的产品至少要占全部产品的 80%”的规定?【解】(1)产品质量指标的频率分布直方图如图(2)质量指标值的样本平均数为 800.06900.261000.38110
9、0.221200.08100.质量指标值的样本方差为 s2(20)20.06(10)20.26020.381020.222020.08104.所以这种产品质量指标值的平均数的估计值为 100,方差的估计值为 104.(3)质量指标值不低于 95 的产品所占比例的估计值为 0.380.220.080.68.由于该估计值小于 0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于 95 的产品至少要占全部产品的 80%”的规定用样本的数字特征估计总体的数字特征应注意的问题(1)众数、中位数、平均数的含义及求法(2)方差、标准差的计算(3)中位数用来描述分类变量的中心位置,众数体现了数据的最大
10、集中点,平均数反映样本数据的总体水平(4)标准差(方差)反映了数据的离散与集中、波动与稳定的程度标准差(方差)较大,数据的离散程度较大;标准差(方差)较小,数据的离散程度较小 某市为了考核甲、乙两部门的工作情况,随机访问了 50 位市民根据这 50 位市民对这两部门的评分(评分越高表明市民的评价越高),绘制茎叶图如图:甲部门 乙部门359 440448 975122456677789976653321106011234688 98877766555554443332100700113449 66552008123345 6322209011456 10000(1)分别估计该市的市民对甲、乙两部
11、门评分的中位数;(2)根据茎叶图分析该市的市民对甲、乙两部门的评价解:(1)由所给茎叶图知,50 位市民对甲部门的评分由小到大排序,排在第 25,26 位的是 75,75,故样本中位数为 75,所以该市的市民对甲部门评分的中位数的估计值是 75.50 位市民对乙部门的评分由小到大排序,排在 25,26 位的是66,68,故样本中位数为6668267,所以该市的市民对乙部门评分的中位数的估计值是 67.(2)由所给茎叶图知,市民对甲部门的评分的中位数高于对乙部门的评分的中位数,而且由茎叶图可以大致看出对甲部门的评分的标准差要小于对乙部门的评分的标准差,说明该市市民对甲部门的评价较高、评价较为一致
12、,对乙部门的评价较低、评价差异较大 为了解某地区某种农产品的年产量 x(单位:吨)对价格y(单位:千元/吨)和年利润 z 的影响,对近五年该农产品的年产量和价格统计如下表:x12345y7.06.55.53.82.2线性回归分析(1)求 y 关于 x 的线性回归方程ybxa;(2)若每吨该农产品的成本为 2 千元,假设该农产品可全部卖出,预测当年产量为多少时,年利润 z 取到最大值?(保留两位小数)参考公式:bni1(xi x)(yi y)ni1(xi x)2ni1xiyin x yni1x2in x2,a yb x.【解】(1)x3,y5,5i1xiyi62.7,5i1x2i55,解得b1.
13、23,a8.69,所以y8.691.23x.(2)年利润 zx(8.691.23x)2x 1.23x26.69x,所以当 x2.72 时,年利润 z 最大 即当年产量约为 2.72 吨时,年利润最大(1)线性回归方程的意义 回归直线方程ybxa中,当回归系数b0 时,说明两个变量成正相关关系,它的意义是:当 x 每增加一个单位时,y 就增加b个单位;当b0 时,说明两个变量成负相关关系,它的意义是:当 x 每增加一个单位时,y 就减少|b|个单位(2)相关性检验 散点图法(粗略判断线性相关关系)相关系数法(定量判断线性相关关系)r 的范围为1r1,r 为正时,x,y 正相关;r 为负时,x,y
14、负相关;|r|越接近于 1,x 与 y 的相关程度越大;|r|越接近于 0,二者的相关程度越小;当|r|1 时,所有数据点都在一条直线上 若 x,y 具有线性相关关系时,可求线性回归方程,否则即使求出回归直线方程也毫无意义 在 7 块并排、形状大小相同的实验田上进行施化肥量对水稻产量影响的试验,得数据列表(单位:kg):施化肥量 x15202530354045水稻产量 y330345365405445450455(1)画出散点图;(2)求水稻产量 y 与施化肥量 x 之间的回归直线方程;(3)当施化肥 50 kg 时,对水稻的产量予以估计 解:(1)画出散点图如图:由散点图知,施化肥量与水稻产
15、量是线性相关的(2)借助计算器列表:i1234567 xi15202530354045 yi330345365405445450455 xiyi4 950 6 900 9 125 12 150 15 575 18 000 20 475x30,y399.3,7i1x2i7 000,7i1xiyi87 175 计算得:b87 175730399.37 00073024.75,a399.34.7530256.8.即得回归直线方程y4.75x256.8.(3)施化肥 50 kg 时,可以估计水稻产量约为 494.3 kg.1(2019河北省沧州市期末考试)某学校高一、高二年级共有 1 800人,现按照
16、分层抽样的方法,抽取 90 人作为样本进行某项调查若样本中高一年级学生有 42 人,则该校高一年级学生共有()A420 人 B480 人C840 人D960 人解析:选 C.由题意需要从 1 800 人中抽取 90 人,所以抽样比为901 800 120.又样本中高一年级学生有 42 人,所以该校高一年级学生共有 4220840(人)故选 C.2(2019黑龙江省大庆第一中学期末考试)一支田径队有男运动员 560 人,女运动员 420 人,为了解运动员的健康情况,从男运动员中任意抽取 16 人,从女生中任意抽取 12 人进行调查,这种抽样方法是()A简单随机抽样法B抽签法C随机数表法D分层抽样
17、法解析:选 D.总体由男生和女生组成,比例为 56042043,所抽取的比例也是 161243.故选 D.3(2019陕西省西安市长安区第一中学期末考试)如图所示是一容量为 100 的样本的频率分布直方图,则由图形中的数据,样本落在5,10内的频数为()A50 B40C30 D20解析:选 D.第一个小矩形的面积为 0.0450.2,所以样本落在5,10内的频数为 0.210020.故选 D.4(2019广西钦州市期末考试)若某中学高二年级 8 个班参加合唱 比 赛 的 得 分 如 茎 叶 图 所 示,则 这 组 数 据 的 中 位 数 是_解析:本题一共八个数字,分别是 84、85、89、90、91、92、93、95,故中位数是9091290.5.答案:90.5本部分内容讲解结束 按ESC键退出全屏播放