1、第二节 用样本估计总体基础梳理1.作频率分布直方图的步骤(1)求极差(即一组数据中与的差);(2)决定与;(3)将数据;(4)列;(5)画2.频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的,就得到频率分布折线图;(2)总体密度曲线:随着的增加,作图时增加,减小,相应的频率折线图会越来越接近于一条光滑曲线,即总体密度曲线5.用茎叶图刻画数据有两个优点(1)所有的信息都可以从;(2)茎叶图便于,能够展示数据的分布情况但当样本数据较多或数据位数较多时,茎叶图的效果就不是很好了3.众数、中位数、平均数(1)在一组数据中,出现次数的数据叫做这组数据的众数(2)将一
2、组数据按大小依次排列,把处在位置的一个数据(或中间两个数据的平均数)叫做这组数据的中位数(3)如果有n个数x1,x2,xn,那么=叫做这n个数的平均数4.标准差和方差(1)标准差是样本数据到平均数的一种;(2)s=;(3)方差:s2=(xn是样本数据,n是样本容量,是样本平均数)答案:1.(1)最大值 最小值(2)组距 组数(3)分组(4)频率分布表(5)频率分布直方图2.(1)中点(2)样本容量 所分的组数 组距 3.(1)最多(2)中间(3)4.(1)平均距离(2)(3)5.(1)图中得到(2)记录和表示 基础达标1.(教材改编题)关于频率分布直方图的下列说法中,正确的是()A.直方图的高
3、表示某数的频率B.直方图的高表示该组上的个体在样本中出现的频率C.直方图的高表示该组上的个体与组距的比值D.直方图的高表示该组上的个体在样本中出现的频率与组距的比值解析:在频率分布直方图中,每一个小矩形都是等宽的,即等于组距,其面积表示数据的取值落在相应区间上的频率,因此每一个小矩形的高表示该组上的个体在样本中出现的频率与组距的比值,所以选D.答案:D2.已知一组按大小排列好的数据为-1,0,4,x,6,15,且这组数据的中位数是5,那么这组数据的众数为()A.5B.6C.4D.5.5解析:由题意知=5,则x=6.答案:B3.根据某水文观测点的历史统计数据,得到某条河流水位的频率分布直方图(如
4、图).从图中可以看出,该水文观测点平均至少一百年才遇到一次的洪水的最低水位是()A.48米B.49米C.50米D.51米解析:由频率分布直方图知水位为50米的频率为1%*1=0.01,即水文观测点平均至少一百年才遇到一次的洪水的最低水位是50米.选C.答案:C4.(教材改编题)从一堆苹果中任取5只,称得它们的质量如下(单位:克):125,124,121,123,127,则该样本标准差s=(克)(用数字作答).甲乙829913452548267855356675.(2010浙江)在如图所示的茎叶图中,甲、乙两组数据的中位数分别是,.(12+02+32+12+32)=4,所以s=2.解析:因为样本
5、平均数x=(125+124+121+123+127)=124,则样本方差s2=答案:2解析:中位数是一组数据按照大小顺序排列后中间位置的数由茎叶图易得答案答案:4546经典例题题型一 用样本的频率分布直方图估计总体【例1】(2010安徽)某市2010年4月1日-4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45.(1)完成频率分布表;(2)作出频率分布直方图;(3)根据国家标准,污染指数在0-50
6、之间时,空气质量为优;在51-100之间时,为良;在101-150之间时,为轻微污染;在151-200之间时,为轻度污染请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价解析:(1)频率分布表如下:分组频数频率41,51)251,61)161,71)471,81)681,91)1091,101)5101,111)2(2)频率分布直方图如下:(3)答对下述两条中的一条即可该市一个月中空气污染指数有2天处于优的水平,占当月天数的处于优或良的天数共有28天,占当月天数的.;有26天处于良的水平,占当月天数的;说明该市空气质量基本良好轻微污染有2天,占当月天数的,污染指数在80以上的接近轻微
7、污染的天数有15天,加上处于轻微污染的天数,共有17天,占当月天数的,超过50%,说明该市空气质量有待进一步改善 题型二 茎叶图的应用【例2】(2011浙江绍兴模拟)某良种培育基地正在培育一种小麦新品种A,将其与原有的一个优良品种B进行对照试验,两种小麦各种植了25亩,所得亩产数据(单位:千克)如下:品种A:357,359,367,368,375,388,392,399,400,405,412,414,415,421,423,423,427,430,430,434,443,445,445,451,454品种B:363,371,374,383,385,386,391,392,394,394,39
8、5,397,397,400,401,401,403,406,407,410,412,415,416,422,430(1)画出茎叶图;(2)用茎叶图处理现有的数据,有什么优点?(3)通过观察茎叶图,对品种A与B的亩产量及其稳定性进行比较,写出统计结论 解析:(1)茎叶图如图所示:AB973587363537148383569239124457750400113675424102567331422400430553444145变式2-1随机抽取某中学甲乙两班各10名同学,测量他们的身高(单位:cm),获得身高数据的茎叶图如图所示.(1)根据茎叶图判断哪个班的平均身高较高;(2)计算甲班的样本方差甲
9、班 乙班2181991017036898832162588159(2)用茎叶图处理现有的数据不仅可以看出数据的分布状况,而且可以看出每组中的具体数据(3)由计算得品种A的平均每亩产量为411.08千克,品种B的平均亩产量为397.8千克由此可知,品种A的平均亩产量比品种B的平均亩产量高但品种A的亩产量不够稳定,而品种B的亩产量比较集中在平均产量附近(158-170)2+(162-170)2+(163-170)2+(168-170)2+(168-170)2+(170-170)2+(171-170)2+(179-170)2+(179-170)2+(182-170)2=57.2.=170,甲班的样本
10、方差为解析:(1)由茎叶图可知:甲班身高集中于160179之间,而乙班身高集中于170180之间因此乙班平均身高高于甲班(2)题型三 用样本的数字特征估计总体的数字特征【例3】(2010山东)在某项体育比赛中,七位裁判为一选手打出的分数如下:90899095939493 去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为()A.92,2B.92,2.8C.93,2D.93,2.8解析:去掉一个最高分95与一个最低分89后,所得的5位数分别为90、90、93、94、93,所以,故选B.变式3-1某商场买来一车苹果,从中随机抽取了10个苹果,其重量(单位:克)分别为:150,152,153
11、,149,148,146,151,150,152,147,由此估计这车苹果单个重量的平均值是()A.150.2克 B.149.8克 C.149.4克 D.147.8克解析:=149.8.答案:B链接高考(2010江苏)某棉纺厂为了了解一批棉花的质量,从中随机抽取了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据都在区间5,40中,其频率分布直方图如图所示,则其抽样的100根中,有根棉花纤维的长度小于20 mm.知识准备:知道少于20 mm的频率为(0.01+0.01+0.04)*5.解析:根据直方图可得纤维长度小于20 mm的频率为(0.01+0.01+0.04)*5=0.3,因此有0.3*100=30根棉花纤维的长度小于20 mm.答案:30
Copyright@ 2020-2024 m.ketangku.com网站版权所有