1、学案57用样本估计总体导学目标: 1.了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.2.理解样本数据标准差的意义和作用,会计算数据标准差.3.能从样本数据中提取基本的数字特征(如平均数、标准差),并给出合理的解释.4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.5.会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题自主梳理1在频率分布直方图中,纵轴表示_,数据落在各小组内的频率用_表示,所有长方形面积之和_2作频率分布直方图的步骤(1)求极差(即一组数据中_与_的差);
2、(2)决定_与_;(3)将数据_;(4)列_;(5)画_3频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的_,就得频率分布折线图(2)总体密度曲线:随着_的增加,作图时_增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线4当样本数据较少时,茎叶图表示数据的效果较好,一是统计图上没有原始数据丢失,二是方便记录与表示,但茎叶图一般只便于表示两位有效数字的数据5众数、中位数、平均数(1)在一组数据中,出现次数_的数据叫做这组数据的众数(2)将一组数据按大小依次排列,把处在_位置的一个数据(或中间两个数据的平均数)叫做这
3、组数据的中位数(3)如果有n个数x1,x2,xn,那么_叫做这n个数的平均数6标准差和方差(1)标准差是样本数据到平均数的一种_(2)标准差:s _.(3)方差:s2_(xn是样本数据,n是样本容量,是样本平均数)自我检测1在抽查产品的尺寸过程中,将其尺寸分成若干组,a,b)是其中的一组,抽查出的个体在该组上的频率为m,该组在频率分布直方图的高为h,则|ab|等于()Ahm B. C. Dhm2(2010福建)若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是()A.91.5和91.5 B91.5和92C91和91.5 D92和923(2011滨州模拟)在样本
4、的频率分布直方图中,共有11个小长方形,若中间一个小长方形的面积等于其他10个小长方形的面积和的,且样本容量为160,则中间一组的频数为()A32 B0.2 C40 D0.254(2010山东)样本中共有五个个体,其值分别为a,0,1,2,3.若该样本的平均值为1,则样本方差为()A. B. C. D25(2010江苏)某棉纺厂为了解一批棉花的质量,从中随机抽测了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据均在区间5,40中,其频率分布直方图如图所示,则在抽测的100根中,有_根棉花纤维的长度小于20 mm.探究点一频率分布直方图例1(2011福州调研)如图是某市有关
5、部门根据该市干部的月收入情况,作抽样调查后画出的样本频率分布直方图,已知图中第一组的频数为4 000,请根据该图提供的信息解答下列问题:(图中每组包括左端点,不包括右端点,如第一组表示收入在1 000,1 500)(1)求样本中月收入在2 500,3 500)的人数;(2)为了分析干部的收入与年龄、职业等方面的关系,必须从样本的各组中按月收入再用分层抽样方法抽出100人作进一步分析,则月收入在1 500,2 000)的这段应抽多少人?(3)试估计样本数据的中位数变式迁移1为了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况,得到频率分布直方图如图,由于不慎将部分数据丢失,但
6、知道前4组频数成等比数列,后6组的频数成等差数列,设最大频率为a,视力在4.6到5.0之间的学生数为b,则a,b值分别为()A0.27,78 B0.27,83C2.7,78 D2.7,83探究点二用样本数字特征估计总体数字特征例2甲、乙、丙三名射箭运动员在某次测试中各射箭20次,三人的测试成绩如表所示:甲的成绩环数78910频数5555乙的成绩环数78910频数6446丙的成绩环数78910频数4664s1、s2、s3分别表示甲、乙、丙三名运动员这次测试成绩的标准差,则有()As3s1s2 Bs2s1s3Cs1s2s3 Ds2s3s1变式迁移2甲、乙两名射击运动员参加某大型运动会的预选赛,他们
7、分别射击了5次,成绩如下表(单位:环):甲108999乙1010799如果甲、乙两人中只有1人入选,则入选的最佳人选应是_探究点三用茎叶图分析数据例3随机抽取某中学甲、乙两班各10名同学,测量他们的身高(单位:cm),获得身高数据的茎叶图如图(1)根据茎叶图判断哪个班的平均身高较高;(2)计算甲班的样本方差;(3)现从乙班这10名同学中随机抽取两名身高不低于173 cm的同学,求身高为176 cm的同学被抽中的概率变式迁移3(2011汉沽模拟)某班甲、乙两学生的高考备考成绩如下:甲:512554528549536556534541522538乙:515558521543532559536548
8、527531(1)用茎叶图表示两学生的成绩;(2)分别求两学生成绩的中位数和平均分1几种表示频率分布的方法的优点与不足:(1)频率分布表在数量表示上比较确切,但不够直观、形象,分析数据分布的总体态势不太方便(2)频率分布直方图能够很容易地表示大量数据,非常直观地表明分布的形状,使我们能够看到在分布表中看不清楚的数据模式但从直方图本身得不出原始的数据内容,也就是说,把数据表示成直方图后,原有的具体数据信息就被抹掉了(3)频率分布折线图的优点是它反映了数据的变化趋势,如果样本容量不断增大,分组的组距不断缩小,那么折线图就趋向于总体分布的密度曲线(4)用茎叶图优点是原有信息不会抹掉,能够展示数据的分
9、布情况,但当样本数据较多或数据位数较多时,茎叶图就显得不太方便了2标准差、方差描述了一组数据围绕平均数波动的大小标准差、方差越大,数据的离散程度越大,标准差、方差越小,数据的离散程度越小,因为方差与原始数据的单位不同,且平方后可能夸大了偏差的程度,所以虽然方差与标准差在刻画样本数据的分散程度上是一样的,但在解决实际问题时,一般多采用标准差(满分:75分)一、选择题(每小题5分,共25分)1(2010陕西)如图,样本A和B分别取自两个不同的总体,它们的样本平均数分别为A和B,样本标准差分别为sA和sB,则()A.AB,sAsB B.AsBC.AB,sAsB D.AB,sAbc Bbca Ccab
10、 Dcba3(2011金华十校模拟)为了了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况,得到频率分布直方图如图,由于不慎将部分数据丢失,但知道后五组频数和为62,设视力在4.6到4.8之间的学生数为a,最大频率为0.32,则a的值为()A64 B54 C48 D274下图是某学校举行的运动会上,七位评委为某体操项目打出的分数的茎叶统计图,去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为()A84,4.84 B84,1.6C85,1.6 D85,45(2011四川)有一个容量为66的样本,数据的分组及各组的频数如下:11.5,15.5)215.5,19.5)41
11、9.5,23.5)923.5,27.5)1827.5,31.5)1131.5,35.5)1235.5,39.5)739.5,43.5)3根据样本的频率分布估计,数据落在31.5,43.5)的概率约是()A. B.C. D.二、填空题(每小题4分,共12分)6(2010天津)甲、乙两人在10天中每天加工零件的个数用茎叶图表示如下图,中间一列的数字表示零件个数的十位数,两边的数字表示零件个数的个位数,则这10天甲、乙两人日加工零件的平均数分别为_和_7(2010福建)将容量为n的样本中的数据分成6组,绘制频率分布直方图,若第一组至第六组数据的频率之比为234641,且前三组数据的频数之和等于27,
12、则n等于_8(2011江苏)某老师从星期一到星期五收到的信件数分别为10,6,8,5,6,则该组数据的方差s2_.三、解答题(共38分)9(12分)甲、乙两人参加某体育项目训练,近期的五次测试成绩得分情况如图所示(1)分别求出两人得分的平均数与方差;(2)根据图和上面算得的结果,对两人的训练成绩作出评价10(12分)(2010湖北)为了了解一个小水库中养殖的鱼的有关情况,从这个水库中多个不同位置捕捞出100条鱼,称得每条鱼的质量(单位:kg),并将所得数据分组,画出频率分布直方图(如图所示)(1)在下面表格中填写相应的频率;分组频率(2)估计数据落在中的概率为多少;(3)将上面捕捞的100条鱼
13、分别作一记号后再放回水库几天后再从水库的多处不同位置捕捞出120条鱼,其中带有记号的鱼有6条请根据这一情况来估计该水库中鱼的总条数11(14分)(2010安徽)某市2010年4月1日4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45.(1)完成频率分布表(2)作出频率分布直方图(3)根据国家标准,污染指数在050之间时,空气质量为优;在51100之间时,为良;在101150之间时,为轻微污染;在1
14、51200之间时,为轻度污染请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价学案57用样本估计总体自主梳理1频率与组距的比值小长方形的面积等于12.(1)最大值最小值(2)组距组数(3)分组(4)频率分布表(5)频率分布直方图3.(1)中点(2)样本容量所分的组数5.(1)最多(2)中间(3)6.(1)平均距离(2)(3)(x1)2(x2)2(xn)2自我检测1C2.A3.A4.D530课堂活动区例1解题导引(1)解关于图形信息题的关键是正确理解各种统计图表中各个量的含义,灵活运用这些信息和数据去发现结论(2)在频率分布直方图中,最高矩形的中点对应值是众数;而中位数的左右两边的直方
15、图面积相等;平均数是直方图的“重心”解(1)月收入在1 000,1 500)的概率为0.000 85000.4,且有4 000人,样本的容量n10 000;月收入在1 500,2 000)的频率为0.000 45000.2;月收入在2 000,2 500)的频率为0.000 35000.15;月收入在3 500,4 000)的频率为0.000 15000.05.月收入在2 500,3 500)的频率为1(0.40.20.150.05)0.2.样本中月收入在2 500,3 500)的人数为0210 0002 000.(2)月收入在1 500,2 000)的人数为0.210 0002 000,再从
16、10 000人中用分层抽样方法抽出100人,则月收入在1 500,2 000)的这段应抽取10020(人)(3)由(1)知月收入在1 000,2 000)的频率为0.40.20.60.5,样本数据的中位数为1 5001 5002501 750(元)变式迁移1A由频率分布直方图知组距为0.1.434.4间的频数为1000.10.11.444.5间的频数为1000.10.33.又前4组的频数成等比数列,公比为3.从而4.64.7间的频数最大,且为13327.a0.27.根据后6组频数成等差数列,且共有1001387(人)设公差为d,则627d87.d5,从而b427(5)78.例2B由已知可得甲、
17、乙、丙的平均成绩均为8.5.方法一s(x1)2(x2)2(xn)2,s1.同理s2,s3,s2s1s3.方法二s(xxx)2,s(5725825925102)8.5273.572.251.25,s1.同理s2,s3,s2s1s3.变式迁移2甲解析甲乙9,s(910)2(98)2(99)2(99)2(99)2,s(910)2(910)2(97)2(99)2(99)2s,故甲更稳定,故选甲例3解题导引茎叶图在样本数据较少,较为集中且位数不多时比较适用由于它较好地保留了原始数据,所以可以帮助我们分析样本数据的大致频率分布,还可以用来分析样本数据的一些数字特征但当样本数据较多时,茎叶图就显得不太方便了
18、因为数据较多时,枝叶就会很长,需要占据较多的空间解(1)由茎叶图可知:甲班身高集中于160179之间,而乙班身高集中于170180之间因此乙班平均身高高于甲班(2)170,甲班的样本方差为(158170)2(162170)2(163170)2(168170)2(168170)2(170170)2(171170)2(179170)2(179170)2(182170)257.2.(3)设身高为176 cm的同学被抽中的事件为A,从乙班10名同学中抽中两名身高不低于173 cm的同学有:(181,173),(181,176),(181,178),(181,179),(179,173),(179,17
19、6),(179,178),(178,173),(178,176),(176,173)共10个基本事件,而事件A含有4个基本事件,P(A).变式迁移3解(1)两学生成绩的茎叶图如图所示(2)将甲、乙两学生的成绩从小到大排列为:甲:512522528534536538541549554556乙:515521527531532536543548558559从以上排列可知甲学生成绩的中位数为537.乙学生成绩的中位数为534.甲学生成绩的平均分为500537,乙学生成绩的平均分为500537.课后练习区1BA中的数据都不大于B中的数据,所以AsB.2D平均数a(15171410151717161412
20、)14.7.中位数b15,众数c17.cba.3B前两组中的频数为100(0.050.11)16.后五组频数和为62,前三组为38.第三组为22.又最大频率为0.32的最大频数为0.3210032,a223254.4C去掉最高分93,最低分79,平均数为(8484868487)85,方差s2(8485)2(8485)2(8685)2(8485)2(8785)21.6.5B由条件可知,落在31.5,43.5)的数据有127322(个),故所求概率约为.62423解析甲(1022053031767)24,乙(10320430317112)23.760解析第一组至第六组数据的频率之比为234641,
21、前三组频数为n27,故n60.83.2解析7,s2(107)2(67)2(87)2(57)2(67)23.2.9解(1)甲、乙两人五次测试的成绩分别为:甲10分13分12分14分16分乙13分14分12分12分14分甲、乙两人的平均成绩甲乙,都是13分,(4分)s(1013)2(1313)2(1213)2(1413)2(1613)24,s(1313)2(1413)2(1213)2(1213)2(1413)20.8.(8分)(2)由ss,可知乙的成绩较稳定从折线图看,甲的成绩基本上呈上升状态,而乙的成绩在平均线上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高(12分)10解(1)根据频率
22、分布直方图可知,频率组距(频率/组距),故可得下表:分组频率0.050.200.280.300.150.02(6分)(2)因为0.300.150.020.47,所以数据落在1.15,1.30)中的概率约为0.47.(9分)(3)因为2 000,所以水库中鱼的总条数约为2 000.(12分)11解(1)频率分布表:分组频数频率41,51)251,61)161,71)471,81)681,91)1091,101)5101,111)2(5分)(2)频率分布直方图如图所示(10分)(3)答对下述两条中的一条即可:该市有一个月中空气污染指数有2天处于优的水平,占当月天数的;有26天处于良的水平,占当月天数的;处于优或良的天数为28,占当月天数的.说明该市空气质量基本良好轻微污染有2天,占当月天数的;污染指数在80以上的接近轻微污染的天数15,加上处于轻微污染的天数2,占当月天数的,超过50%;说明该市空气质量有待进一步改善(14分)