1、 用样本去估计总体(教案)A知识梳理:(必修3教材65-83) 1作频率分布直方图的步骤:(1)求极差(即一组数据中最大值与最小值的差);(2)决定组距与组数;(3)将数据分组;(4)列频率分布表;(5)画频率分布直方图注:频率分布直方图中小正方形的面积=组距=频率。2频率分布折线图和总体密度曲线折线图:连接频率分布直方图中小长方形上端中点,就得到频率分布折线图总体密度曲线:当样本容量足够大,分组越多,折线越接近于一条光滑的曲线,此光滑曲线为总体密度曲线。3用茎叶图刻画数据的两个优点,(1)所有数据都可以从数据中得到;(2)茎叶图便于记录和表示,能够展示数据的分布情况,但当样本数据较多或数据较
2、大时,茎叶图的效果就不是很好了.4.平均数、众数、中位数、标准差和方差(1)、平均数:平均数是用来表示数据的平均水平。一般用来表示,计算公式: (2)、众数:一组数据中出现次数最多的数。(3)、中位数:将数据从小到大的顺序排列,若有奇数个数,则最中间的数是中位数。若有偶数个数,则中间两个数的平均数是中位数。(4)、标准差:是样本数据到平均数的一种平均距离,用来刻画数据的分散程度,一般用s来表示,计算公式: ,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小。(5)方差:方差是标准差的平方,它也可以用来刻画数据的分散程度,计算公式: 。5有样本频率分布估计总体分布通常分为两种情况:
3、(1)、当总体中的个体取不同值很少时,其频率分布表由所取样本的不同值及其相应频率表示,就是相应的条形图;(2)、当总体中的个体不同值很多时,就用频率分布直方图来表示相应的样本的频率分布。6、利用频率分布直方图来估计众数、中位数、平均数在频率分布直方图中,众数的估计值是其中最高矩形底边中点的横坐标;中位数的左边和右边的直方图面积相等;平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和。 二、题型探究探究一图形信息题例1:为了解某小学五年级女生身高(单位:cm)情况,对五年级一部分女生的身高进行了测量,所得数据整理后,列出频率分布表(如下表)(1)、求表中m,n,M,
4、N所表示的两个数分别是多少?(2)、画出频率分布直方图,并利用它估计五年级全体女生身高的众数、中位数、和平均数;(3)、试问:全体女生 中身高在哪个组范围内的人数最多?并估计五年级女生身高在161.5cm以上的概率。分组频数频率145.5-149.51002149.5-153.54008153.5-157.520040157.5-161.515030161.5-165.58016165.5-169.5mN合计MN探究二用样分布估计总体分布例2:为估计一次性木质筷子的用量,1999年从某县共600家高、中、低档饭店抽取10家作样本,这些饭店每天消耗的一次性筷子盒数分别为:0.6 3.7 2.2
5、1.5 2.81.7 1.2 2.1 3.2 1.0(1)通过对样本的计算,估计该县1999年消耗了多少盒一次性筷子(每年按350个营业日计算);(2)2001年又对该县一次性木质筷子的用量以同样的方式作了抽样调查,调查的结果是10个样本饭店,每个饭店平均每天使用一次性筷子2.42盒求该县2000年、2001年这两年一次性木质筷子用量平均每年增长的百分率(2001年该县饭店数、全年营业天数均与1999年相同);(3)在(2)的条件下,若生产一套学生桌椅需木材0.07m3,求该县2001年使用一次性筷子的木材可以生产多少套学生桌椅。计算中需用的有关数据为:每盒筷子100双,每双筷子的质量为5g,
6、所用木材的密度为0.5103kg/m3;(4)假如让你统计你所在省一年使用一次性筷子所消耗的木材量,如何利用统计知识去做,简要地用文字表述出来。解析:(1)所以,该县1999年消耗一次性筷子为2600350=420000(盒)。(2)设平均每年增长的百分率为X,则2(1+X)2=2.42,解得X1=0.1=10%,X2=2.1(不合题意,舍去)。所以,平均每年增长的百分率为10%;(3)可以生产学生桌椅套数为(套)。探究三平均数、标准差(方差)的计算问题例3:在一次歌手大奖赛上,七位评委为歌手甲、乙打出的分数如下: 甲:9.4 8.4 9.4 9.9 9.6 9.4 9.7 乙:9.5 8.8
7、 9.5 9.5 9.9 9.5 9.6根据以上数据,判断他们谁更优秀?解析:7个数据中去掉一个最高分和一个最低分后,余下的5个数为:甲:9.4, 9.4, 9.6, 9.4, 9.5; 乙: 9.5 9.5 9.5 9.5 9.6甲的平均数为:,即。方差为:即 乙的平均数:乙的方差为:探究四综合问题例4: 对某校高一年级学生参加社区服务次数进行统计,随机抽取名学生作为样本,得到这名学生参加社区服务的次数根据此数据作出了频数与频率的统计表和频率分布直方图如下:分组频数频率100.252520.05合计M1求出表中、及图中的值;若该校高一学生有360人,试估计他们参加社区服务的次数在区间内的人数
8、;在所取样本中,从参加社区服务的次数不少于20次的学生中任选2人,求至多一人参加社区服务次数在区间内的概率.解析:【命题意图】本小题主要考查统计与概率的相关知识,具体涉及到频率分布表、频率分布直方图以及概率的初步应用.【试题解析】解:由题可知, , , .又 ,解得 ,.则组的频率与组距之比为0.125. (5分)参加在社区服务次数在区间内的人数为人.(8分)在样本中,处于内的人数为3,可分别记为,处于内的人数为2,可分别记为. 从该5名同学中取出2人的取法有共10种;至多一人在内的情况有共7种,所以至多一人参加社区服务次数在区间内的概率为.三、方法提升1统计是为了从数据中提取信息,学习时根据
9、实际问题的需求选择不同的方法合理地选取样本,并从样本数据中提取需要的数字特征。不应把统计处理成数字运算和画图表。对统计中的概念(如总体、样本等)应结合具体问题进行描述性说明,不应追求严格的形式化定义2当总体中个体取不同值很少时,我们党用样本的频率分布标记频率分布梯形图取估计总体体分布,总体分布排除了抽样造成的错误,精确反映了总体取值的概率分布规律。对于所取不同数值较多或可以在实数区间范围内取值的总体,需用频率分布直方图来表示相应的频率分布。当样本容量无限增大,分组的组距无限缩小时,频率分布直方图无限接近一条光滑曲线总体密度曲线由于总体分布通常不易知道,往往是用样本的频率分布估计总体分布。样本容
10、量越大,估计就越精确四、反思感悟: 五、课时作业一、选择题1一个容量为20的样本数据,分组后,组别与频数如下:组别(10,20(20,30(30,40(40,50(50,60(60,70频数234542则样本在(20,50上的频率为 ()A12%B40% C60% D70%解析:本题考查样本的频率运算据表知样本分布在(20,50的频数34512,故其频率为0.6.答案:C2甲、乙两名同学在五次数学基本能力测试中,成绩统计用茎叶图表示如下,若甲、乙两人的平均成绩分别是X甲、X乙,则下列结论正确的是 ()AX甲X乙,甲比乙成绩稳定 BX甲X乙,乙比甲成绩稳定CX甲X乙,甲比乙成绩稳定 DX甲X乙,
11、乙比甲成绩稳定解析:由茎叶图知识,可知道甲的成绩为68、69、70、71、72,平均成绩为70;乙的成绩为63、68、69、69、71,平均成绩为68;再比较标准差:甲的标准差为,乙的标准差为,故甲比乙的成绩稳定答案:A3200辆汽车通过某一段公路时的时速的频率分布直方图如图所示,时速在50,60)的汽车大约有 ()A30辆 B40辆 C60辆 D80辆解析:面积为频率,在50,60)的频率为0.3,所以大约有2000.360辆答案:C组别频数(0,1012(10,2013(20,3024(30,4015(40,5016(50,6013(60,7074一个容量为100的样本,其数据的分组与各组
12、的频数如下:则样本数据落在(10,40上的频率为 ()A0.13 B0.39 C0.52 D0.64解析:由列表知样本数据落在(10,40上的频数为52,频率为0.52.答案:C5甲、乙两射击运动员进行比赛,射击相同的次数,已知两运动员射击的环数稳定在7,8,9,10环,他们的成绩频率分布条形图如下:由乙击中8环及甲击中10环的概率与甲击中环数的平均值都正确的一组数据依次是()A0.350.258.1 B0.350.258.8C0.250.358.1 D0.250.358.8解析:乙击中8环的概率为10.20.20.350.25;甲击中10环的概率为10.20.150.30.35;甲击中环数的
13、平均值为70.280.1590.3100.358.8.答案:D6设矩形的长为a,宽为b,其比满足b:a0.618,这种矩形给人以美感,称为黄金矩形黄金矩形常应用于工艺品设计中下面是某工艺品厂随机抽取两个批次的初加工矩形宽度与长度的比值样本:甲批次:0.5980.6250.6280.5950.639乙批次:0.6180.6130.5920.6220.620根据上述两个样本来估计两个批次的总体平均数,与标准值0.618比较,正确结论是()A甲批次的总体平均数与标准值更接近B乙批次的总体平均数与标准值更接近C两个批次总体平均数与标准值接近程度相同D两个批次总体平均数与标准值接近程度不能确定解析:0.
14、617,0.613,与0.618更接近答案:A二、填空题7已知总体的各个体的值由小到大依次为2,3,3,7,a,b,12,13.7,18.3,20,且总体的中位数为10.5.若要使该总体的方差最小,则a、b的取值分别是_解析:这10个数的中位数为10.5.这10个数的平均数为10.要使总体方差最小,即(a10)2(b10)2最小又(a10)2(b10)2(21b10)2(b10)2(11b)2(b10)22b242b221,当b10.5时,(a10)2(b10)2取得最小值又ab21,a10.5,b10.5.答案:10.5,10.58某地教育部门为了解学生在数学答卷中的有关信息,从上次考试的1
15、0 000名考生的数学试卷中,用分层抽样的方法抽取500人,并根据这500人的数学成绩画出样本的频率分布直方图(如图)则这10 000人中数学成绩在140,150段的约是_人解析:本题考查了频率直方图的一些知识,由图在140,150的频率为0.00810,所以在10 000人中成绩在140,150的学生有10 0000.00810=800人答案:8009如图是CBA篮球联赛中,甲乙两名运动员某赛季一些场次得分的茎叶图,则平均得分高的运动员是_.解析:从茎叶图上可得甲得分:8,10,15,16,22,23,25,26,27,32,平均值为20.4;乙得分:8,12,14,17,18,19,21,
16、27,28,29,平均值为19.3,平均得分高的运动员是甲答案:甲三、解答题10甲、乙两台机床同时加工直径为100 mm的零件,为了检验产品的质量,从产品中各随机抽取6件进行测量,测得数据如下(单位 mm):甲:99,100,98,100,100,103 乙:99,100,102,99,100,100(1)分别计算上述两组数据的平均数和方差;(2)根据(1)的计算结果,说明哪一台机床加工的这种零件更符合要求解:(1) 100 mm,100 mm,(99100)2(100100)2(98100)2(100100)2(100100)2(103100)2 mm2.(99100)2(100100)2(
17、102100)2(99100)2(100100)2(100100)21 mm2.(2)因为,说明甲机床加工零件波动比较大,因此乙机床加工零件更符合要求11甲、乙两位学生参加数学竞赛培训,在培训期间,他们参加的5项预赛成绩记录如下:甲8282799587乙9575809085(1)用茎叶图表示这两组数据;(2)从甲、乙两人的成绩中各随机抽取一个,求甲的成绩比乙高的概率;(3)现要从中选派一人参加数学竞赛,从统计学的角度考虑,你认为选派哪位学生参加合适?说明理由解:(1)作出茎叶图如下:(2)记甲被抽到的成绩为x,乙被抽到的成绩为y,用数对(x,y)表示基本事件:(82,95)(82,75)(82
18、,80)(82,90)(82,85)(82,95)(82,75)(82,80)(82,90)(82,85)(79,95)(79,75)(79,80)(79,90)(79,85)(95,95)(95,75)(95,80)(95,90)(95,85)(87,95)(87,75)(87,80)(87,90)(87,85)基本事件总数n25.记“甲的成绩比乙高”为事件A,事件A包含的基本事件:(82,75)(82,80)(82,75)(82,80)(79,75)(95,75)(95,80)(95,90)(95,85)(87,85)(87,75)(87,80)事件A包含的基本事件数是m12.所以P(A)
19、.(3)派甲参赛比较合适理由如下:甲85,乙85,31.6,50.甲乙,甲的成绩较稳定,派甲参赛比较合适12从高三学生中抽取50名同学参加数学竞赛,成绩的分组及各组的频数如下(单位:分):40,50),2;50,60),3;60,70),10;70,80),15;80,90),12;90,100),8.(1)列出样本的频率分布表;(2)画出频率分布直方图和频率分布折线图;(3)估计成绩在60,90)分的学生比例;(4)估计成绩在85分以下的学生比例解:(1)频率分布表如下:成绩分组频数频率频率/组距40,50)20.040.00450,60)30.060.00660,70)100.20.0270,80)150.30.0380,90)120.240.02490,100)80.160.016合计5010.1(2)频率分布直方图和折线图为:(3)所求的学生比例为02+0.3+0.24=0.74=74%.(4)所求的学生比例为1-(0.12+0.16)=1-0.28=0.72=72%.