1、12.2用样本估计总体1了解分布的意义和作用,能根据频率分布表画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点2理解样本数据标准差的意义和作用,会计算数据标准差3能从样本数据中提取基本的数字特征(如平均数、标准差),并给出合理的解释4会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想5会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题近年来高考加大了对统计考查的力度,与本节相关的试题也频频出现,但难度不高,复习时应重视概念及概念的简单应用1用样本的频率分布估计总体分布(1)通常我们对总体作出的估计一般分成两种:一种是用样
2、本的_估计总体的_;另一种是用样本的_估计总体的_(2)在频率分布直方图中,纵轴表示_,数据落在各小组内的频率用_表示各小长方形的面积总和等于_(3)连接频率分布直方图中各小长方形上端的中点,就得到频率分布_随着样本容量的增加,作图时所分的_增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称之为_,它能够更加精细地反映出_(4)当样本数据较少时,用茎叶图表示数据的效果较好,它不但可以_,而且可以_,给数据的记录和表示都带来方便2用样本的数字特征估计总体的数字特征(1)众数,中位数,平均数众数:在一组数据中,出现次数_的数据叫做这组数据的众数中位数:将一组数据按大小依次排列,把
3、处在最中间位置的一个数据(或者最中间两个数据的_)叫做这组数据的中位数平均数:样本数据的算术平均数,即_在频率分布直方图中,中位数左边和右边的直方图的面积应该_(2)样本方差,样本标准差标准差s,其中xn是_,n是_,是_标准差是反映总体_的特征数,_是样本标准差的平方通常用样本方差估计总体方差,当样本容量接近总体容量时,样本方差很接近总体方差【自查自纠】1(1)频率分布分布数字特征数字特征(2)各小长方形的面积1(3)折线图组数总体密度曲线总体在各个范围内取值的百分比(4)保留所有信息随时记录2(1)最多平均数(x1x2xn)相等(2)样本数据的第n项样本容量平均数波动大小样本方差在频率分布
4、直方图中,各个长方形的面积表示()A落在相应各组的数据的频数B相应各组数据的频率C该样本所分成的组数D该样本的样本容量解:在频率分布直方图中,小长方形面积组距频率,所以每个小长方形的面积是相应各组数据的频率故选B.有一个容量为66的样本,数据的分组及各组的频数如下:11.5,15.5)2 15.5,19.5)4 19.5,23.5)923.5,27.5)1827.5,31.5)1131.5,35.5)1235.5,39.5)7 39.5,43.5)3根据样本的频率分布估计,数据落在31.5,43.5)的概率约是()A. B. C. D.解:落在31.5,43.5)的频数为22,所以概率约为.故
5、选B.()某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示以组距为5将数据分组成0,5),5,10),30,35),35,40时,所作的频率分布直方图是()012373764430755432085430 解:由茎叶图知,落在区间0,5)的数据只有1个,其频率为0.05,落在区间5,10)的数据只有1个,其频率为0.05,落在区间10,15)的数据有4个,其频率为0.2,落在区间35,40的数据有2个,其频率为0.1,由各选项图象知A正确,故选A.()某学校高一年级男生人数占该年级学生人数的40%.在一次考试中,男、女生平均分数分别为75,80,则这次考试该年级
6、学生平均分数为_解:该年级学生平均分数为7540%8060%78.故填78.抽样统计甲、乙两位射击运动员的5次训练成绩(单位:环),结果如下:运动员第1次第2次第3次第4次第5次甲8.79.19.08.99.3乙8.99.09.18.89.2则成绩较为稳定(方差较小)的那位运动员成绩的方差为_解:甲9.0,乙9.0,s(8.79.0)2(9.19.0)2(9.09.0)2(8.99.0)2(9.39.0)20.04,s(8.99.0)2(9.09.0)2(9.19.0)2(8.89.0)2(9.29.0)20.02,ss,成绩较为稳定的运动员乙成绩的方差为0.02.故填0.02.类型一数字特征
7、及其应用某汽车制造厂分别从A,B两种轮胎中各随机抽取了8个进行测试,列出了每一个轮胎行驶的最远里程数(单位:1000 km):轮胎A96 11297108100103 86 98轮胎B108 1019410596 9397106(1)分别计算A,B两种轮胎行驶的最远里程的平均数、中位数;(2)分别计算A,B两种轮胎行驶的最远里程的极差、标准差;(3)根据以上数据,你认为哪种型号轮胎的性能更加稳定?解:(1)A轮胎行驶的最远里程的平均数为:100,中位数为:99;B轮胎行驶的最远里程的平均数为:100,中位数为:99.(2)A轮胎行驶的最远里程的极差为:1128626,标准差为:s=7.43;B
8、轮胎行驶的最远里程的极差为:1089315,标准差为:s5.43.(3)虽然A轮胎和B轮胎的最远行驶里程的平均数相同,但B轮胎行驶的最远里程的极差和标准差相对于A轮胎较小,所以B轮胎性能更加稳定【评析】在理解平均数、中位数、众数、极差、标准差、方差的统计意义和数学表达式的情况下,不难作出解答()某学员在一次射击测试中射靶10次,命中环数如下:7,8,7,9,5,4,9,10,7,4.则(1)平均命中环数为_;(2)命中环数的标准差为_解:7,s2.故填(1)7;(2)2.类型二频率分布表、频率分布直方图及其应用某市2013年4月1日4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒
9、物): 61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45.(1)完成下列频率分布表、频率分布直方图;频率分布表分组频数频率41,51)51,61)61,71)71,81)81,91)91,101)101,111)频率分布直方图(2)根据国家标准,污染指数在050之间时,空气质量为优;在51100之间时,为良;在101150之间时,为轻微污染;在151200之间时,为轻度污染请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价解:(1)如图所示:频率分布表
10、分组频数频率41,51)251,61)161,71)471,81)681,91)1091,101)5101,111)2频率分布直方图(2)答对下述两条中的一条即可:该市一个月中空气污染指数有2天处于优的水平,占当月天数的,有26天处于良的水平,占当月天数的,处于优或良的天数共有28天,占当月天数的.说明该市空气质量基本良好轻微污染有2天,占当月天数的,污染指数在80以上的接近轻微污染的天数有15天,加上处于轻微污染的天数,共有17天,占当月天数的,超过50%,说明该市空气质量有待进一步改善【评析】首先根据题目中的数据完成频率分布表,作出频率分布直方图,根据污染指数,确定空气质量为优、良、轻微污
11、染、轻度污染的天数;对于开放性问题的解答,要选择适当的数据特征进行考察,根据数据特征分析得出实际问题的结论本题主要考查运用统计知识解决简单实际问题的能力、数据处理能力和应用意识()某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是:, ,.(1)求图中a的值;(2)根据频率分布直方图,估计这100名学生语文成绩的平均分;(3)若这100名学生的语文成绩在某些分数段的人数(x)与数学成绩在相应分数段的人数(y)之比如下表所示,求数学成绩在之外的人数.分数段xy11213445解:(1)由101,解得a0.005.(2) 0.05550.4650.3750.2850.05
12、9573.(3)由频率分布直方图及已知的语文成绩、数学成绩分布在各分数段的人数比,可得下表:分数段50,60)60,70)70,80)80,90)x5403020xy11213445y5204025于是数学成绩在50,90)之外的人数为100(5204025)10.类型三茎叶图及其应用以下茎叶图记录了甲、乙两组各四名同学的植树棵数乙组记录中有一个数据模糊,无法确认,在图中以X表示(1)如果X8,求乙组同学植树棵数的平均数和方差;(2)如果X9,分别从甲、乙两组中各随机选取一名同学,求这两名同学的植树总棵数Y的分布列和数学期望注:方差s2(x1)2(x2)2(xn)2,其中x为x1,x2,xn的
13、平均数解:(1)当X8时,由茎叶图可知,乙组同学的植树棵数是8,8,9,10,所以平均数为;方差为s2222.(2)当X9时,由茎叶图可知,甲组同学的植树棵数是:9,9,11,11;乙组同学的植树棵数是:9,8,9,10.分别从甲、乙两组中随机选取一名同学,共有4416种可能的结果,这两名同学植树总棵数Y的可能取值为17,18,19,20,21.事件“Y17”等价于“甲组选出的同学植树9棵,乙组选出的同学植树8棵”,所以该事件有2种可能的结果,P(Y17).同理可得P(Y18);P(Y19);P(Y20);P(Y21).所以随机变量Y的分布列为:Y1718192021PE(Y)17181920
14、2119.【评析】(1)根据茎叶图的意义可得甲、乙各组的数据并进一步计算平均数和方差;(2)得到甲、乙各组的数据后计算随机事件所含的基本事件数及运用古典概型概率计算公式求概率,进而求随机变量的分布列及随机变量的期望值()某车间共有12名工人,随机抽取6名,他们某日加工零件个数的茎叶图如图所示,其中茎为十位数,叶为个位数.179201530(1)根据茎叶图计算样本平均值;(2)日加工零件个数大于样本均值的工人为优秀工人,根据茎叶图推断该车间12名工人中有几名优秀工人?(3)从该车间12名工人中,任取2人,求恰有1名优秀工人的概率解:(1)样本均值22.(2)根据题意,抽取的6名员工中优秀员工有2
15、人,优秀员工所占比例为,故可推断12名员工中优秀员工人数为124(人)(3)记事件A为“抽取的2名工人中恰有1名为优秀员工”,由于优秀员工为4人,非优秀员工为8人,所以事件A发生的概率为P(A),即抽取的2名工人中恰有1名为优秀员工的概率为.1用样本估计总体是统计的基本思想,而利用频率分布表和频率分布直方图来估计总体就是用样本的频率分布去估计总体分布的两种主要方法分布表在数量表示上比较准确,直方图比较直观2频率分布表中的频数之和等于样本容量,各组中的频率之和等于1;在频率分布直方图中,各小长方形的面积表示相应各组的频率,所以,所有小长方形的面积的和等于1.3茎叶图的优点是原有信息不会抹掉,能够展示数据分布情况,但当样本数据较多或数据位数较多时,茎叶图就显得不太方便了4标准差、方差描述了一组数据围绕平均数波动的大小标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小因为方差与原始数据的单位不同,且平方后可能夸大了偏差的程度,所以虽然方差与标准差都是测量样本数据离散程度的工具,但在解决实际问题时,一般多采用标准差