1、2.2 用样本估计总体 2.2.1 用样本的频率分布估计总体分布 必备知识自主学习 1.频率分布的概念 频率分布是指一个样本数据在各个小范围内所占比例的大小.一般用频率分布 直方图反映样本的频率分布,其一般步骤为:(1)计算一组数据中最大值与最小值的差,即求极差.(2)决定_(3)将数据分组(4)列_(5)画_ 导思 1.频率分布的概念是如何定义的?2.什么是频率分布直方图?组距与组数 频率分布表 频率分布直方图【思考】(1)同样一组数据,如果组距不同,得到的频率分布直方图形状相同吗?如何选择组距与组数?提示:不相同.组距的选择力求“取整”,数据分组与样本容量有关,样本容量越大,分组越多,当样
2、本容量不超过100时,常分5至12组.(2)与频率分布表比较,频率分布直方图有何特征?提示:从频率分布直方图可以清楚地看出数据分布的总体趋势.2.频率分布折线图、总体密度曲线(1)频率分布折线图 连接频率分布直方图中_,就得到频率分布折线图.(2)总体密度曲线 在样本频率分布直方图中,相应的频率分布折线图会越来越接近于一条光滑曲 线,统计中称这条光滑曲线为_.它能够精确地反映出总体在各个 范围内取值的百分比,它能给我们提供更加精细的信息.各小长方形上端的中点 总体密度曲线【思考】对于任何一个总体,它的密度曲线是不是一定存在?是否可以被非常准确地画出来?为什么?提示:实际上,尽管有些总体密度曲线
3、是客观存在的,但一般很难像函数图象那样准确地画出来,我们只能用样本的频率分布对它进行估计,一般来说,样本容量越大,这种估计就越精确.3.茎叶图(1)茎叶图 当数据是_时,用中间的数字表示十位数,即第一个有效数字,旁边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,旁边 部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图.两位有效数字(2)用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示.【思考】(1)茎叶图只能表示两位有效数字的一组数据吗?提示:茎叶图最适合表示两位有效
4、数字的数据.多于两位的也可以用茎叶图表示.(2)茎叶图的缺点是什么?提示:当样本数据较多时,茎叶图就显得不太方便,因为每一个数据都要在图中占据一个空间,如果数据很多,枝叶就会很长.【基础小测】1.辨析记忆(对的打“”,错的打“”)(1)频率分布直方图的纵轴表示频率.()(2)茎叶图不能增加数据.()(3)当样本容量很大时,频率分布直方图更能直观地反映数据分布的大致情况,此时不宜用茎叶图.()2.学校为了调查学生在课外读物方面的支出情况,抽取了一个容量为n的样本,其频率分布直方图如图所示,其中支出(单位:元)在50,60内的学生有30人,则n的值为()A.100 B.1 000 C.90 D.9
5、00 3.(教材二次开发:例题改编)如图所示是一容量为100的样本的频率分布直方图,则由图中的数据可知,样本落在15,20内的频数为()A.20 B.30 C.40 D.50【解析】选B.样本数据落在15,20内的频数为1001-5(0.04+0.1)=30.关键能力合作学习 类型一 频率分布直方图、折线图的画法(数据分析、直观想象)【典例】下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高(单位:cm).区间界限 122,126)126,130)130,134)人数 5 8 10 区间界限 134,138)138,142)142,146)人数 22 33 20 区间界限 146
6、,150)150,154)154,158 人数 11 6 5(1)列出样本频率分布表.(2)画出频率分布直方图和折线图.(3)估计身高小于134 cm的人数占总人数的百分比.【思路导引】根据样本频率分布表、频率分布直方图和折线图的一般步骤解题.【解题策略】绘制频率分布直方图的注意事项(1)计算极差,需要找出这组数的最大值和最小值,当数据很多时,可选一个数当参照.(2)将一批数据分组,目的是要描述数据分布规律,要根据数据多少来确定分组数目,一般来说,数据越多,分组越多.(3)将数据分组,决定分点时,一般使分点比数据多一位小数,并且把第一组的起点稍微减小一点.(4)列频率分布表时,可通过逐一判断各
7、个数据落在哪个小组内,以“正”字确定各个小组内数据的个数.(5)画频率分布直方图时,纵坐标表示频率与组距的比值,一定不能标成频率.【跟踪训练】有一容量为200的样本,数据的分组以及各组的频数如下:-20,-15),7;-15,-10),11;-10,-5),15;-5,0),40;0,5),49;5,10),41;10,15),20;15,20,17.(1)列出样本的频率分布表.(2)画出频率分布直方图和频率分布折线图.【补偿训练】为了了解学校高一年级男生的身高情况,选取一个容量为60的样本(60名男生的身高),分组情况如下(单位:cm):分组 147.5,155.5)155.5,163.5)
8、163.5,171.5)171.5,179.5 频数 6 21 27 m 频率 a 0.1(1)求出表中a,m的值;(2)画出频率分布直方图.类型二 频率分布直方图的应用(数据分析、直观想象)【典例】从某小区抽取100户居民进行月用电量调查,发现其用电量都在50度至350度之间,频率分布直方图如图所示.(1)求直方图中x的值;(2)在这些用户中,求用电量落在区间100,250)内的户数.【思路导引】根据频率分布直方图的性质特征计算.【解析】(1)由频率分布直方图知200,250)小组的频率为1-(0.002 4+0.003 6+0.006 0+0.002 4+0.001 2)50=0.22,于
9、是x=0.004 4.(2)因为数据落在100,250)内的频率为(0.003 6+0.006 0+0.004 4)50=0.7,所以所求户数为0.7100=70.0.2250【解题策略】频率分布直方图的性质 小长方形的面积=组距 =频率,这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小.频率组距【跟踪训练】为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄在1718岁的男生体重(kg),将他们的体重按54.5,56.5),56.5,58.5),74.5,76.5分组,得到的频率分布直方图如图所示.由图可知这100名学生中体重在56.5,64.5)的学生人数是(
10、)A.20 B.30 C.40 D.50 类型三 茎叶图的画法及应用(数学抽象、直观想象)【典例】某中学高二(2)班甲、乙两名学生自进入高中以来,每次数学考试成绩情况如下:甲:95,81,75,91,86,89,71,65,76,88,94,110,107;乙:83,86,93,99,88,103,98,114,98,79,78,106,101.画出两人数学成绩的茎叶图,并根据茎叶图对两人的成绩进行比较.【思路导引】用中间的数字表示两位同学得分的十位数字和百位数字,两边的数字分别表示两人每次数学考试成绩的个位数字.画出茎叶图,由图可以分析两人的成绩.【解题策略】(1)茎叶图在样本数据较少,较为
11、集中且位数不多时比较适用.(2)若所给数字为小数,则常把整数部分作为“茎”,小数部分作为“叶”.(3)应用茎叶图对两组数据进行比较时,要从数据分布的对称性,平均数等方面来比较.【跟踪训练】如图是2020年某市青年歌手大奖赛中七位评委为甲、乙两名选手打出的分数的茎叶图(图中m为数字09中的一个),去掉一个最高分和一个最低分后,甲、乙两名选手得分的平均数分别为a1,a2,则一定有()A.a1a2 B.a2a1 C.a1=a2 D.a1,a2的大小与m的值有关【补偿训练】如图是甲、乙两名运动员某赛季一些场次得分的茎叶图,据图可知()A.甲运动员的成绩好于乙运动员 B.乙运动员的成绩好于甲运动员 C.
12、甲、乙两名运动员的成绩没有明显的差异 D.甲运动员的最低得分为0分 课堂检测素养达标 1.下列关于频率分布直方图的说法正确的是()A.直方图的高表示取某数的频率 B.直方图的高表示该组上的个体在样本中出现的频率 C.直方图的高表示取某组上的个体在样本中出现的频数与组距的比值 D.直方图的高表示取该组上的个体在样本中出现的频率与组距的比值 2.如图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间22,30)内的频率为()A.0.2 B.0.4 C.0.5 D.0.6 3.(教材二次开发:练习改编)某班计划开展一些课外活动,全班有40名学生报名参加,他们就乒乓球、足球、跳绳、羽毛球4项活动的参加人数做了统计,绘制了条形统计图(如图所示),那么参加羽毛球活动的人数的频率是_.4.小波一星期的总开支分布如图所示,一星期的食品开支如图所示,则小波一星期的鸡蛋开支占总开支的百分比为()A.30%B.10%C.3%D.不能确定