1、1统计图表统计图表是表达和分析数据的重要工具,常用的统计图表有条形统计图、扇形统计图、折线统计图、茎叶图等2数据的数字特征(1)众数、中位数、平均数众数:在一组数据中,出现次数最多的数据叫作这组数据的众数中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫作这组数据的中位数平均数:样本数据的算术平均数,即(x1x2xn)在频率分布直方图中,中位数左边和右边的直方图的面积应该相等(2)样本方差、标准差标准差s ,其中xn是样本数据的第n项,n是样本容量,是平均数标准差是刻画数据的离散程度的特征数,样本方差是标准差的平方通常用样本方差估计总体方差,当样本容量接
2、近总体容量时,样本方差很接近总体方差3用样本估计总体(1)通常我们对总体作出的估计一般分成两种,一种是用样本的频率分布估计总体的频率分布,另一种是用样本的数字特征估计总体的数字特征(2)在频率分布直方图中,纵轴表示,数据落在各小组内的频率用各小长方形的面积表示,各小长方形的面积总和等于1.(3)在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间从所加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线,称之为频率折线图(4)当样本数据较少时,用茎叶图表示数据的效果较好,它没有信息的缺失,而且可以随时记录,方便表示与比较【思考辨析】判断下面
3、结论是否正确(请在括号中打“”或“”)(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势()(2)一组数据的众数可以是一个或几个,那么中位数也具有相同的结论()(3)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了()(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次()(5)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数()(6)在频率分布直方图中,众数左边和右边的小长方形的面积和是相等的()1(2015陕西)某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该
4、校女教师的人数为()A93 B123 C137 D167答案C解析由题干扇形统计图可得该校女教师人数为:11070%150(160%)137.故选C.2.若某校高一年级8个班参加合唱比赛的得分茎叶图如图所示,则这组数据的中位数和平均数分别是()A91.5和91.5 B91.5和92C91和91.5 D92和92答案A解析这组数据由小到大排列为87,89,90,91,92,93,94,96,中位数为(9192)91.5.平均数为(8789909192939496)91.5.3一个容量为66的样本,数据的分组及各组的频数如下:11.5,15.5) 215.5,19.5)419.5,23.5)923
5、.5,27.5)1827.5,31.5)1131.5,35.5)1235.5,39.5)739.5,43.5)3根据样本的频率分布估计,数据落在31.5,43.5)的概率约是()A. B. C. D.答案B解析由已知,样本容量为66,而落在31.5,43.5)内的样本数为127322,故所求概率为.4(教材改编)某赛季,甲、乙两名篮球运动员都参加了11场比赛,他们每场比赛得分的情况用如图所示的茎叶图表示,则甲、乙两名运动员得分的中位数分别为_答案19,135某中学为了了解学生数学课程的学习情况,在3 000名学生中随机抽取200名,并统计这200名学生的某次数学考试成绩,得到了样本的频率分布直
6、方图(如图)根据频率分布直方图推测,这3 000名学生在该次数学考试中成绩小于60分的学生数是_答案600解析由频率分布直方图易得数学考试中成绩小于60分的频率为(0.0020.0060.012)100.2,所以所求分数小于60分的学生数为3 0000.2600.题型一频率分布直方图的绘制与应用例1(2015课标全国)某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A地区用户满意度评分的频率分布直方图和B地区用户满意度评分的频数分布表A地区用户满意度评分的频率分布直方图图B地区用户满意度评分的频数分布表满意度评分分组50,60)60,7
7、0)70,80)80,90)90,100频数2814106(1)在图中作出B地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可)B地区用户满意度评分的频率分布直方图图(2)根据用户满意度评分,将用户的满意度分为三个等级:满意度评分低于70分70分到89分不低于90分满意度等级不满意满意非常满意估计哪个地区用户的满意度等级为不满意的概率大?说明理由解(1)如图所示通过两地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度评分的平均值高于A地区用户满意度评分的平均值;B地区用户满意度评分比较集中,而A地区用户满意度评分比
8、较分散(2)A地区用户的满意度等级为不满意的概率大记CA表示事件:“A地区用户的满意度等级为不满意”;CB表示事件:“B地区用户的满意度等级为不满意”由直方图得P(CA)的估计值为(0.010.020.03)100.6,P(CB)的估计值为(0.0050.02)100.25.所以A地区用户的满意度等级为不满意的概率大思维升华(1)明确频率分布直方图的意义,即图中的每一个小矩形的面积是数据落在该区间上的频率,所有小矩形的面积和为1.(2)对于统计图表类题目,最重要的是认真观察图表,从中提炼有用的信息和数据(1)(2014山东)为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压
9、数据(单位:kPa)的分组区间为12,13),13,14),14,15),15,16),16,17,将其按从左到右的顺序分别编号为第一组,第二组,第五组,如图是根据试验数据制成的频率分布直方图已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为()A6 B8 C12 D18答案C解析志愿者的总人数为50,所以第三组人数为500.3618,有疗效的人数为18612.(2)某校从参加高一年级期中考试的学生中随机抽出60名学生,将其物理成绩(均为整数)分成六段40,50),50,60),90,100后得到如图所示的频率分布直方图,观察图形的信息,回答下列问题:求分数在70
10、,80)内的频率,并补全这个频率分布直方图;统计方法中,同一组数据常用该组区间的中点值作为代表,据此估计本次考试中的平均分解设分数在70,80)内的频率为x,根据频率分布直方图,有(0.0100.01520.0250.005)10x1,可得x0.3,所以频率分布直方图如图所示平均分:450.1550.15650.15750.3850.25950.0571(分)题型二茎叶图的应用例2(1)(2015山东)为比较甲、乙两地某月14时的气温情况,随机选取该月中的5天,将这5天中14时的气温数据(单位:)制成如图所示的茎叶图考虑以下结论:甲乙986289113012甲地该月14时的平均气温低于乙地该月
11、14时的平均气温;甲地该月14时的平均气温高于乙地该月14时的平均气温;甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差;甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差其中根据茎叶图能得到的统计结论的编号为()A B C D(2)以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分)已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x,y的值分别为()A2,5 B5,5 C5,8 D8,8答案(1)B(2)C解析(1)甲地5天的气温为:26,28,29,31,31,其平均数为甲29;方差为s(2629)2(2829)2(2929)2(312
12、9)2(3129)23.6;标准差为s甲.乙地5天的气温为:28,29,30,31,32,其平均数为乙30;方差为s(2830)2(2930)2(3030)2(3130)2(3230)22;标准差为s乙.甲乙,s甲s乙(2)由茎叶图及已知得x5,又乙组数据的平均数为16.8,即16.8,解得y8.引申探究1本例(2)中条件不变,试比较甲、乙两组哪组成绩较好解由原题可知x5,则甲组平均分为17.4.而乙组平均分为16.8,所以甲组成绩较好2在本例(2)条件下:求乙组数据的中位数、众数;求乙组数据的方差解由茎叶图知,乙组中五名学生的成绩为9,15,18,18,24.故中位数为18,众数为18.s2
13、(916.8)2(1516.8)2(1816.8)22(2416.8)223.76.思维升华茎叶图的优缺点由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失,第二点是茎叶图便于记录和表示其缺点是当样本容量较大时,作图较烦琐(2014课标全国)某市为了考核甲、乙两部门的工作情况,随机访问了50位市民根据这50位市民对这两部门的评分(评分越高表明市民的评价越高),绘制茎叶图如下:(1)分别估计该市的市民对甲、乙两部门评分的中位数;(2)分别估计该市的市民对甲、乙两部门的评分高于90的概率;(3)根据茎叶图分析该市
14、的市民对甲、乙两部门的评价解(1)由所给茎叶图知,50位市民对甲部门的评分由小到大排序,排在第25,26位的是75,75,故样本中位数为75,所以该市的市民对甲部门评分的中位数的估计值是75.50位市民对乙部门的评分由小到大排序,排在第25,26位的是66,68,故样本中位数为67,所以该市的市民对乙部门评分的中位数的估计值是67.(2)由所给茎叶图知,50位市民对甲、乙部门的评分高于90的比率分别为0.1,0.16,故该市的市民对甲、乙部门的评分高于90的概率的估计值分别为0.1,0.16.(3)由所给茎叶图知,市民对甲部门的评分的中位数高于对乙部门的评分的中位数,而且由茎叶图可以大致看出对
15、甲部门的评分的标准差要小于对乙部门的评分的标准差,说明该市市民对甲部门的评价较高、评价较为一致,对乙部门的评价较低、评价差异较大(注:考生利用其他统计量进行分析,结论合理的同样给分)题型三用样本的数字特征估计总体的数字特征例3甲、乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图(1)分别求出两人得分的平均数与方差;(2)根据图和上面算得的结果,对两人的训练成绩作出评价解(1)由题图像可得甲、乙两人五次测试的成绩分别为甲:10分,13分,12分,14分,16分;乙:13分,14分,12分,12分,14分甲13;乙13,s(1013)2(1313)2(1213)2(1413)2(1613)
16、24;s(1313)2(1413)2(1213)2(1213)2(1413)20.8.(2)由ss可知乙的成绩较稳定从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高思维升华平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小(2015广东)某工厂36名工人的年龄数据如下表.工人编号 年龄工人编号 年龄工人编号 年龄工人编号 年龄14010361927283424411312043293934012382141304344113392237
17、3138533144323343242640154524423353745163925373437842173826443549943183627423639(1)用系统抽样法从36名工人中抽取容量为9的样本,且在第一分段里用随机抽样法抽到的年龄数据为44,列出样本的年龄数据;(2)计算(1)中样本的均值和方差s2;(3)36名工人中年龄在s与s之间的有多少人?所占的百分比是多少(精确到0.01%)?解(1)44,40,36,43,36,37,44,43,37.(2)40.s2(4440)2(4040)2(3640)2(4340)2(3640)2(3740)2(4440)2(4340)2(37
18、40)2.(3)40,40在的有23个,占63.89%.9高考中频率分布直方图的应用典例(12分)(2015广东)某城市100户居民的月平均用电量(单位:度),以160,180),180,200),200,220),220,240),240,260),260,280),280,300分组的频率分布直方图如图(1)求直方图中x的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为220,240),240,260),260,280),280,300的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在220,240)的用户中应抽取多少户?规范解答解(1)由(0.0020.009
19、50.0110.012 5x0.0050.002 5)201得:x0.007 5,所以直方图中x的值是0.007 5.3分(2)月平均用电量的众数是230.4分因为(0.0020.009 50.011)200.45a2Ba2a1Ca1a2Da1,a2的大小与m的值有关答案B解析去掉一个最高分和一个最低分后,甲选手叶上的数字之和是20,乙选手叶上的数字之和是25,故a2a1.故选B.6将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91.现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x表示:则7个剩余分数的方差为()A. B. C36 D.答案B解析由题意
20、知91,解得x4.所以s2(8791)2(9491)2(9091)2(9191)2(9091)2(9491)2(9191)2(16910190).7样本中共有五个个体,其值分别为a,0,1,2,3.若该样本的平均值为1,则样本方差为_答案2解析由题意可知样本的平均值为1,所以1,解得a1,所以样本的方差为(11)2(01)2(11)2(21)2(31)22.8从某小学随机抽取100名学生,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图)由图中数据可知a_.若要从身高在120,130),130,140),140,150三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在1
21、40,150内的学生中选取的人数应为_答案0.0303解析小矩形的面积等于频率,除120,130)外的频率和为0.700,a0.030.由题意知,身高在120,130),130,140),140,150内的学生分别为30人,20人,10人,由分层抽样可知抽样比为,在140,150中选取的学生应为3人9某工厂对一批产品进行了抽样检测如图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是96,106,样本数据分组为96,98),98,100),100,102),102,104),104,106,已知样本中产品净重小于100克的个数是36.(1)求样本容量及样本中净
22、重大于或等于98克并且小于104克的产品的个数;(2)已知这批产品中每个产品的利润y(单位:元)与产品净重x(单位:克)的关系式为y求这批产品平均每个的利润解(1)产品净重小于100克的频率为(0.0500.100)20.300.设样本容量为n.样本中产品净重小于100克的个数是36,0.300,n120.样本中净重大于或等于98克并且小于104克的产品的频率为(0.1000.1500.125)20.750,样本中净重大于或等于98克并且小于104克的产品的个数是1200.75090.(2)产品净重在96,98),98,104),104,106内的频率分别为0.05020.100,(0.100
23、0.1500.125)20.750,0.07520.150,其相应的频数分别为1200.112,1200.75090,1200.15018,这批产品平均每个的利润为(312590418)4.65(元)B组专项能力提升(时间:30分钟)10某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示,以组距为5将数据分组成0,5),5,10),30,35),35,40时,所作的频率分布直方图是()答案A解析由于频率分布直方图的组距为5,排除C、D,又0,5),5,10)两组各一人,排除B,应选A.11(2014江苏)为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部
24、周长(单位:cm),所得数据均在区间80,130上,其频率分布直方图如图所示,则在抽测的60株树木中,有_株树木的底部周长小于100 cm.答案24解析底部周长在80,90)的频率为0.015100.15,底部周长在90,100)的频率为0.025100.25,样本容量为60,所以树木的底部周长小于100 cm的株数为(0.150.25)6024.12(2015湖北)某电子商务公司对10 000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间0.3,0.9内,其频率分布直方图如图所示(1)直方图中的a_;(2)在这些购物者中,消费金额在区间0.5,0.9内的购物者
25、的人数为_答案(1)3(2)6 000解析由频率分布直方图及频率和等于1可得0.20.10.80.11.50.120.12.50.1a0.11,解得a3.于是消费金额在区间0.5,0.9内频率为0.20.10.80.120.130.10.6,所以消费金额在区间0.5,0.9内的购物者的人数为:0.610 0006 000,故应填3,6 000.13若某产品的直径长与标准值的差的绝对值不超过1 mm时,则视为合格品,否则视为不合格品在近期一次产品抽样检查中,从某厂生产的此种产品中,随机抽取5 000件进行检测,结果发现有50件不合格品计算这50件不合格品的直径长与标准值的差(单位:mm),将所得
26、数据分组,得到如下频率分布表:分组频数频率3,2)0.102,1)8(1,20.50(2,310(3,4合计501.00(1)将上面表格中缺少的数据填在相应位置;(2)估计该厂生产的此种产品中,不合格品的直径长与标准值的差落在区间(1,3内的概率;(3)现对该厂这种产品的某个批次进行检查,结果发现有20件不合格品据此估算这批产品中的合格品的件数解(1)如下表所示频率分布表.分组频数频率3,2)50.102,1)80.16(1,2250.50(2,3100.20(3,420.04合计501.00(2)由频率分布表知,该厂生产的此种产品中,不合格品的直径长与标准值的差落在区间(1,3内的概率约为0
27、500.200.70.(3)设这批产品中的合格品数为x件,依题意,解得x201 980.所以该批产品的合格品件数是1 980.14(2014广东)某车间20名工人年龄数据如下表: (1)求这20名工人年龄的众数与极差;(2)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图;(3)求这20名工人年龄的方差解(1)这20名工人年龄的众数为:30;这20名工人年龄的极差为:401921.(2)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图如下: (3)这20名工人年龄的平均数为:(1928329330531432340)2030;所以这20名工人年龄的方差为:(3019)2(3028)2(3029)2(3030)2(3031)2(3032)2(3040)212.6.