1、第2讲统计初步1(2016课标全国丙改编)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图图中A点表示十月的平均最高气温约为15 ,B点表示四月的平均最低气温约为5 .给出以下四种表示,其中不正确的序号是_各月的平均最低气温都在0 以上;七月的平均温差比一月的平均温差大;三月和十一月的平均最高气温基本相同;平均最高气温高于20 的月份有5个答案解析由题意知,平均最高气温高于20 的有七月,八月,故填.2(2016山东改编)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是17.5,30,样本数据分组
2、为17.5,20),20,22.5),22.5,25),25,27.5),27.5,30根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是_答案140解析设所求人数为N,则N2.5(0.160.080.04)200140.3(2016上海)某次体检,6位同学的身高(单位:米)分别为1.72,1.78,1.75,1.80,1.69,1.77,则这组数据的中位数是_(米)答案1.761.以填空题的形式考查随机抽样、样本的数字特征、统计图表等;2.在概率与统计的交汇处命题,以中档难度解答题出现.热点一抽样方法1简单随机抽样特点是从总体中逐个抽取适用范围:总体中的个体数较少2系统抽样
3、特点是将总体均分成几部分,按事先确定的规则在各部分中抽取适用范围:总体中的个体数较多3分层抽样特点是将总体分成几层,分层进行抽取适用范围:总体由差异明显的几部分组成例1(1)某单位有420名职工,现采用系统抽样方法抽取21人做问卷调查,将420人按1,2,420随机编号,则抽取的21人中,编号落入区间281,420的人数为_(2)某工厂生产甲、乙、丙三种型号的产品,产品数量之比为357,现用分层抽样的方法抽出容量为n的样本,其中甲种产品有18件,则样本容量n_.答案(1)7(2)90解析(1)因4202120,而4202811(1391)207,故抽取的人中编号落入区间281,420的人数是7
4、.(2)由题意得,解得n90.思维升华(1)随机抽样各种方法中,每个个体被抽到的概率都是相等的;(2)系统抽样又称“等距”抽样,被抽到的各个号码间隔相同;(3)分层抽样满足:各层抽取的比例都等于样本容量在总体容量中的比例跟踪演练1(1)要考察某公司生产的500克袋装牛奶中三聚氰胺的含量是否超标,现从800袋牛奶中抽取60袋进行检验,利用随机数法抽取样本时,先将800袋牛奶按000,001,799进行编号,如果从随机数表第7行第8列的数开始向右读,则得到的第4个样本个体的编号是_(下面摘取了随机数表第7行至第9行)84 42 17 53 3157 24 55 06 8877 04 74 47 6
5、721 76 33 50 25 83 92 12 06 76(第7行)63 01 63 78 5916 95 55 67 1998 10 50 71 7512 86 73 58 07 44 39 52 38 79(第8行)33 21 12 34 2978 64 56 07 8252 42 07 44 3815 51 00 13 4299 66 02 79 54(第9行)(2)利用分层抽样的方法在学生总数为1 200人的年级中抽出20名同学,其中有女生8人,则该年级男生的人数约为_答案(1)068(2)720解析(1)由随机数法可知抽取样本个体的编号为331,572,455,068,故第4个样本
6、个体的编号为068.(2)由于样本容量为20,其中的男生人数为12,从而该年级男生人数约为1 200720.热点二用样本估计总体1频率分布直方图中横坐标表示组距,纵坐标表示,频率组距.2频率分布直方图中各小长方形的面积之和为1.3利用频率分布直方图求众数、中位数与平均数利用频率分布直方图求众数、中位数和平均数时易出错,应注意区分这三者在频率分布直方图中:(1)最高的小长方形底边中点的横坐标即是众数;(2)中位数左边和右边的小长方形的面积和是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和例2(1)在某次测量中得到的A样本数据
7、如下:42,43,46,52,42,50,若B样本数据恰好是A样本数据每个都减5后所得数据,考查四种数字特征:平均数,标准差,众数,中位数,则A,B两样本的_是对应相同的(2)若五个数1,2,3,4,a的平均数为3,则这五个数的标准差是_答案(1)标准差(2)解析(1)设样本A中的数据为xi,则样本B中的数据为yixi5,则样本数据B中的众数和平均数以及中位数和A中的众数,平均数,中位数相差5,只有标准差没有发生变化(2)由平均数的定义知3,所以10a15,即a5;由标准差的计算公式可得s.思维升华(1)反映样本数据分布的主要方式:频率分布表、频率分布直方图、茎叶图关于频率分布直方图要明确每个
8、小矩形的面积即为对应的频率,其高低能够描述频率的大小,高考中常常考查频率分布直方图的基本知识,同时考查借助频率分布直方图估计总体的概率分布和总体的特征数,具体问题中要能够根据公式求解数据的平均数、众数、中位数和方差等(2)由样本数据估计总体时,样本方差越小,数据越稳定,波动越小跟踪演练2(1)某学生在一门功课的22次考试中,所得分数茎叶图如图所示,则此学生该门功课考试分数的极差与中位数之和为_(2)某学校为了调查学生在课外读物方面的支出情况,抽出了一个容量为n且支出在20,60元的样本,其频率分布直方图如图所示,其中支出在50,60元的学生有30人,则n的值为_答案(1)118(2)100解析
9、(1)22次考试中,所得分数最高的为98,最低的为56,所以极差为985642,将分数从小到大排列,中间两数为76,76,所以中位数为76,所以此学生该门功课考试分数的极差与中位数之和为4276118.(2)支出在50,60元的频率为10.10.240.360.3,所以n300.3100.热点三概率与统计的综合问题概率与统计密不可分,概率的计算问题往往与抽样方法,频率分布直方图,茎叶图相结合在高考中进行考查,以生活中的热点问题为背景,在概率统计交汇点处命题已成为高考的一个方向例3经销商经销某种农产品,在一个销售季度内,每售出1 t该产品获利润500元,未售出的产品,每1 t亏损300元根据历史
10、资料,得到销售季度内市场需求量的频率分布直方图,如图所示经销商为下一个销售季度购进了130 t该农产品以X(单位: t,100X150)表示下一个销售季度内的市场需求量,T(单位:元)表示下一个销售季度内经销该农产品的利润(1)将T表示为X的函数;(2)根据直方图估计利润T不少于57 000元的概率解(1)当X100,130)时,T500X300(130X)800X39 000;当X130,150时,T50013065 000.所以T(2)由(1)知利润T不少于57 000元当且仅当120X150.由直方图知需求量X120,150的频率为0.7,所以下一个销售季度内的利润T不少于57 000元
11、的概率的估计值为0.7.思维升华解决概率、统计综合问题的步骤:第一步,根据所给的频率分布直方图、茎叶图等统计图表确定样本数据、均值等统计量;第二步,根据题意,一般选择由频率估计概率,确定相应的事件的概率;第三步,利用互斥事件、对立事件、古典概型等概率计算公式计算概率跟踪演练3从某校高中男生中随机抽取100名学生,将他们的体重(单位:kg)数据绘制成频率分布直方图(如图)若要从体重在60,70),70,80),80,90三组内的男生中,用分层抽样的方法选取6人组成一个活动队,再从这6人中选2人当正、副队长,则这2人的体重不在同一组内的概率为_答案解析体重在60,70)的男生人数为0.030101
12、0030,同理在70,80)的男生人数为20,在80,90的男生人数为10,所以按分层抽样选取6人,各小组依次选3人,2人,1人,分别记为a,b,c;A,B;M.从这6人中选取2人,共有15种结果,其中体重不在同一组内的结果有11种故所求概率P.1甲、乙两同学5次综合测评的成绩如茎叶图所示,老师在计算甲、乙两人平均分时,发现乙同学成绩的一个数字无法看清若从0,1,2,9中随机取一个数字代替,则乙的平均成绩超过甲的平均成绩的概率为_押题依据根据茎叶图求平均值、概率、方差等是高考热点答案解析计算可得甲的平均分为90,根据乙的数据,只有处为9时,乙的平均成绩才超过甲,因此所求概率为.2某校为了了解高
13、三学生寒假期间的学习情况,抽查了100名学生,统计他们每天的平均学习时间,绘成的频率分布直方图如图所示,则这100名学生中学习时间在6至10小时之间的人数为_押题依据频率分布直方图多以现实生活中的实际问题为背景,对图形的理解应用可以考查考生的基本分析能力,是高考的热点答案58解析由图知,(0.040.12x0.140.05)21,解得x0.15,所以学习时间在6至10小时之间的频率是(0.150.14)20.58,所求人数为1000.5858.A组专题通关1从某班抽取5名学生测量身高(单位:cm),得到的数据为160,162,159,160,159,则该组数据的方差s2 _.答案解析5名学生平
14、均数为160,因此方差为(022101).2某校共有教师200人,男学生800人,女学生600人,现用分层抽样的方法从所有师生中抽取一个容量为n的样本,已知从男学生中抽取的人数为100人,那么n_.答案200解析男学生占全校总人数的,那么,n200.3以下茎叶图记录了甲,乙两组各五名学生在一次英语听力测试中的成绩(单位:分)已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x,y的值分别为_答案5,8解析由题意得x5,168(91510y1824)y8.4从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图,如图所示,由图中数据可知身高在120,130)内的
15、学生人数为_答案30解析由图可知,(0.035a0.0200.0100.005)101,解得a0.03,所以身高在120,130)内的学生人数在样本中的频率为0.03100.3,所以身高在120,130)内的学生人数为0.310030.5下列说法中正确的个数为_若样本数据x1,x2,xn的平均数5,则样本数据2x11,2x21,2xn1的平均数为10;将一组数据中的每个数据都减去同一个数后,平均数与方差均没有变化;采用系统抽样法从某班按学号抽取5名同学参加活动,学号为5,16,27,38,49的同学均被选出,则该班学生人数可能为60.答案0解析若样本数据x1,x2,xn的平均数5,则样本数据2
16、x11,2x21,2xn1的平均数为25111,故错误;将一组数据中的每个数据都减去同一个数后,平均数减小,方差没有变化,故错误;学号为5,16,27,38,49的同学均被选出,样本间隔为16511,则对应的人数为11555(人),若该班学生人数可能为60,则样本间隔为60512,故错误6为了解一批灯泡(共5 000只)的使用寿命,从中随机抽取了100只进行测试,其使用寿命(单位:h)如下表:使用寿命500,700)700,900)900,1 100)1 100,1 300)1 300,1 500只数52344253根据该样本的频数分布,估计该批灯泡使用寿命不低于1 100 h的灯泡只数是_答
17、案1 400解析由题意得:5 0001 400.7从某中学高一年级中随机抽取100名同学,将他们的成绩(单位:分)数据绘制成频率分布直方图(如图)则这100名学生成绩的平均数,中位数分别为_答案125,124解析由图可知(aa0.005)101(0.0100.0150.030)10,解得a0.025,则1050.11150.31250.251350.21450.15125.中位数在120130之间,设为x,则0.01100.03100.025(x120)0.5,解得x124.8一个单位共有职工200人,其中不超过45岁的有120人,超过45岁的有80人,为了调查职工的健康状况,用分层抽样的方法
18、从全体职工中抽取一个容量为25的样本,应抽取超过45岁的职工_人答案10解析因为超过45岁的职工为80人,所占比例为,所以抽取的25人中,超过45岁的职工为2510人9为了比较两种治疗失眠症的药(分别称为A药,B药)的疗效,随机地选取20位患者服用A药,20位患者服用B药,这40位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位:h),试验的观测结果如下:服用A药的20位患者日平均增加的睡眠时间:061.22.71.52.81.82.22.33.23.5252.61.22.71.52.93.03.12.32.4服用B药的20位患者日平均增加的睡眠时间:321.71.90.80.92.4
19、1.22.61.31.4160.51.80.62.11.12.51.22.70.5(1)分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好?(2)根据两组数据完成下面的茎叶图,从茎叶图看,哪种药的疗效更好?解(1)A(0.61.22.71.52.81.82.22.33.23.52.52.61.22.71.52.93.03.12.32.4)2.3.B(3.21.71.90.80.92.41.22.61.31.41.60.51.80.62.11.12.51.22.70.5)1.6.从计算结果看,A药服用者的睡眠时间增加的平均数大于服用B药的所以A药的疗效更好(2)从茎叶图看,A药的疗效更好1
20、0某工厂对一批产品进行了抽样检测如图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是96,106,样本数据分组为96,98),98,100),100,102),102,104),104,106,已知样本中产品净重小于100克的个数是36.(1)求样本容量及样本中净重大于或等于98克并且小于104克的产品的个数;(2)已知这批产品中每个产品的利润y(单位:元)与产品净重x(单位:克)的关系式为y求这批产品平均每个的利润解(1)产品净重小于100克的频率为(0.0500.100)20.300.设样本容量为n.样本中产品净重小于100克的个数是36,0.300,n
21、120.样本中净重大于或等于98克并且小于104克的产品的频率为(0.1000.1500.125)20.750,样本中净重大于或等于98克并且小于104克的产品的个数是1200.75090.(2)产品净重在96,98),98,104),104,106内的频率分别为0.05020.100,(0.1000.1500.125)20.750,0.07520.150,其相应的频数分别为1200.112,1200.75090,1200.15018,这批产品平均每个的利润为(312590418)4.65(元)B组能力提高11(2016江苏省南京市高三第三次模拟)甲、乙两位选手参加射击选拔赛,其中连续5轮比赛
22、的成绩(单位:环)如下表:选手第1轮第2轮第3轮第4轮第5轮甲9.89.910.11010.2乙9.410.310.89.79.8则甲、乙两位选手中成绩最稳定的选手的方差是_答案0.02解析甲、乙两位选手5轮比赛的成绩的平均数皆为10,方差分别为s0.220.120.1200.220.02,s0.620.320.820.330.220.02,因此甲、乙两位选手中成绩最稳定的选手为甲,其方差是0.02.12为了考察某校各班参加课外书法小组的人数,从全校随机抽取5个班级,把每个班级参加该小组的人数作为样本数据,已知样本平均数为7,样本方差为4,且样本数据互不相同,则样本数据中的最大值为_答案10解
23、析设5个班级中参加课外书法小组的人数分别为x1,x2,x3,x4,x5,则由题意知样本平均数为7,且(x17)2(x27)2(x37)2(x47)2(x57)220,5个整数的平方和为20,且样本数据互不相同,则必为0119920,由|x7|3可得x10或x4.由|x7|1可得x8或x6.由上可知参加的人数分别为4,6,7,8,10,故最大值为10.13去年“十一”期间,昆曲高速公路车辆较多某调查公司在曲靖收费站从7座以下小型汽车中按进收费站的先后顺序,每间隔50辆就抽取一辆的抽样方法抽取40辆汽车进行抽样调查,将他们在某段高速公路的车速(km/h)分成六段:60,65),65,70),70,
24、75),75,80),80,85),85,90后,得到如图的频率分布直方图(1)调查公司在抽样时用到的是哪种抽样方法?(2)求这40辆小型汽车车速的众数和中位数的估计值;(3)若从这40辆车速在60,70)的小型汽车中任意抽取2辆,求抽出的2辆车车速都在65,70)的概率解(1)系统抽样(2)众数的估计值为最高的矩形的中点,即众数的估计值为77.5.由题图可知,中位数应该在7580之间,设为m,则0.0150.0250.0450.06(m75)0.5,m77.5,即中位数的估计值为77.5.(3)这40辆车中,车速在60,70)的共有5(0.010.02)406(辆),其中车速在65,70)的有50.02404(辆),记为A,B,C,D,车速在60,65)的有50.01402(辆),记为a,b.从车速在60,70)的这6辆汽车中任意抽取2辆的可能结果有:A,B,A,C,A,D,A,a,A,b,B,C,B,D,B,a,B,b,C,D,C,a,C,b,D,a,D,b,a,b,共15种不同的结果,其中抽出的2辆车车速都在65,70)的结果有6种因为抽到每种结果都是等可能的,所以从这40辆车速在60,70)的汽车中任意抽取2辆,抽出的2辆车车速都在65,70)的概率为P.