1、第 2 讲 统计初步 1(2016课标全国丙改编)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图图中 A 点表示十月的平均最高气温约为 15,B 点表示四月的平均最低气温约为 5.给出以下四种表示,其中不正确的序号是_各月的平均最低气温都在 0 以上;七月的平均温差比一月的平均温差大;三月和十一月的平均最高气温基本相同;平均最高气温高于 20 的月份有 5 个答案 解析 由题意知,平均最高气温高于 20 的有七月,八月,故填.2(2016山东改编)某高校调查了 200 名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范
2、围是17.5,30,样本数据分组为17.5,20),20,22.5),22.5,25),25,27.5),27.5,30根据直方图,这 200 名学生中每周的自习时间不少于 22.5 小时的人数是_答案 140解析 设所求人数为 N,则 N2.5(0.160.080.04)200140.3(2016上海)某次体检,6 位同学的身高(单位:米)分别为 1.72,1.78,1.75,1.80,1.69,1.77,则这组数据的中位数是_(米)答案 1.761.以填空题的形式考查随机抽样、样本的数字特征、统计图表等;2.在概率与统计的交汇处命题,以中档难度解答题出现.热点一 抽样方法1简单随机抽样特点
3、是从总体中逐个抽取适用范围:总体中的个体数较少2系统抽样特点是将总体均分成几部分,按事先确定的规则在各部分中抽取适用范围:总体中的个体数较多3分层抽样特点是将总体分成几层,分层进行抽取适用范围:总体由差异明显的几部分组成例1(1)某单位有420名职工,现采用系统抽样方法抽取21人做问卷调查,将420人按1,2,420 随机编号,则抽取的 21 人中,编号落入区间281,420的人数为_(2)某工厂生产甲、乙、丙三种型号的产品,产品数量之比为 357,现用分层抽样的方法抽出容量为 n 的样本,其中甲种产品有 18 件,则样本容量 n_.答案(1)7(2)90解析(1)因 4202120,而 42
4、02811(1391)207,故抽取的人中编号落入区间281,420的人数是 7.(2)由题意得335718n,解得 n90.思维升华(1)随机抽样各种方法中,每个个体被抽到的概率都是相等的;(2)系统抽样又称“等距”抽样,被抽到的各个号码间隔相同;(3)分层抽样满足:各层抽取的比例都等于样本容量在总体容量中的比例跟踪演练 1(1)要考察某公司生产的 500 克袋装牛奶中三聚氰胺的含量是否超标,现从 800袋牛奶中抽取 60 袋进行检验,利用随机数法抽取样本时,先将 800 袋牛奶按 000,001,799 进行编号,如果从随机数表第 7 行第 8 列的数开始向右读,则得到的第 4 个样本个体
5、的编号是_(下面摘取了随机数表第 7 行至第 9 行)84 42 17 53 31 57 24 55 06 88 77 04 74 47 6721 76 33 50 25 83 92 12 06 76(第 7 行)63 01 63 78 59 16 95 55 67 19 98 10 50 71 7512 86 73 58 07 44 39 52 38 79(第 8 行)33 21 12 34 29 78 64 56 07 82 52 42 07 44 3815 51 00 13 42 99 66 02 79 54(第 9 行)(2)利用分层抽样的方法在学生总数为 1 200 人的年级中抽出
6、20 名同学,其中有女生 8 人,则该年级男生的人数约为_答案(1)068(2)720解析(1)由随机数法可知抽取样本个体的编号为 331,572,455,068,故第 4 个样本个体的编号为 068.(2)由于样本容量为 20,其中的男生人数为 12,从而该年级男生人数约为 1 2001220720.热点二 用样本估计总体1频率分布直方图中横坐标表示组距,纵坐标表示频率组距,频率组距频率组距.2频率分布直方图中各小长方形的面积之和为 1.3利用频率分布直方图求众数、中位数与平均数利用频率分布直方图求众数、中位数和平均数时易出错,应注意区分这三者在频率分布直方图中:(1)最高的小长方形底边中点
7、的横坐标即是众数;(2)中位数左边和右边的小长方形的面积和是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和例 2(1)在某次测量中得到的 A 样本数据如下:42,43,46,52,42,50,若 B 样本数据恰好是 A样本数据每个都减 5 后所得数据,考查四种数字特征:平均数,标准差,众数,中位数,则A,B 两样本的_是对应相同的 (2)若五个数 1,2,3,4,a 的平均数为 3,则这五个数的标准差是_答案(1)标准差(2)2解析(1)设样本 A 中的数据为 xi,则样本 B 中的数据为 yixi5,则样本数据 B 中的
8、众数和平均数以及中位数和 A 中的众数,平均数,中位数相差 5,只有标准差没有发生变化(2)由平均数的定义知1234a53,所以 10a15,即 a5;由标准差的计算公式可得s15132232332432532 2.思维升华(1)反映样本数据分布的主要方式:频率分布表、频率分布直方图、茎叶图关于频率分布直方图要明确每个小矩形的面积即为对应的频率,其高低能够描述频率的大小,高考中常常考查频率分布直方图的基本知识,同时考查借助频率分布直方图估计总体的概率分布和总体的特征数,具体问题中要能够根据公式求解数据的平均数、众数、中位数和方差等(2)由样本数据估计总体时,样本方差越小,数据越稳定,波动越小跟
9、踪演练 2(1)某学生在一门功课的 22 次考试中,所得分数茎叶图如图所示,则此学生该门功课考试分数的极差与中位数之和为_(2)某学校为了调查学生在课外读物方面的支出情况,抽出了一个容量为 n 且支出在20,60元的样本,其频率分布直方图如图所示,其中支出在50,60元的学生有 30 人,则 n 的值为_答案(1)118(2)100解析(1)22 次考试中,所得分数最高的为 98,最低的为 56,所以极差为 985642,将分数从小到大排列,中间两数为 76,76,所以中位数为 76,所以此学生该门功课考试分数的极差与中位数之和为 4276118.(2)支出在50,60元的频率为 10.10.
10、240.360.3,所以 n300.3100.热点三 概率与统计的综合问题概率与统计密不可分,概率的计算问题往往与抽样方法,频率分布直方图,茎叶图相结合在高考中进行考查,以生活中的热点问题为背景,在概率统计交汇点处命题已成为高考的一个方向例 3 经销商经销某种农产品,在一个销售季度内,每售出 1 t 该产品获利润 500 元,未售出的产品,每 1 t 亏损 300 元根据历史资料,得到销售季度内市场需求量的频率分布直方图,如图所示经销商为下一个销售季度购进了 130 t 该农产品以 X(单位:t,100X150)表示下一个销售季度内的市场需求量,T(单位:元)表示下一个销售季度内经销该农产品的
11、利润(1)将 T 表示为 X 的函数;(2)根据直方图估计利润 T 不少于 57 000 元的概率解(1)当 X100,130)时,T500X300(130X)800X39 000;当 X130,150时,T50013065 000.所以 T800X39 000,100X130,65 000,130X150.(2)由(1)知利润 T 不少于 57 000 元当且仅当 120X150.由直方图知需求量 X120,150的频率为 0.7,所以下一个销售季度内的利润 T 不少于 57 000 元的概率的估计值为 0.7.思维升华 解决概率、统计综合问题的步骤:第一步,根据所给的频率分布直方图、茎叶图
12、等统计图表确定样本数据、均值等统计量;第二步,根据题意,一般选择由频率估计概率,确定相应的事件的概率;第三步,利用互斥事件、对立事件、古典概型等概率计算公式计算概率跟踪演练 3 从某校高中男生中随机抽取 100 名学生,将他们的体重(单位:kg)数据绘制成频率分布直方图(如图)若要从体重在60,70),70,80),80,90三组内的男生中,用分层抽样的方法选取 6 人组成一个活动队,再从这 6 人中选 2 人当正、副队长,则这 2 人的体重不在同一组内的概率为_答案 1115解析 体重在60,70)的男生人数为 0.0301010030,同理在70,80)的男生人数为20,在80,90的男生
13、人数为 10,所以按分层抽样选取 6 人,各小组依次选 3 人,2 人,1人,分别记为 a,b,c;A,B;M.从这 6 人中选取 2 人,共有 15 种结果,其中体重不在同一组内的结果有 11 种故所求概率 P1115.1甲、乙两同学 5 次综合测评的成绩如茎叶图所示,老师在计算甲、乙两人平均分时,发现乙同学成绩的一个数字无法看清若从0,1,2,9中随机取一个数字代替,则乙的平均成绩超过甲的平均成绩的概率为_押题依据 根据茎叶图求平均值、概率、方差等是高考热点答案 110解析 计算可得甲的平均分为 90,根据乙的数据,只有处为 9 时,乙的平均成绩才超过甲,因此所求概率为 110.2某校为了
14、了解高三学生寒假期间的学习情况,抽查了 100 名学生,统计他们每天的平均学习时间,绘成的频率分布直方图如图所示,则这 100 名学生中学习时间在 6 至 10 小时之间的人数为_押题依据 频率分布直方图多以现实生活中的实际问题为背景,对图形的理解应用可以考查考生的基本分析能力,是高考的热点答案 58解析 由图知,(0.040.12x0.140.05)21,解得 x0.15,所以学习时间在 6 至 10小时之间的频率是(0.150.14)20.58,所求人数为 1000.5858.A 组 专题通关1从某班抽取 5 名学生测量身高(单位:cm),得到的数据为 160,162,159,160,15
15、9,则该组数据的方差 s2 _.答案 65解析 5 名学生平均数为 160,因此方差为15(022101)65.2某校共有教师 200 人,男学生 800 人,女学生 600 人,现用分层抽样的方法从所有师生中抽取一个容量为 n 的样本,已知从男学生中抽取的人数为 100 人,那么 n_.答案 200解析 男学生占全校总人数的80020080060012,那么100n 12,n200.3以下茎叶图记录了甲,乙两组各五名学生在一次英语听力测试中的成绩(单位:分)已知甲组数据的中位数为 15,乙组数据的平均数为 16.8,则 x,y 的值分别为_答案 5,8解析 由题意得 x5,16815(915
16、10y1824)y8.4从某小学随机抽取 100 名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图,如图所示,由图中数据可知身高在120,130)内的学生人数为_答案 30解析 由图可知,(0.035a0.0200.0100.005)101,解得 a0.03,所以身高在120,130)内的学生人数在样本中的频率为 0.03100.3,所以身高在120,130)内的学生人数为 0.310030.5下列说法中正确的个数为_若样本数据 x1,x2,xn 的平均数 x 5,则样本数据 2x11,2x21,2xn1 的平均数为 10;将一组数据中的每个数据都减去同一个数后,平均数与方差均没有变
17、化;采用系统抽样法从某班按学号抽取 5 名同学参加活动,学号为 5,16,27,38,49 的同学均被选出,则该班学生人数可能为 60.答案 0解析 若样本数据 x1,x2,xn 的平均数 x 5,则样本数据 2x11,2x21,2xn1的平均数为 25111,故错误;将一组数据中的每个数据都减去同一个数后,平均数减小,方差没有变化,故错误;学号为 5,16,27,38,49 的同学均被选出,样本间隔为 16511,则对应的人数为 11555(人),若该班学生人数可能为 60,则样本间隔为60512,故错误6为了解一批灯泡(共 5 000 只)的使用寿命,从中随机抽取了 100 只进行测试,其
18、使用寿命(单位:h)如下表:使用寿命500,700)700,900)900,1 100)1 100,1300)1 300,1 500只数52344253根据该样本的频数分布,估计该批灯泡使用寿命不低于 1 100 h 的灯泡只数是_答案 1 400解析 由题意得:253100 5 0001 400.7从某中学高一年级中随机抽取 100 名同学,将他们的成绩(单位:分)数据绘制成频率分布直方图(如图)则这 100 名学生成绩的平均数,中位数分别为_答案 125,124解析 由图可知(aa0.005)101(0.0100.0150.030)10,解得 a0.025,则 x 1050.11150.3
19、1250.251350.21450.15125.中位数在 120130 之间,设为x,则 0.01100.03100.025(x120)0.5,解得 x124.8一个单位共有职工 200 人,其中不超过 45 岁的有 120 人,超过 45 岁的有 80 人,为了调查职工的健康状况,用分层抽样的方法从全体职工中抽取一个容量为 25 的样本,应抽取超过45 岁的职工_人答案 10解析 因为超过 45 岁的职工为 80 人,所占比例为801208025,所以抽取的 25 人中,超过45 岁的职工为 252510 人9为了比较两种治疗失眠症的药(分别称为 A 药,B 药)的疗效,随机地选取 20 位
20、患者服用 A药,20 位患者服用 B 药,这 40 位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位:h),试验的观测结果如下:服用 A 药的 20 位患者日平均增加的睡眠时间:06 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.2 3.525 2.6 1.2 2.7 1.5 2.9 3.0 3.1 2.3 2.4服用 B 药的 20 位患者日平均增加的睡眠时间:32 1.7 1.9 0.8 0.9 2.4 1.2 2.6 1.3 1.416 0.5 1.8 0.6 2.1 1.1 2.5 1.2 2.7 0.5(1)分别计算两组数据的平均数,从计算结果看,哪种药的疗效
21、更好?(2)根据两组数据完成下面的茎叶图,从茎叶图看,哪种药的疗效更好?解(1)x A 120(0.61.22.71.52.81.82.22.33.23.52.52.61.22.71.52.93.03.12.32.4)2.3.x B 120(3.21.71.90.80.92.41.22.61.31.41.60.51.80.62.11.12.51.22.70.5)1.6.从计算结果看,A 药服用者的睡眠时间增加的平均数大于服用 B 药的所以 A 药的疗效更好(2)从茎叶图看,A 药的疗效更好10某工厂对一批产品进行了抽样检测如图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中
22、产品净重的范围是96,106,样本数据分组为96,98),98,100),100,102),102,104),104,106,已知样本中产品净重小于 100 克的个数是 36.(1)求样本容量及样本中净重大于或等于 98 克并且小于 104 克的产品的个数;(2)已知这批产品中每个产品的利润 y(单位:元)与产品净重 x(单位:克)的关系式为 y3,96x98,5,98x0.02,因此甲、乙两位选手中成绩最稳定的选手为甲,其方差是 0.02.12为了考察某校各班参加课外书法小组的人数,从全校随机抽取 5 个班级,把每个班级参加该小组的人数作为样本数据,已知样本平均数为 7,样本方差为 4,且样
23、本数据互不相同,则样本数据中的最大值为_答案 10解析 设 5 个班级中参加课外书法小组的人数分别为 x1,x2,x3,x4,x5,则由题意知样本平均数为 7,且(x17)2(x27)2(x37)2(x47)2(x57)220,5 个整数的平方和为 20,且样本数据互不相同,则必为 0119920,由|x7|3 可得 x10 或 x4.由|x7|1 可得 x8 或 x6.由上可知参加的人数分别为 4,6,7,8,10,故最大值为 10.13去年“十一”期间,昆曲高速公路车辆较多某调查公司在曲靖收费站从 7 座以下小型汽车中按进收费站的先后顺序,每间隔 50 辆就抽取一辆的抽样方法抽取 40 辆
24、汽车进行抽样调查,将他们在某段高速公路的车速(km/h)分成六段:60,65),65,70),70,75),75,80),80,85),85,90后,得到如图的频率分布直方图(1)调查公司在抽样时用到的是哪种抽样方法?(2)求这 40 辆小型汽车车速的众数和中位数的估计值;(3)若从这 40 辆车速在60,70)的小型汽车中任意抽取 2 辆,求抽出的 2 辆车车速都在65,70)的概率解(1)系统抽样(2)众数的估计值为最高的矩形的中点,即众数的估计值为 77.5.由题图可知,中位数应该在 7580 之间,设为 m,则 0.0150.0250.0450.06(m75)0.5,m77.5,即中位
25、数的估计值为 77.5.(3)这 40 辆车中,车速在60,70)的共有5(0.010.02)406(辆),其中车速在65,70)的有 50.02404(辆),记为 A,B,C,D,车速在60,65)的有 50.01402(辆),记为 a,b.从车速在60,70)的这 6 辆汽车中任意抽取 2 辆的可能结果有:A,B,A,C,A,D,A,a,A,b,B,C,B,D,B,a,B,b,C,D,C,a,C,b,D,a,D,b,a,b,共 15 种不同的结果,其中抽出的 2 辆车车速都在65,70)的结果有 6 种因为抽到每种结果都是等可能的,所以从这 40 辆车速在60,70)的汽车中任意抽取 2 辆,抽出的 2 辆车车速都在65,70)的概率为P 61525.