1、第3讲统计初步1(2014天津)某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查,已知该校一年级、二年级、三年级、四年级的本科生人数之比为4556,则应从一年级本科生中抽取_名学生2(2014湖南改编)对一个容量为N的总体抽取容量为n的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p1,p2,p3,则p1,p2,p3的大小关系为_3(2014江苏)为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间80,130上,
2、其频率分布直方图如图所示,则在抽测的60株树木中,有_株树木的底部周长小于100 cm.4(2013江苏)抽样统计甲、乙两位射击运动员的5次训练成绩(单位:环),结果如下:运动员第1次第2次第3次第4次第5次甲8791908993乙8990918892则成绩较为稳定(方差较小)的那位运动员成绩的方差为_1.以填空题的形式考查随机抽样、样本的数字特征、统计图表等.2.在概率与统计的交汇处命题,以解答题中档难度出现热点一抽样方法1简单随机抽样特点是从总体中逐个抽取适用范围:总体中的个体较少2系统抽样特点是将总体均分成几部分,按事先确定的规则在各部分中抽取适用范围:总体中的个体数较多3分层抽样特点是
3、将总体分成几层,分层进行抽取适用范围:总体由差异明显的几部分组成例1(1)某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,840随机编号,则抽取的42人中,编号落入区间481,720的人数为_(2)为了研究雾霾天气的治理,某课题组对部分城市进行空气质量调查,按地域特点把这些城市分成甲、乙、丙三组,已知三组城市的个数分别为4,y,z,依次构成等差数列,且4,y,z4成等比数列,若用分层抽样抽取6个城市,则乙组中应抽取的城市个数为_思维升华(1)随机抽样各种方法中,每个个体被抽到的概率都是相等的;(2)系统抽样又称“等距”抽样,被抽到的各个号码间隔相同;(3)分层
4、抽样满足:各层抽取的比例都等于样本容量在总体容量中的比例跟踪演练1(1)总体由编号为01,02,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为_.7 8166 5720 8026 3140 7024 3699 7280 1983 2049 2344 9358 2003 6234 8696 9387 481(2)(2014广东改编)已知某地区中小学生人数和近视情况分别如图和图所示为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近
5、视人数分别为_热点二用样本估计总体1频率分布直方图中横坐标表示组距,纵坐标表示,频率组距.2频率分布直方图中各小长方形的面积之和为1.3利用频率分布直方图求众数、中位数与平均数利用频率分布直方图求众数、中位数和平均数时易出错,应注意区分这三者在频率分布直方图中:(1)最高的小长方形底边中点的横坐标即是众数;(2)中位数左边和右边的小长方形的面积和是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和例2(1)(2015湖北)某电子商务公司对10 000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间
6、0.3,0.9内,其频率分布直方图如图所示直方图中的a_;在这些购物者中,消费金额在区间0.5,0.9内的购物者的人数为_(2)(2014陕西改编)设样本数据x1,x2,x10的均值和方差分别为1和4,若yixia(a为非零常数,i1,2,10),则y1,y2,y10的平均数和方差分别为_思维升华(1)反映样本数据分布的主要方式:频率分布表、频率分布直方图、茎叶图关于频率分布直方图要明确每个小矩形的面积即为对应的频率,其高低能够描述频率的大小,高考中常常考查频率分布直方图的基本知识,同时考查借助频率分布直方图估计总体的概率分布和总体的特征数,具体问题中要能够根据公式求解数据的平均数、众数和中位
7、数、方差等(2)由样本数据估计总体时,样本方差越小,数据越稳定,波动越小跟踪演练2(1)某商场在庆元宵促销活动中,对元宵节9时至14时的销售额进行统计,其频率分布直方图如图所示,已知9时至10时的销售额为2.5万元,则11时至12时的销售额为_万元(2)PM2.5是指大气中直径小于或等于2.5微米的颗粒物,也称为可入肺颗粒物,如图是根据某地某日早7点至晚8点甲、乙两个PM2.5监测点统计的数据(单位:毫克/每立方米)列出的茎叶图,则甲、乙两地浓度的方差较小的是_.热点三概率与统计的综合问题概率与统计密不可分,概率的计算问题往往与抽样方法,频率分布直方图,茎叶图相结合在高考中进行考查,以生活中的
8、热点问题为背景,在概率统计交汇点处命题已成为高考的一个方向例3经销商经销某种农产品,在一个销售季度内,每售出1 t该产品获利润500元,未售出的产品,每1 t亏损300元根据历史资料,得到销售季度内市场需求量的频率分布直方图,如图所示经销商为下一个销售季度购进了130 t该农产品以X(单位: t,100X150)表示下一个销售季度内的市场需求量,T(单位:元)表示下一个销售季度内经销该农产品的利润(1)将T表示为X的函数;(2)根据直方图估计利润T不少于57 000元的概率思维升华解决概率统计综合问题的步骤:第一步,根据所给的频率分布直方图、茎叶图等统计图表确定样本数据、均值等统计量;第二步,
9、根据题意,一般选择由频率估计概率,确定相应的事件的概率;第三步,利用互斥事件、对立事件、古典概型等概率计算公式计算概率跟踪演练3从某校高中男生中随机抽100名学生,将他们的体重(单位:kg)数据绘制成频率分布直方图(如图)若要从体重在60,70),70,80),80,90三组内的男生中,用分层抽样的方法选取6人组成一个活动队,再从这6人中选2人当正、副队长,则这2人的体重不在同一组内的概率为_1某高中针对学生发展要求,开设了富有地方特色的“泥塑”与“剪纸”两个社团活动,已知报名参加两个社团活动的学生共有800人,按照要求每人只能参与一个社团活动,各年级参与社团活动的人数情况如下表:高一年级高二
10、年级高三年级“泥塑”abc“剪纸”xyz其中xyz532,且“泥塑”社团的人数占两个社团总人数的,为了了解学生对两个社团活动的满足程度,利用分层抽样从中抽取一个50人的样本进行调查,则从高二年级“剪纸”社团的学生中应抽取_人2某校为了了解高三学生寒假期间的学习情况,抽查了100名学生,统计他们每天的平均学习时间,绘成的频率分布直方图如图所示,则这100名学生中学习时间在6至10小时之间的人数为_3高考前夕,摸底考试后随机抽取甲、乙两班各10名学生的数学成绩,绘成茎叶图如图所示记甲、乙两班的平均成绩分别是甲,乙,中位数分别为m甲,m乙,则甲_乙,m甲_m乙4甲、乙两同学5次综合测评的成绩如茎叶图
11、所示,老师在计算甲、乙两人平均分时,发现乙同学成绩的一个数字无法看清若从0,1,2,9中随机取一个数字代替,则乙的平均成绩超过甲的平均成绩的概率为_提醒:完成作业专题七第3讲二轮专题强化练第3讲统计初步A组专题通关1(2015北京改编)某校老年、中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为_.类别人数老年教师900中年教师1 800青年教师1 600合计4 3002.为规范学校办学,省教育厅督察组对某所高中进行了抽样调查抽到的班级一共有52名学生,现将该班学生随机编号,用系统抽样的方法抽取一个容量为4的样本,已
12、知7号、33号、46号同学在样本中,那么样本中另一位同学的编号应是_3为了了解某城市今年准备报考飞行员的学生的体重情况,将所得的数据整理后,画出了频率分布直方图(如图),已知图中从左到右的前3个小组的频率之比为123,第2小组的频数为120,则抽取的学生人数是_4某中学高三年级从甲、乙两个班级各选出7名学生参加数学竞赛,他们取得的成绩(满分100分)的茎叶图如图所示,其中甲班学生的平均分是85,乙班学生成绩的中位数是83,则xy的值为_5.某苗圃基地为了解基地内甲、乙两块地种植的同一种树苗的长势情况,从两块地各随机抽取了10株树苗,用茎叶图表示上述两组数据,设两块地抽取树苗的高度的平均数分别为
13、甲,乙,中位数分别为y甲,y乙,则甲_乙,y甲_y乙6从某中学高一年级中随机抽取100名同学,将他们的成绩(单位:分)数据绘制成频率分布直方图(如图)则这100名学生成绩的平均数,中位数分别为_7(2015南京联考)对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是_8(2015宿迁摸底)某市统计局就本地居民的月收入调查了10 000人,并根据所得数据画了样本的频率分布直方图(每个分组包括左端点,不包括右端点,如第一组表示月收入在1 000,1 500)(单元:元)(1)估计居民月收入在1 500,2 000)的概率为_(2)根据频率分布
14、直方图估计样本数据的中位数为_9为了比较两种治疗失眠症的药(分别称为A药,B药)的疗效,随机地选取20位患者服用A药,20位患者服用B药,这40位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位:h),试验的观测结果如下:服用A药的20位患者日平均增加的睡眠时间:061.22.71.52.81.82.22.33.23.5252.61.22.71.52.93.03.12.32.4服用B药的20位患者日平均增加的睡眠时间:321.71.90.80.92.41.22.61.31.4160.51.80.62.11.12.51.22.70.5(1)分别计算两组数据的平均数,从计算结果看,哪种药的
15、疗效更好?(2)根据两组数据完成下面茎叶图,从茎叶图看,哪种药的疗效更好?10(2015福建)全网传播的融合指数是衡量电视媒体在中国网民中影响力的综合指标根据相关报道提供的全网传播2015年某全国性大型活动的“省级卫视新闻台”融合指数的数据,对名列前20名的“省级卫视新闻台”的融合指数进行分组统计,结果如表所示.组号分组频数14,5)225,6)836,7)747,83(1)现从融合指数在4,5)和7,8内的“省级卫视新闻台”中随机抽取2家进行调研,求至少有1家的融合指数在7,8内的概率;(2)根据分组统计表求这20家“省级卫视新闻台”的融合指数的平均数B组能力提高11某校从高一年级学生中随机
16、抽取部分学生,将他们的模块测试成绩分成6组:40,50),50,60),60,70),70,80),80,90),90,100加以统计,得到如图所示的频率分布直方图已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为_12为了考察某校各班参加课外书法小组的人数,从全校随机抽取5个班级,把每个班级参加该小组的人数作为样本数据,已知样本平均数为7,样本方差为4,且样本数据互不相同,则样本数据中的最大值为_13(2014重庆)20名学生某次数学考试成绩(单位:分)的频率分布直方图如下:(1)求频率分布直方图中a的值;(2)分别求出成绩落在50,60)与60,70)中的学生人
17、数;(3)从成绩在50,70)的学生中任选2人,求此2人的成绩都在60,70)中的概率学生用书答案精析第3讲统计初步高考真题体验160解析根据题意,应从一年级本科生中抽取的人数为30060.2p1p2p3解析由于三种抽样过程中,每个个体被抽到的概率都是相等的,因此p1p2p3.324解析底部周长在80,90)的频率为0.015100.15,底部周长在90,100)的频率为0.025100.25,样本容量为60,所以树木的底部周长小于100 cm的株数为(0.150.25)6024.42解析甲(8791908993)90,乙(8990918892)90,s(8790)2(9190)2(9090)
18、2(8990)2(9390)24,s(8990)2(9090)2(9190)2(8890)2(9290)22.热点分类突破例1(1)12(2)2解析(1)由20,即每20人抽取1人,所以抽取编号落入区间481,720的人数为12.(2)由题意可得即解得z12,或z4(舍去),故y8.所以甲、乙、丙三组城市的个数分别为4,8,12.因为一共要抽取6个城市,所以抽样比为.故乙组城市应抽取的个数为82.跟踪演练1(1)01(2)200,20解析(1)从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字中小于20的编号依次为08,02,14,07,02,01,其中第二个和第四个都是02,重
19、复,去掉第四个02,得对应的数值为08,02,14,07,01,所以第5个个体编号为01.(2)该地区中、小学生总人数为3 5002 0004 50010 000,则样本容量为10 0002%200,其中抽取的高中生近视人数为2 0002%50%20.例2(1)36 000(2)1a,4解析(1)由频率分布直方图及频率和等于1可得0.20.10.80.11.50.120.12.50.1a0.11,解得a3.于是消费金额在区间0.5,0.9内频率为0.20.10.80.120.130.10.6,所以消费金额在区间0.5,0.9内的购物者的人数为0.610 0006 000.(2)1,yixia,
20、所以y1,y2,y10的平均数为1a,方差不变仍为4.跟踪演练2(1)10(2)甲解析(1)设11时至12时的销售额为x万元由频率分布直方图可知:,所以x10.(2)甲(0.0420.0530.0590.0610.0620.0660.0710.0730.0730.0840.0860.097)120.068 9,乙(0.0410.0420.0430.0460.0590.0620.0690.0790.0870.0920.0940.096)120.067 5,s(0.0420.068 9)2(0.0530.068 9)2(0.0970.068 9)20.000 212.s(0.0410.067 5)
21、2(0.0420.067 5)2(0.0960.067 5)20.000 429.所以甲、乙两地浓度的方差较小的是甲地例3解(1)当X100,130)时,T500X300(130X)800X39 000.当X130,150时,T50013065 000.所以T(2)由(1)知利润T不少于57 000元当且仅当120X150.由直方图知需求量X120,150的频率为0.7,所以下一个销售季度内的利润T不少于57 000元的概率的估计值为0.7.跟踪演练3解析体重在60,70)的男生人数为0.0301010030,同理70,80)的人数为20,80,90的人数为10,所以按分层抽样选取6人,各小组
22、依次选3人,2人,1人,分别记为a,b,c;A,B;M.从这6人中选取2人共有15种结果,其中体重不在同一组内的结果有11种故所求概率P.高考押题精练16解析因为“泥塑”社团的人数的占总人数的,所以“剪纸”社团的人数占总人数的,所以“剪纸”社团的人数为800320.因为“剪纸”社团中高二年级人数占“剪纸”社团总人数的,所以“剪纸”社团中高二年级人数为32096.所以从高二年级“剪纸”社团的学生中应抽取的人数为966.258解析由图知,(0.040.12x0.140.05)21,解得x0.15,所以学习时间在6至10小时之间的频率是(0.150.14)20.58,所求人数是1000.5858.3
23、解析甲班10名学生的数学成绩的平均数为甲77.1,乙班10名学生的数学成绩的平均数为乙79.7,所以甲m乙4.解析计算可得甲的平均分为90,根据乙的数据,只有处为9时,乙的平均成绩才超过甲,因此所求概率为.二轮专题强化练答案精析第3讲统计初步1180解析由题意抽样比为,该样本的老年教师人数为900180.220解析抽样间隔为463313,故另一位同学的编号为71320.3480解析由频率分布直方图知:学生的体重在6575 kg的频率为(0.012 50.037 5)50.25,则学生的体重在5065 kg的频率为10.250.75.从左到右第2个小组的频率为0.750.25.所以抽取的学生人数
24、是1200.25480.48解析依题意,甲班学生的平均分85,故x5.乙班学生成绩的中位数是83,故其成绩为76,81,81,83,91,91,96,y3,xy8.56125,124解析由图可知(aa0.005)101(0.0100.0150.030)10,解得a0.025,则1050.11150.31250.251350.21450.15125.中位数在120130之间,设为x,则0.01100.03100.025(x120)0.5,解得x124.746,45,56解析由题意知各数为12,15,20,22,23,23,31,32,34,34,38,39,45,45,45,47,47,48,4
25、9,49,51,52,54,54,55,56,57,58,63,68,中位数是46,众数是45,最大数为68,最小数为12,极差为681256.8(1)0.2(2)2 4009解(1)A(0.61.22.71.52.81.82.22.33.23.52.52.61.22.71.52.93.03.12.32.4)2.3.B(3.21.71.90.80.92.41.22.61.31.41.60.51.80.62.11.12.51.22.70.5)1.6.从计算结果看,A药服用者的睡眠时间增加的平均数大于服用B药的所以A药的疗效更好(2)从茎叶图看,A药的疗效更好10解方法一(1)融合指数在7,8内的
26、“省级卫视新闻台”记为A1,A2,A3;融合指数在4,5)内的“省级卫视新闻台”记为B1,B2,从融合指数在4,5)和7,8内的“省级卫视新闻台”中随机抽取2家的所有基本事件是:A1,A2,A1,A3,A2,A3,A1,B1,A1,B2,A2,B1,A2,B2,A3,B1,A3,B2,B1,B2,共10个其中,至少有1家融合指数在7,8内的基本事件是:A1,A2,A1,A3,A2,A3,A1,B1,A1,B2,A2,B1,A2,B2,A3,B1,A3,B2,共9个所以所求的概率P.(2)这20家“省级卫视新闻台”的融合指数平均数等于455.56.57.56.05.方法二(1)融合指数在7,8内
27、的“省级卫视新闻台”记为A1,A2,A3;融合指数在4,5)内的“省级卫视新闻台”记为B1,B2,从融合指数在4,5)和7,8内的“省级卫视新闻台”中随机抽取2家的所有的基本事件是:A1,A2,A1,A3,A2,A3,A1,B1,A1,B2,A2,B1,A2,B2,A3,B1,A3,B2,B1,B2,共10个其中,没有1家融合指数在7,8内的基本事件是:B1,B2,共1个所以所求的概率P1.(2)同方法一11480解析少于60分的学生人数600(0.050.15)120(人),不少于60分的学生人数为480人1210解析设5个班级中参加的人数分别为x1,x2,x3,x4,x5,则由题意知7,(
28、x17)2(x27)2(x37)2(x47)2(x57)220,五个整数的平方和为20,则必为0119920,由|x7|3可得x10或x4.由|x7|1可得x8或x6.由上可知参加的人数分别为4,6,7,8,10,故最大值为10.13解(1)据直方图知组距为10,由(2a3a6a7a2a)101,解得a0.005.(2)成绩落在50,60)中的学生人数为20.00510202,成绩落在60,70)中的学生人数为30.00510203.(3)记成绩落在50,60)中的2人为A1,A2,成绩落在60,70)中的3人为B1,B2,B3,则从成绩在50,70)的学生中任选2人的基本事件共有10个:(A1,A2),(A1,B1),(A1,B2),(A1,B3),(A2,B1),(A2,B2),(A2,B3),(B1,B2),(B1,B3),(B2,B3),其中2人的成绩都在60,70)中的基本事件有3个:(B1,B2),(B1,B3),(B2,B3),故所求概率为P.