1、高考导航1.概率与统计是高考中相对独立的一块内容,处理问题的方式、方法体现了较高的思维含量.该类问题以应用题为载体,注重考查学生的应用意识及阅读理解能力、化归转化能力;2.概率问题的核心是概率计算.其中事件的互斥、对立、独立是概率计算的核心,排列组合是进行概率计算的工具.统计问题的核心是样本数据的获得及分析方法,重点是频率分布直方图、茎叶图和样本的数字特征;3.离散型随机变量的分布列及其期望的考查是历来高考的重点,难度多为中低档类题目,特别是与统计内容的渗透,背景新颖,充分体现了概率与统计的工具性和交汇性.热点一常见概率模型的概率几何概型、古典概型、相互独立事件与互斥事件的概率、条件概率是高考
2、的热点,几何概型主要以客观题形式考查,求解的关键在于找准测度(面积、体积或长度);相互独立事件、互斥事件常作为解答题的一问考查,也是进一步求分布列、期望与方差的基础,求解该类问题要正确理解题意,准确判定概率模型,恰当选择概率公式.【例1】 (2017全国卷)为了监控某种零件的一条生产线的生产过程,检验员每天从该生产线上随机抽取16个零件,并测量其尺寸(单位:cm).根据长期生产经验,可以认为这条生产线正常状态下生产的零件的尺寸服从正态分布N(,2).(1)假设生产状态正常,记X表示一天内抽取的16个零件中其尺寸在(3,3)之外的零件数,求P(X1)及X的数学期望;(2)一天内抽检零件中,如果出
3、现了尺寸在(3,3)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.()试说明上述监控生产过程方法的合理性;()下面是检验员在一天内抽取的16个零件的尺寸:9.9510.129.969.9610.019.929.9810.0410.269.9110.1310.029.2210.0410.059.95经计算得i9.97,s0.212,其中xi为抽取的第i个零件的尺寸,i1,2,16.用样本平均数作为的估计值,用样本标准差s作为的估计值,利用估计值判断是否需对当天的生产过程进行检查?剔除(3,3)之外的数据,用剩下的数据估计和(精确到0.01).附:若
4、随机变量Z服从正态分布N(,2),则P(3Z3)0.997 4,0.997 4160.959 2,0.09.解(1)由题可知抽取的一个零件的尺寸落在(3,3)之内的概率为0.997 4,从而零件的尺寸落在 (3,3)之外的概率为0.002 6,故XB(16,0.002 6).因此P(X1)1P(X0)10.997 41610.959 20.040 8.X的数学期望E(X)160.002 60.041 6.(2)()如果生产状态正常,一个零件尺寸在(3,3)之外的概率只有0.002 6,一天内抽取的16个零件中,出现尺寸在(3,3)之外的零件的概率只有0.040 8,发生的概率很小,因此一旦发生
5、这种情况,就有理由认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查,可见上述监控生产过程的方法是合理的.()由x9.97,s0.212,得的估计值为9.97,的估计值为0.212,由样本数据可以看出有一个零件的尺寸在(3,3)之外,因此需对当天的生产过程进行检查.剔除(3,3)之外的数据9.22,剩下数据的平均数为(169.979.22)10.02,因此的估计值为10.02.160.2122169.9721 591.134,剔除(3,3)之外的数据9.22,剩下数据的样本方差为(1 591.1349.2221510.022)0.008,因此的估计值为0.09.探究
6、提高1.解第(1)题的关键是认清随机变量X服从二项分布,并能够应用E(X)np求解,易出现的失误是由于题干较长,不能正确理解题意.2.解第(2)题的关键是理解正态分布的意义,能够利用3原则求解,易出现的失误有两个方面,一是不清楚正态分布N(,2)中和的意义及其计算公式,二是计算失误.【训练1】 (2018石家庄调研)甲、乙两班进行消防安全知识竞赛,每班出3人组成甲乙两支代表队,首轮比赛每人一道必答题,答对则为本队得1分,答错或不答都得0分,已知甲队3人每人答对的概率分别为,乙队每人答对的概率都是,设每人回答正确与否相互之间没有影响,用表示甲队总得分.(1)求2的概率;(2)求在甲队和乙队得分之
7、和为4的条件下,甲队比乙队得分高的概率.解(1)2,则甲队有两人答对,一人答错,故P(2).(2)设甲队和乙队得分之和为4为事件A,甲队比乙队得分高为事件B.设乙队得分为,则B.P(1),P(3),P(1)C,P(2)C,P(3)C,P(A)P(1)P(3)P(2)P(2)P(3)P(1),P(AB)P(3)P(1),所求概率为P(B|A).热点二概率统计与函数的交汇问题(教材VS高考)高考数学试题中对概率统计的考查有这样一类试题,题目非常新颖,又非常符合生活实际,这就是概率统计与函数的交汇问题,一般是以统计图表为载体,离散型随机变量的期望是某一变量的函数,利用函数的性质求期望的最值.【例2】
8、 (满分12分)(2017全国卷)某超市计划按月订购一种酸奶,每天进货量相同,进货成本每瓶4元,售价每瓶6元,未售出的酸奶降价处理,以每瓶2元的价格当天全部处理完.根据往年销售经验,每天需求量与当天最高气温(单位:)有关.如果最高气温不低于25,需求量为500瓶;如果最高气温位于区间20,25),需求量为300瓶;如果最高气温低于20,需求量为200瓶.为了确定六月份的订购计划,统计了前三年六月份各天的最高气温数据,得下面的频数分布表:最高气温10,15)15,20)20,25)25,30)30,35)35,40)天数216362574以最高气温位于各区间的频率估计最高气温位于该区间的概率.(
9、1)求六月份这种酸奶一天的需求量X(单位:瓶)的分布列;(2)设六月份一天销售这种酸奶的利润为Y(单位:元),当六月份这种酸奶一天的进货量n(单位:瓶)为多少时,Y的数学期望达到最大值?教材探源本题第(2)问需对酸奶的需求量n进行分类讨论,以确定利润的最大值,这种分类讨论的思想源自于人教版教材选修23 P63例3.满分解答解(1)由题意知,X所有的可能取值为200,300,500,1分(得分点1)由表格数据知P(X200)0.2,2分(得分点2)P(X300)0.4,3分(得分点3)P(X500)0.4.4分(得分点4)因此X的分布列为X200300500P0.20.40.45分(得分点5)(
10、2)由题意知,这种酸奶一天的需求量至多为500,至少为200,因此只需考虑200n500.当300n500时,若最高气温不低于25,则Y6n4n2n,若最高气温位于区间20,25),则Y63002(n300)4n1 2002n;若最高气温低于20,则Y62002(n200)4n8002n;因此E(Y)2n0.4(1 2002n)0.4(8002n)0.26400.4n.8分(得分点6)当200n0.85,而前5组的频率之和为(0.080.160.300.400.52)0.50.730.85,2.5x3.由0.3(x2.5)0.850.73,解得x2.9.因此,估计月用水量标准为2.9吨时,85
11、%的居民每月的用水量不超过标准.(3)设居民月用水量为t吨,相应的水费为y元,则y即y由题设条件及月均用水量的频率分布直方图,得居民每月的水费数据分组与频率分布表如下:组号123456789分组0,2)2,4)4,6)6,8)8,10)10,12)12,16)16,20)20,24频率0.040.080.150.200.260.150.060.040.02根据题意,该市居民的月平均水费估计为10.0430.0850.1570.2090.26110.15140.06180.04220.028.42(元).热点三概率统计与统计案例的交汇问题近几年的高考数学试题对统计案例的考查一般不单独命题,而是与
12、概率、随机变量的数学期望交汇命题,高考对此类题目的要求是能根据给出的或通过统计图表给出的相关数据求线性回归方程,了解独立性检验的思想方法,会判断两个分类变量是否有关.【例3】 (2017全国卷)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:(1)设两种养殖方法的箱产量相互独立,记A表示事件:旧养殖法的箱产量低于50 kg,新养殖法的箱产量不低于50 kg,估计A的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:箱产量50 kg箱产量50 kg旧养殖法新养殖法
13、(3)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01).附:K2解(1)记B表示事件“旧养殖法的箱产量低于50 kg”,C表示事件“新养殖法的箱产量不低于50 kg”.由题意知,P(A)P(BC)P(B)P(C).旧养殖法的箱产量低于50 kg的频率为(0.0120.0140.0240.0340.040)50.62,故P(B)的估计值为0.62.新养殖法的箱产量不低于50 kg的频率为(0.0680.0460.0100.008)50.66,故P(C)的估计值为0.66.因此,事件A的概率估计值为0.620.660.409 2.(2)根据箱产量的频率分布直方图得列联
14、表箱产量6.635,故有99%的把握认为箱产量与养殖方法有关.(3)因为新养殖法的箱产量的频率分布直方图中,箱产量低于50 kg的直方图面积为(0.0040.0200.044)50.340.5,故新养殖法箱产量的中位数的估计值为5052.35 (kg).探究提高1.解答此类问题的关键是读懂所给的统计图表,从统计图表中得解题所需的相关数据,以频率为概率,结合互斥事件、对立事件的概率求解.2.应用独立性检验的方法解决问题,要特别注意计算K2时计算量大,小心出错.【训练3】 (2018梅州模拟)中石化集团获得了某地深海油田区块的开采权,集团在该地区随机初步勘探了部分油井中的几口井,取得了地质资料,进
15、入全面勘探时期后,集团按网络点来布置井位进行全面勘探.由于勘探一口井的费用很高,如果新设计的井位与原有井位重合或接近,便利用旧井的地质资料,不必打这口新井,以节约勘探费用,勘探初期数据资料见下表:井号123456坐标(x,y)(km)(2,30)(4,40)(5,60)(6,50)(8,70)(1,y)钻探深度(km)2456810出油量(L)407011090160205(1)16号旧井位置线性分布,借助前5组数据求得回归直线方程为y6.5xa,求a,并估计y的预报值;(2)现准备勘探新井7(1,25),若通过1,3,5,7号井计算出的,的值(,精确到0.01)相比于(1)中b,a的值之差都
16、不超过10%,则使用位置最接近的已有旧井6(1,y),否则在新位置打井,请判断可否使用旧井?(3)设出油量与勘探深度的比值k 不低于20的勘探井称为优质井,那么在原有6口中任意勘探4口井,求勘探优质井数X 的分布列与数学期望.解 (1)因为5,50.回归直线必过样本中心点(,),则ab506.5517.5,故回归直线方程为y6.5 x17.5.当x1时, y6.517.524,即y的预报值为24.(2)因为4, 46.25.46.256.83418.93.即6.83,18.93,b6.5,a17.5.5%,8%,均不超过10%,因此可以使用位置最接近的已有旧井6(1,24).(3)由题意,1,
17、3,5,6这4口井是优质井,2,4这两口井是非优质井,勘察优质井数X的可能取值为2,3,4,P(X2),P(X3),P(X4).X的分布列为:X234PE(X)234.1.(2018晋城模拟)宝宝的健康成长是妈妈们最关心的问题,父母亲为婴儿选择什么品牌的奶粉一直以来都是育婴中的一个重要话题.为了解国产奶粉的知名度和消费者的信任度,某调查小组特别调查记录了某大型连锁超市2015年与2016年这两年销量前5名的五个品牌奶粉的销量(单位:罐),绘制出如下的管状图:(1)根据给出的这两年销量的管状图,对该超市这两年品牌奶粉销量的前五强进行排名;(2)分别计算这5个品牌奶粉2016年所占总销量(仅指这5
18、个品牌奶粉的总销量)的百分比(百分数精确到个位),并将数据填入如下饼状图中的括号内;(3)试以(2)中的百分比作为概率,若随机选取2名购买这5个品牌中任意1个品牌的消费者进行采访,记X为被采访中购买飞鹤奶粉的人数,求X的分布列及数学期望.解(1)该超市这两年品牌奶粉销量的前五强排名分别为:飞鹤奶粉,伊利奶粉,贝因美奶粉,雅士利奶粉,完达山奶粉.(2)(3)由(2)知,购买飞鹤奶粉的概率为,X的可能取值为0,1,2.则P(X0),P(X1)C,P(X2).X的分布列为X012P故E(X)012.2.(2018佛山模拟)某公司为招聘新员工设计了一个面试方案:应聘者从6道备选题中一次性随机抽取3道题
19、,按照题目要求独立完成.规定:至少正确完成其中2道题的便可通过.已知6道备选题中应聘者甲有4道题能正确完成,2道题不能完成;应聘者乙每题正确完成的概率都是,且每题正确完成与否互不影响.(1)分别求甲、乙两人正确完成面试题数的分布列及数学期望;(2)请分析比较甲、乙两人谁面试通过的可能性大?解(1)设甲正确完成面试的题数为,则的可能取值为1,2,3.P(1);P(2);P(3).应聘者甲正确完成题数的分布列为123PE()1232.设乙正确完成面试的题数为,则的可能取值为0,1,2,3.P(0)C;P(1)C;P(2)C;P(3)C.应聘者乙正确完成题数的分布列为0123PE()01232.(或
20、因为B,所以E()32)(2)因为D()(12)2(22)2(32)2,D()3.所以D(),根据表中数据易知第8周的命中频率最高.(2)由题意可知XB(3,0.6),则X的数学期望为E(X)30.61.8.(3)由1(1p0)n0.99,即10.4n0.99得0.4nlog0.40.015.025,故至少要用6枚这样的炮弹同时对该目标发射一次,才能使目标被击中的概率超过0.99.5.(2018沈阳模拟)某企业有甲、乙两个分厂生产某种产品,按规定该产品的某项质量指标值落在45,75)的为优质品.从两个分厂生产的产品中各随机抽取500件,测量这些产品的该项质量指标值,结果如下表:指标值分组25,
21、35)35,45)45,55)55,65)65,75)75,85)85,95甲厂频数1040115165120455乙厂频数56011016090705(1)根据以上统计数据完成下面22列联表,并回答是否有99%的把握认为“两个分厂生产的产品的质量有差异?”甲厂乙厂合计优质品760非优质品240合计5005001 000(2)求优质品率较高的分厂的500件产品质量指标值的样本平均数x(同一组数据用该区间的中点值作代表);(3)经计算,甲分厂的500件产品质量指标值的样本方差s142,乙分厂的500件产品质量指标值的样本方差s162.可认为优质品率较高的分厂的产品质量指标值X服从正态分布N(,2
22、),其中近似为样本平均数x,2近似为样本方差s2.由优质品率较高的分厂的抽样数据,能否认为该分厂生产的产品中,质量指标值不低于71.92的产品至少占全部产品的18%(取11.92)?附注:P(K2k)0.050.010.001k3.8416.63510.828参考数据:11.92,12.73.参考公式:K2.若XN(,2),则P(X)0.682 6,P(2X2)0.954 4,P(3X6.635,所以有99%的把握认为“两个分厂生产的零件的质量有差异”.(2)甲分厂优质品率0.8,乙分厂优质品率0.72,所以甲分厂优质品率高.甲分厂的500件产品质量指标值的样本平均数x(30104040501
23、1560165701208045905)300.02400.08500.23600.33700.24800.09900.0160.(3)由(2)知60,2142,甲分厂的产品的质量指标值X服从正态分布XN(60,142),又11.92,则P(6011.92X6011.92)P(48.08X71.92)0.682 6,P(X71.92)0.158 70.18,故不能认为甲分厂生产的产品中,质量指标值不低于71.92的产品至少占全部产品的18%.6.(2018河南百校联盟模拟)国内某知名连锁店分店开张营业期间,在固定的时间段内消费达到一定标准的顾客可参加一次抽奖活动,随着抽奖活动的有效开展,参与抽
24、奖活动的人数越来越多,该分店经理对开业前7天参加抽奖活动的人数进行统计,y表示开业第x天参加抽奖活动的人数,得到统计表格如下:x1234567y58810141517经过进一步统计分析,发现y与x具有线性相关关系.(1)根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程x;(2)若该分店此次抽奖活动自开业起,持续10天,参加抽奖的每位顾客抽到一等奖(奖品价值200元)的概率为,抽到二等奖(奖品价值100元)的概率为,抽到三等奖(奖品价值10元)的概率为.试估计该分店在此次抽奖活动结束时共送出价值多少元的奖品.解(1)依题意知(1234567)4,(58810141517)11,11243,则y关于x的线性回归方程为2x3.(2)设一位参加抽奖的顾客获得的奖品价值X元,则X的分布列为X20010010PE(X)20010010.由y关于x的线性回归方程为2x3,得x8时,19;x9时,21;x10时,23,则此次活动参加抽奖的人数约为58810141517192123140,又1408 800,所以估计该分店在此次抽奖活动结束时共送出价值8 800元的奖品.