1、高考解答题突破(五)概率与统计突破“两辨”辨析、辨型概率与统计问题的求解关键是辨别它的模型,只要找到模型,问题便迎刃而解而概率模型的提取往往需要经过观察、分析、归纳、判断等复杂的辨析思维过程,常常因题设条件理解不准,某个概念认识不清而误入歧途另外,还需弄清楚概率模型中等可能事件、互斥事件、对立事件、独立事件等事件间的关系,注意放回和不放回试验的区别,合理划分复合事件考向一离散型随机变量的均值与方差在解决离散型随机变量的均值与方差的问题时,要善于将复杂事件分解为较简单事件,对照相关概率类型,如互斥事件类型、相互独立事件类型、古典概型等,然后用相关公式求解解决离散型随机变量的均值与方差的关键(1)
2、会判断,先判断事件的类型,再利用对立事件的概率公式、条件概率的公式等求解概率;(2)会计算,要求随机变量X的期望,需先求出X的所有可能取值,然后求出随机变量X取每个值时的概率,再利用随机变量的数学期望的定义进行计算1(2019河南郑州模拟)在心理学研究中,常采用对比试验的方法评价不同心理暗示对人的影响,具体方法如下:将参加试验的志愿者随机分成两组,一组接受甲种心理暗示,另一组接受乙种心理暗示,通过对比这两组志愿者接受心理暗示后的结果来评价两种心理暗示的作用现有6名男志愿者A1,A2,A3,A4,A5,A6和4名女志愿者B1,B2,B3,B4,从中随机抽取5人接受甲种心理暗示,另5人接受乙种心理
3、暗示(1)求接受甲种心理暗示的志愿者中包含A1但不包含B1的概率;(2)用X表示接受乙种心理暗示的女志愿者人数,求X的分布列与数学期望E(X)解(1)记接受甲种心理暗示的志愿者中包含A1但不包含B1的事件为M,则P(M).(2)由题意知X可取的值为:0,1,2,3,4,则P(X0),P(X1),P(X2),P(X3),P(X4).因此X的分布列为X01234PX的数学期望是E(X)012342.考向二线性回归分析与独立性检验1在分析两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程估计和预测变量的值2独立性检验的关键是根据
4、22列联表准确计算出K2,再做判断解题指导解(1)依题意,得50岁以上50岁以下总计使用支付宝捐步100010002000不使用支付宝捐步25005003000总计350015005000由表中数据得K2的观测值故E(X)123.线性回归分析与独立性检验问题的关注点(1)由回归方程分析得出的数据只是预测值不是精确值,此类问题的易错点是方程中的计算,代入公式计算要细心(2)独立性检验是指利用22列联表,通过计算随机变量K2来确定在多大程度上两个分类变量有关系的方法2某市场研究人员为了了解产业园引进的甲公司前期的经营状况,对该公司2018年连续六个月的利润进行了统计,并根据得到的数据绘制了相应的折
5、线图,如图所示(1)由折线图可以看出,可用线性回归模型拟合月利润y(单位:百万元)与月份代码x之间的关系,求y关于x的线性回归方程,并预测该公司2019年3月份的利润(2)甲公司新研制了一款产品,需要采购一批新型材料,现有A,B两种型号的新型材料可供选择,且A型号每件的采购成本为10万元,B型号每件的采购成本为12万元按规定每种新型材料最多可使用4个月,但新型材料的不稳定性会导致材料损坏的年限不相同,现对A,B两种型号的新型材料对应的产品各100件进行科学模拟测试,得到两种新型材料使用寿命的频数统计如下表:经甲公司测算平均每件新型材料每月可以带来5万元收入,不考虑除采购成本之外的其他成本,假设
6、每件新型材料的使用寿命都是整数月,且以频率作为每件新型材料使用寿命的概率,如果你是甲公司的负责人,以每件新型材料产生利润的期望值为决策依据,你会选择采购哪款新型材料?参考数据:i96,iyi371.参考公式:回归方程x中斜率和截距的最小二乘估计公式分别为,.解(1)由折线图可知统计数据(x,y)共有6组,即(1,11),(2,13),(3,16),(4,15),(5,20),(6,21),计算可得3.5,i9616,12223242526291,所以2,1623.59,所以月利润y关于月份代码x的线性回归方程为2x9.当x11时,211931.故预计甲公司2019年3月份的利润约为31百万元(
7、2)由频率估计概率,每件A型号的新型材料可使用1个月、2个月、3个月和4个月的概率分别为0.2,0.35,0.35和0.1,所以每件A型号的新型材料可产生的利润期望值E(1)(510)0.2(1010)0.35(1510)0.35(2010)0.11.75.由频率估计概率,每件B型号的新型材料可使用1个月、2个月、3个月和4个月的概率分别为0.1,0.3,0.4和0.2,所以每件B型号的新型材料可产生的利润期望值E(2)(512)0.1(1012)0.3(1512)0.4(2012)0.21.5,E(1)E(2)所以应该采购A型号的新型材料考向三正态分布服从正态分布的随机变量X在某个区间内取值
8、的概率求法:(1)利用P(X),P(2X2),P(3X3)的值直接求(2)充分利用正态曲线的对称性和曲线与x轴之间的面积为1来求解解题指导解(1)抽取的一个零件的尺寸在(3,3)之内的概率为0.9973,从而零件的尺寸在(3,3)之外的概率为0.0027,故XB(16,0.0027)因此P(X1)1P(X0)10.9973160.0423.X的数学期望为E(X)160.00270.0432.(2)如果生产状态正常,一个零件尺寸在(3,3)之外的概率只有0.0027,一天内抽取的16个零件中,出现尺寸在(3,3)之外的零件的概率只有0.0423,发生的概率很小因此一旦发生这种情况,就有理由认为这
9、条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查,可见上述监控生产过程的方法是合理的由9.97,s0.212,得的估计值为9.97,的估计值为0.212,由样本数据可以看出有一个零件的尺寸在(3,3)之外,因此需对当天的生产过程进行检查剔除(3,3)之外的数据9.22,剩下数据的平均数为(169.979.22)10.02,因此的估计值为10.02.160.2122169.9721591.134,剔除(3,3)之外的数据9.22,剩下数据的样本方差为(1591.1349.2221510.022)0.008,因此的估计值为0.09.正态分布是自然界中常见的一种分布,许多现象
10、都近似地服从正态分布,这也是高中阶段唯一连续随机变量的分布,其中概率计算是考查的一个热点要求服从正态分布的随机变量X在某一范围内的概率,只需借助于正态曲线的性质,把所求问题转化到已知概率的区间(,),(2,2),(3,3)上即可3(2019石家庄二中期末)为了解全市统考成绩情况,从所有参加考试的考生中随机抽取4000名考生的成绩,所得结果绘制成如图所示的频率分布直方图(1)求这4000名考生的平均成绩(同一组中数据用该组区间中点值作代表)(2)由直方图可认为考生考试成绩Z服从正态分布N(,2),其中,2分别取考生的平均成绩和考生成绩的方差s2,那么抽取的4000名考生中成绩超过84.41分的人
11、数大约为多少?(3)如果用抽取的考生成绩情况来估计全市考生的成绩情况,现从全市考生中随机抽取4名考生,记成绩不超过84.81分的考生人数为,求P(3)(精确到0.001)附:s2204.75,14.31;若ZN(,2),则P(Z)0.6827,P(2Z2)0.9545;0.8413540.501.解(1)由题意知450.1550.15650.2750.3850.15950.170.5,这4000名考生的平均成绩约为70.5分(2)Z服从正态分布N(,2),其中70.5,2s2204.75,14.31,Z服从正态分布N(70.5,14.312),而P(Z)P(56.1984.81)0.15865
12、.抽取的4000名考生中成绩超过84.81分的人数大约为0.158654000634.6635.(3)考生成绩不超过84.81分的概率为10.158650.84135,B(4,0.84135),P(3)1P(4)1C0.84135410.5010.499.专题强化训练(二十八)1(2019东北四校联考)一个袋中有大小、质地完全相同的4个红球和1个白球,共5个球,现从中每次随机取出2个球,若取出的有白球必须把白球放回去,红球不放回,然后取第二次,第三次,直到把红球取完只剩下1个白球为止用表示终止时取球的次数(1)求2的概率;(2)求的分布列及数学期望解(1)随机变量2表示从袋中随机取球2次且每次
13、取的都是红球,P(2),即2的概率为.(2)由题意知随机变量的所有可能取值为2,3,4,由(1)知P(2).又P(4),P(3)1P(2)P(4),的分布列为234PE()234.2(2019太原一模)2019年10月1日上午,在天安门广场举行了庆祝新中国成立70周年集会活动.70年众志成城,70年砥砺奋进,70年春风化雨,中国人民用双手书写了国家和民族发展的壮丽史诗会后,央视媒体平台收到了来自全国各地的纪念新中国成立70年变化的老照片,并从众多照片中抽取了100张照片参加“新中国成立70年图片展”,其作者年龄集中在25,85之间,根据统计结果,作出频率分布直方图如下:(1)求这100位作者年
14、龄的样本平均数和样本方差s2(同一组数据用该区间的中点值作代表);(2)由频率分布直方图可以认为,作者年龄X服从正态分布N(,2),其中近似为样本平均数,2近似为样本方差s2.利用该正态分布,求P(60X73.4);央视媒体平台从年龄在45,55)和65,75)的作者中,按照分层抽样的方法,抽出了7人参加“纪念新中国成立70年图片展”表彰大会,现要从中选出3人作为代表发言,设这3位发言者的年龄落在区间45,55)的人数是Y,求变量Y的分布列和数学期望附:13.4,若XN(,2),则P(X)0.6827,P(2X2)0.9545.解(1)这100位作者年龄的样本平均数和样本方差s2分别为300.
15、05400.1500.15600.35700.2800.1560,s2(30)20.05(20)20.1(10)20.1500.351020.22020.15180.(2)由(1)知,XN(60,180),从而P(60X73.4)P(6013.4X6013.4)0.34135.根据分层抽样,可知这7人中年龄在45,55)内的有3人,在65,75)内的有4人,故Y可能的取值为0,1,2,3.P(Y0),P(Y1),P(Y2),P(Y3),所以Y的分布列为Y0123P所以Y的数学期望为E(Y)0123.3(2019北京海淀调研)为了预防某种流感扩散,某校医务室采取积极的处理方式,对感染者进行短暂隔
16、离直到康复假设某班级已知6位同学中有1位同学被感染,需要通过化验血液来确定被感染的同学,血液化验结果呈阳性即被感染,呈阴性即未被感染下面是两种化验方案方案甲:逐个化验,直到能确定被感染的同学为止方案乙:先任取3个同学,将他们的血液混在一起化验,若结果呈阳性则表明被感染同学为这3位中的1位,后再逐个化验,直到能确定被感染的同学为止;若结果呈阴性,则在另外3位同学中逐个检测(1)求方案甲所需化验次数等于方案乙所需化验次数的概率;2)表示方案甲所需化验次数,表示方案乙所需化验次数,假设每次化验的费用都相同,请从经济角度考虑哪种化验的方案最佳解设Ai(i1,2,3,4,5)表示方案甲所需化验次数为i次
17、;Bj(j2,3)表示方案乙所需化验的次数为j次,方案甲与方案乙相互独立(1)P(A1)P(A2)P(A3)P(A4),P(A5),P(B2),P(B3)1P(B2),用事件D表示方案甲所需化验次数等于方案乙所需化验次数,则P(D)P(A2B2A3B3)P(A2)P(B2)P(A3)P(B3).(2)的可能取值为1,2,3,4,5.的可能取值为2,3.由(1)知P(1)P(2)P(3)P(4),P(5),所以E()12345,P(2)P(B2),P(3)P(B3),所以E()23.因为E()E(),所以从经济角度考虑方案乙最佳4(2019河北衡水中学5月模拟)已知鸡的产蛋量与鸡舍的温度有关为了
18、确定某一个时段鸡舍的控制温度,某企业需要了解鸡舍的时段控制温度x(单位:)对某种鸡的时段产蛋量y(单位:t)和时段投入成本z(单位:万元)的影响为此,该企业选取了7个鸡舍的时段控制温度xi和产蛋量yi(i1,2,7)的数据,对数据初步处理后得到了如图所示的散点图及一些统计量的值(xi)2(ki)2(xi)(yi)(xi)(ki)17.4082.303.60140.009.702935.1035.00其中kilnyi,ki.(1)根据散点图判断,ybxa与yc1ec2x(e为自然对数的底数)哪一个适宜作为该种鸡的时段产蛋量y关于鸡舍的时段控制温度x的回归方程类型?(给出判断即可,不必说明理由)(
19、2)根据(1)的判断及表中的数据,建立y关于x的回归方程;(3)已知时段投入成本z与x,y的关系为ze2.5y0.1x10,当鸡舍的时段控制温度为28 时,鸡的时段产蛋量及时段投入成本的预报值是多少?附:对于一组具有线性相关关系的数据(u1,v1),(u2,v2),(un,vn),其回归直线vu的斜率和截距的最小二乘估计分别为,.参考数据:e2.5e0.75ee3e70.080.472.7220.091096.63解(1)由题中散点图可以判断,yc1ec2x适宜作为该种鸡的时段产蛋量y关于鸡舍的时段控制温度x的回归方程类型(2)令klny,建立k关于x的线性回归方程kdxc(dc2,clnc1)由题意,得0.25,3.600.2517.400.75,所以k关于x的线性回归方程为0.25x0.75,c20.25,c1e0.750.47,故y关于x的回归方程为0.47e0.25x.(3)由(2)知,当x28时,鸡的时段产蛋量y的预报值0.47e0.25280.47e70.471096.63515.42(t),时段投入成本z的预报值e2.5515.420.128100.08515.422.81048.43(万元)