1、第8节二项分布与超几何分布、正态分布考试要求1.理解二项分布、超几何分布的概念,能解决一些简单的实际问题.2.借助正态分布曲线了解正态分布的概念,并进行简单应用.1.伯努利试验与二项分布(1)伯努利试验只包含两个可能结果的试验叫做伯努利试验;将一个伯努利试验独立地重复进行n次所组成的随机试验称为n重伯努利试验.(2)二项分布一般地,在n重伯努利试验中,设每次试验中事件A发生的概率为p(0p1),用X表示事件A发生的次数,则X的分布列为P(Xk)Cpk(1p)nk,k0,1,2,n.如果随机变量X的分布列具有上式的形式,则称随机变量X服从二项分布,记作XB(n,p).2.两点分布与二项分布的均值
2、、方差(1)若随机变量X服从两点分布,则E(X)p,D(X)p(1p).(2)若XB(n,p),则E(X)np,D(X)np(1p).3.超几何分布一般地,假设一批产品共有N件,其中有M件次品.从N件产品中随机抽取n件(不放回),用X表示抽取的n件产品中的次品数,则X的分布列为P(Xk),km,m1,m2,r,其中,n,N,MN*,MN,nN,mmax0,nNM,rminn,M,如果随机变量X的分布列具有上式的形式,那么称随机变量X服从超几何分布.4.正态分布(1)定义若随机变量X的概率分布密度函数为f(x)e,xR,其中,R,0为参数,则称随机变量X服从正态分布,记为XN(,2).(2)正态
3、曲线的特点曲线是单峰的,它关于直线x对称.曲线在x处达到峰值.当|x|无限增大时,曲线无限接近x轴.(3)3原则P(X)0.682 7;P(2X2)0.954 5;P(3X3)0.997 3.(4)正态分布的均值与方差若XN(,2),则E(X),D(X)2.1.二项分布当n1时就是两点分布.2.若X服从正态分布,即XN(,2),要充分利用正态曲线关于直线x对称和曲线与x轴之间的面积为1解题.3.利用n重伯努利试验概率公式可以简化求概率的过程,但需要注意检查该概率模型是否满足公式P(Xk)Cpk(1p)nk的三个条件:(1)在一次试验中某事件A发生的概率是一个常数p;(2)n次试验不仅是在完全相
4、同的情况下进行的重复试验,而且各次试验的结果是相互独立的;(3)该公式表示n次试验中事件A恰好发生了k次的概率.1.思考辨析(在括号内打“”或“”)(1)X表示n次重复抛掷1枚骰子出现点数是3的倍数的次数,则X服从二项分布.()(2)从4名男演员和3名女演员中选出4人,其中女演员的人数X服从超几何分布.()(3)n重伯努利试验中各次试验的结果必须相互独立.()(4)正态分布是对于连续型随机变量而言的.()答案(1)(2)(3)(4)2.(2022济南模拟)从装有3个白球、4个红球的箱子中,随机取出了3个球,恰好是2个白球、1个红球的概率是()A. B. C. D.答案C解析如果将白球视为合格品
5、,红球视为不合格品,则这是一个超几何分布问题,故所求概率为P.3.(易错题)甲、乙两羽毛球运动员之间的训练,要进行三场比赛,且这三场比赛可看做三次伯努利试验,若甲至少取胜一次的概率为,则甲恰好取胜一次的概率为()A. B. C. D.答案C解析假设甲取胜事件为A,设每次甲胜的概率为p,由题意得,事件A发生的次数XB(3,p),则有1(1p)3,得p,则事件A恰好发生一次的概率为C.4.(2022石家庄模拟)甲、乙两位选手进行乒乓球比赛,5局3胜制,每局甲赢的概率是,乙赢的概率是,则甲以31获胜的概率是()A. B. C. D.答案A解析甲以31获胜是指前3局比赛中甲2胜1负,第4局比赛甲胜,甲
6、以31获胜的概率是PC.5.(2021新高考卷)某物理量的测量结果服从正态分布N(10,2),下列结论中不正确的是()A.越小,该物理量在一次测量中在(9.9,10.1)的概率越大B.越小,该物理量在一次测量中大于10的概率为0.5C.越小,该物理量在一次测量中小于9.99与大于10.01的概率相等D.越小,该物理量在一次测量中落在(9.9,10.2)与落在(10,10.3)的概率相等答案D解析对于A,2为数据的方差,所以越小,数据在10附近越集中,所以测量结果落在(9.9,10.1)内的概率越大,故A正确;对于B,由正态分布密度曲线的对称性可知该物理量一次测量大于10的概率为0.5,故B正确
7、;对于C,由正态分布密度曲线的对称性可知该物理量一次测量结果大于10.01的概率与小于9.99的概率相等,故C正确;对于D,因为该物理量一次测量结果落在(9.9,10.0)的概率与落在(10.2,10.3)的概率不同,所以一次测量结果落在(9.9,10.2)的概率与落在(10,10.3)的概率不同,故D错误.6.(易错题)已知随机变量X服从正态分布N(3,1),且P(X2c1)P(X2c1)P(Xc3),2c1c323,c.考点一二项分布例1 (2022武汉调研)为贯彻“不忘立德树人初心,牢记为党育人、为国育才使命”的要求,某省推出的高考新方案是“312”模型,“3”是语文、外语、数学三科必考
8、,“1”是在物理与历史两科中选择一科,“2”是在化学、生物、政治、地理四科中选择两科作为高考科目.某学校为做好选课走班教学,给出三种可供选择的组合进行模拟选课,其中A组合:物理、化学、生物,B组合:历史、政治、地理,C组合:物理、化学、地理,根据选课数据得到,选择A组合的概率为,选择B组合的概率为,选择C组合的概率为,甲、乙、丙三位同学每人选课是相互独立的.(1)求这三位同学恰好选择互不相同的组合的概率;(2)记表示这三人中选择含地理的组合的人数,求的分布列及数学期望.解用Ai表示第i位同学选择A组合,用Bi表示第i位同学选择B组合,用Ci表示第i位同学选择C组合,i1,2,3.由题意可知,A
9、i,Bi,Ci互相独立,且P(Ai),P(Bi),P(Ci).(1)三位同学恰好选择不同的组合共有A6种情况,每种情况的概率相同,故三位同学恰好选择不同组合的概率P6P(A1B2C3)6P(A1)P(B2)P(C3)6.(2)由题意知的所有可能取值为0,1,2,3,且B,所以P(0)C,P(1)C,P(2)C,P(3)C,所以的分布列为0123P所以E()0123.感悟提升判断某随机变量是否服从二项分布的关键点(1)在每一次试验中,事件发生的概率相同.(2)各次试验中的事件是相互独立的.(3)在每一次试验中,试验的结果只有两个,即发生与不发生.训练1 (2022苏北四市调研)某社区组织开展“扫
10、黑除恶”宣传活动,为鼓励更多的人积极参与到宣传活动中来,宣传活动现场设置了抽奖环节.在盒中装有9张大小相同的精美卡片,卡片上分别印有“扫黑除恶利国利民”或“普法宣传人人参与”图案.抽奖规则:参加者从盒中抽取卡片两张,若抽到两张分别是“普法宣传人人参与”和“扫黑除恶利国利民”卡即可获奖,否则,均为不获奖.卡片用后放回盒子,下一位参加者继续重复进行.活动开始后,一位参加者问:“盒中有几张普法宣传人人参与卡?”主持人答:“我只知道,从盒中抽取两张都是扫黑除恶利国利民卡的概率是.”(1)求抽奖者获奖的概率;(2)为了增加抽奖的趣味性,规定每个抽奖者先从装有9张卡片的盒中随机抽出1张不放回,再用剩下8张
11、卡片按照之前的抽奖规则进行抽奖,现有甲、乙、丙三人依次抽奖,用X表示获奖的人数,求X的分布列和均值.解(1)设“扫黑除恶利国利民”卡有n张,由,得n4,故“普法宣传人人参与”卡有5张,抽奖者获奖的概率为.(2)在新规则下,每个抽奖者获奖的概率为,所以XB,X的分布列为P(Xk)C(k0,1,2,3),X0123P所以E(X)3.考点二超几何分布例2 为推动乒乓球运动的发展,某乒乓球比赛允许不同协会的运动员组队参加.现有来自甲协会的运动员3名,其中种子选手2名;乙协会的运动员5名,其中种子选手3名.从这8名运动员中随机选择4人参加比赛.(1)设A为事件“选出的4人中恰有2名种子选手,且这2名种子
12、选手来自同一个协会”,求事件A发生的概率;(2)设X为选出的4人中种子选手的人数,求随机变量X的分布列,并求E(X).解(1)由已知,有P(A).所以事件A发生的概率为.(2)随机变量X服从超几何分布,X的所有可能取值为1,2,3,4.P(Xk)(k1,2,3,4).故P(X1),P(X2),P(X3),P(X4),所以随机变量X的分布列为X1234P所以E(X)1234.感悟提升(1)超几何分布描述的是不放回抽样问题,随机变量为抽到的某类个体的个数.超几何分布的特征是:考察对象分两类;已知各类对象的个数;从中抽取若干个个体,考查某类个体数X的概率分布.(2)超几何分布主要用于抽检产品、摸不同
13、类别的小球等概率模型,其实质是古典概型.训练2 端午节吃粽子是我国的传统习俗.设一盘中有10个粽子,其中豆沙粽2个,肉粽3个,白粽5个,这三种粽子的外观完全相同.从中任意选取3个.(1)求三种粽子各取到1个的概率;(2)设X表示取到的豆沙粽个数,求X的分布列,并求E(X).解(1)令A表示事件“三种粽子各取到1个”,则由古典概型的概率计算公式有P(A).(2)X的所有可能值为0,1,2,且P(X0),P(X1),P(X2).综上知,X的分布列为X012P所以E(X)012.考点三正态分布例3 (1)(2022沈阳调研)为了解高三复习备考情况,其校组织了一次阶段考试.若高三全体考生的数学成绩近似
14、服从正态分布N(100,17.52).已知成绩在117.5分以上(不含117.5分)的学生有80人,则此次参加考试的学生成绩低于82.5分的概率为_;如果成绩大于135分的为特别优秀,那么本次数学考试成绩特别优秀的大约有_人.(若XN(,2),则P(X)0.68,P(2X2)0.96)答案0.1610解析因为数学成绩X服从正态分布N(100,17.52),则P(10017.5X10017.5)P(82.5X117.5)0.68,所以此次参加考试的学生成绩低于82.5分的概率P(X82.5)0.16.又P(10017.52X10017.52)P(65X135)0.96,所以数学成绩特别优秀的概率
15、P(X135)0.02.又P(X82.5)P(X117.5)0.16,则本次考试数学成绩特别优秀的人数大约是0.0210.(2)(多选)(2021青岛质检)近年来中国进入一个鲜花消费的增长期,某农户利用精准扶贫政策,贷款承包了一个新型温室鲜花大棚,种植销售红玫瑰和白玫瑰.若这个大棚的红玫瑰和白玫瑰的日销量分别服从正态分布N(,302)和N(280,402),则下列选项正确的是()附:若随机变量X服从正态分布N(,2),则P(X)0.682 7.A.若红玫瑰日销售量范围在(30,280)的概率是0.682 7,则红玫瑰日销售量的平均数约为250B.红玫瑰日销售量比白玫瑰日销售量更集中C.白玫瑰日
16、销售量比红玫瑰日销售量更集中D.白玫瑰日销售量范围在(280,320)的概率约为0.341 35答案ABD解析对于选项A:30280,250,正确;对于选项BC:利用越小越集中,30小于40,B正确,C不正确;对于选项D:P(280X320)P(X)0.682 70.341 35,正确.感悟提升解决正态分布问题有三个关键点:(1)对称轴x;(2)标准差;(3)分布区间.利用对称性可求指定范围内的概率值;由,分布区间的特征进行转化,使分布区间转化为3特殊区间,从而求出所求概率.注意只有在标准正态分布下对称轴才为x0.训练3 (2022安徽五校联盟质检)在某市高中某学科竞赛中,某一个区4 000名
17、考生的参赛成绩统计如图所示.(1)求这4 000名学生的竞赛平均成绩 (同一组中的数据用该组区间的中点值作代表);(2)由直方图可认为考生竞赛成绩z服从正态分布N(,2),其中,2分别取考生的平均成绩和考生成绩的方差s2,那么该区4 000名考生的成绩超过84.81分(含84.81分)的人数估计有多少?(3)如果用该区参赛考生成绩的情况来估计全市的参赛考生的成绩情况,现从全市参赛考生中随机抽取4名,记成绩不超过84.81分的考生人数为,求P(3).(精确到0.001)附:s2204.75,14.31;0.841 340.501;zN(,2),则P(z)0.682 7,P(2z2)0.954 5
18、.解(1)由题意知中点值455565758595频率0.10.150.20.30.150.1450.1550.15650.2750.3850.15950.170.5,这4 000名学生的竞赛平均成绩为70.5分.(2)依题意z服从正态分布N(,2),其中70.5,2s2204.75,14.31,z服从正态分布N(,2)N(70.5,14.312),而P(z)P(56.19z84.81)0.682 7,P(z84.81)0.158 7.又0.158 74 000634.8635.竞赛成绩超过84.81分的人数估计为635.(3)全市竞赛考生的成绩不超过84.81分的概率p10.158 70.84
19、1 3.而B(4,0.841 3),P(3)1P(4)1C0.841 3410.5010.499.二项分布与超几何分布的区别与联系1.教材和考题中常涉及二项分布与超几何分布,学生对这两种模型的定义不能很好地理解,一遇到“取”或“摸”的题型,就认为是超几何分布,不加分析,滥用公式,运算对象不明晰,事实上,超几何分布和二项分布确实有着密切的联系,但也有明显的区别.2.超几何分布的抽取是不放回抽取,各次抽取不独立,二项分布的抽取是有放回抽取,各次抽取相互独立.当超几何分布所对应的总体数量很大时可以近似地看作二项分布.例1 写出下列离散型随机变量的分布列,并指出其中服从二项分布的是哪些?服从超几何分布
20、的是哪些?(1)X1表示n次重复抛掷1枚骰子出现点数是3的倍数的次数.(2)有一批产品共有N件,其中次品有M件(NM0),采用有放回抽取方法抽取n次(nN),抽出的次品件数为X2.(3)有一批产品共有N件,其中M件为次品,采用不放回抽取方法抽n件,出现次品的件数为X3(NMn0).解(1)X1的分布列为X1012nPCCCCX1服从二项分布,即X1B.(2)X2的分布列为X2012nPCCX2服从二项分布,即X2B.(3)X3的分布列为X301knPX3服从超几何分布.例2 某食品厂为了检查一条自动包装流水线的生产情况,随机抽取该流水线上的40件产品作为样本称出它们的质量(单位:克),质量的分
21、组区间为(490,495,(495,500,(510,515.由此得到样本的频率分布直方图(如下图).(1)根据频率分布直方图,求质量超过505克的产品数量;(2)在上述抽取的40件产品中任取2件,设X为质量超过505克的产品数量,求X的分布列;(3)从该流水线上任取2件产品,设Y为质量超过505克的产品数量,求Y的分布列.解(1)质量超过505克的产品的频率为50.0550.010.3,所以质量超过505克的产品数量为400.312(件).(2)质量超过505的产品数量为12件,则质量未超过505克的产品数量为28件,X的取值为0,1,2,X服从超几何分布.P(X0),P(X1),P(X2)
22、,X的分布列为X012P(3)根据样本估计总体的思想,取一件产品,该产品的质量超过505克的概率为.从流水线上任取2件产品互不影响,该问题可看成2重伯努利试验,质量超过505克的件数Y的可能取值为0,1,2,且YB,P(Yk)C,k0,1,2.所以P(Y0)C,P(Y1)C,P(Y2)C.Y的分布列为Y012P1.若随机变量XB,则P(X3)等于()A. B. C. D.答案B解析随机变量XB,则P(X3)C.2.(2022昆明诊断)袋中装有2个红球,3个黄球,有放回地抽取3次,每次抽取1球,则3次中恰有2次抽到黄球的概率是()A. B. C. D.答案D解析袋中装有2个红球,3个黄球,有放回
23、地抽取3次,每次抽取1球,每次取到黄球的概率P1,3次中恰有2次抽到黄球的概率PC.3.一个袋中装有4个红球,3个黑球,小明从袋中随机取球,设取到一个红球得2分,取到一个黑球得1分,从袋中任取4个球,则小明得分大于6分的概率是()A. B. C. D.答案A解析记得分为X,则X的可能取值为5,6,7,8,P(X7);P(X8),所以P(X6)P(X7)P(X8).4.据统计,某脐橙的果实横径(单位:mm)服从正态分布N(80,52),则果实横径在75,90内的概率为()附:若XN(,2),则P(X)0.682 7,P(2X2)0.954 5.A.0.682 7 B.0.841 3 C.0.81
24、8 6 D.0.954 5答案C解析由题意得5,则P(805X805)0.682 7,所以P(75X85)0.682 7;P(8010X8010)0.954 5,所以P(70X90)0.954 5.所以P(85X90)0.135 9,所以果实横径在75,90内的概率为0.682 70.135 90.818 6.5.(多选)已知随机变量X服从正态分布N(100,102),则下列选项正确的是()(参考数值:随机变量服从正态分布N(,2),则P()0.682 7,P(22)0.954 5,P(33)0.997 3)A.E(X)100 B.D(X)100C.P(X90)0.841 35 D.P(X12
25、0)0.998 65答案ABC解析随机变量X服从正态分布N(100,102),正态曲线关于x100对称,且E(X)100,D(X)102100,根据题意可得,P(90X110)0.682 7,P(80X120)0.954 5,P(X90)0.50.682 70.841 35,故C正确;P(X120)0.50.954 50.977 25,故D错误.而A,B都正确.故选ABC.6.(多选)某人参加一次测试,在备选的10道题中,他能答对其中的5道.现从备选的10道题中随机抽出3道题进行测试,规定至少答对2题才算合格.则下列选项正确的是()A.答对0题和答对3题的概率相同,都为B.答对1题的概率为C.
26、答对2题的概率为D.合格的概率为答案CD解析设此人答对题目的个数为,则0,1,2,3,P(0),P(1),P(2),P(3),则答对0题和答对3题的概率相同,都为,故A错误;答对1题的概率为,故B错误;答对2题的概率为,故C正确;合格的概率pP(2)P(3),故D正确.故选CD.7.已知随机变量X服从正态分布N(a,4),且P(X1)0.5,P(X2)0.3,则P(X0)_.答案0.3解析随机变量X服从正态分布N(a,4),所以曲线关于xa对称,且P(Xa)0.5.由P(X1)0.5,可知a1,所以P(X0)P(X2)0.3.8.(2022济南模拟)某人射击一次击中目标的概率为0.6,经过三次
27、射击,此人至少有两次击中目标的概率为_.答案0.648解析设击中目标的次数为X,则XB(3,0.6).故P(X2)P(X2)P(X3)C0.62(10.6)C0.630.648.9.(2021宁波期末)一个箱子中装有形状、大小完全相同的5个白球和n(nN*)个黑球.现从中有放回地摸取4次,每次都是随机摸取一球,设摸得白球个数为X,若D(X)1,则E(X)_.答案2解析由题意,XB(4,p),D(X)4p(1p)1,p,E(X)4p42.10.甲、乙两人参加一次英语口语考试,已知在备选的10道试题中,甲能答对其中的6题,乙能答对其中的8题,规定每次考试都从备选题中随机抽出3道题进行测试,至少答对
28、2题才算合格.(1)设甲、乙两人在考试中答对的题数分别为X,Y,写出随机变量X,Y的分布列;(2)求甲、乙两人至少有一人考试合格的概率.解(1)随机变量X的所有可能取值为0,1,2,3,P(X0),P(X1),P(X2),P(X3),所以随机变量X的分布列为X0123P随机变量Y的所有可能取值为1,2,3,P(Y1),P(Y2),P(Y3),所以随机变量Y的分布列为Y123P(2)由(1)知甲合格的概率为P(A),乙合格的概率为,因为事件A,B相互独立,所以甲、乙两人均不合格的概率为P()P()P()1P(A)1P(B),所以甲、乙两人至少有一人考试合格的概率为1.11.为了拓展网络市场,某公
29、司为手机客户端用户推出了多款APP应用,如“农场”“音乐”“读书”等.市场调查表明,手机用户在选择以上三种应用时,选择“农场”、“音乐”、“读书”的概率分别为,.现有甲、乙、丙三位手机客户端用户独立任意选择以上三种应用中的一种进行安装.(1)求三人所选择应用互不相同的概率;(2)记为三人中选择的应用是“农场”与“音乐”的人数,求的分布列和期望.解记第i名用户选择的应用是“农场”、“音乐”、“读书”分别为事件Ai,Bi,Ci,i1,2,3.由题意知A1,A2,A3相互独立,B1,B2,B3相互独立,C1,C2,C3相互独立,Ai,Bj,Ck(i,j,k1,2,3且i,j,k互不相同)相互独立,且
30、P(Ai),P(Bi),P(Ci).(1)他们选择的应用互不相同的概率P6P(A1B2C3)6P(A1)P(B2)P(C3).(2)设3位用户选择的应用是“读书”的人数是,由已知得B,且3,所以P(0)P(3)C,P(1)P(2)C,P(2)P(1)C,P(3)P(0)C.故的分布列为0123PE()0123.12.(多选)(2022徐州模拟)某计算机程序每运行一次都随机出现一个五位二进制数Aa1a2a3a4a5(例如10100),其中A的各位数中ak(k2,3,4,5)出现0的概率为,出现1的概率为,记Xa2a3a4a5,则当程序运行一次时()A.X服从二项分布B.P(X1)C.X的均值E(
31、X)D.X的方差D(X)答案ABC解析由二进制数A的特点知每一个数位上的数字只能填0,1,且每个数位上的数字再填时互不影响,故以后的5位数中后4位的所有结果有4类:后4个数出现0,X0,记其概率为P(X0);后4个数只出现1个1,X1,记其概率为P(X1)C;后4个数出现2个1,X2,记其概率为P(X2)C,后4个数出现3个1,记其概率为P(X3)C,后4个数都出现1,X4,记其概率为P(X4),故XB,故A正确;又P(X1)C,故B正确;XB,E(X)4,故C正确;XB,X的方差D(X)4,故D错误.13.(2022豫南九校联考)若随机变量X服从正态分布N(,2),P(X)0.682 7,P
32、(2X2)0.954 5,设XN(1,2),且P(X3)0.158 65,在平面直角坐标系xOy中,若圆x2y22上有四个点到直线12x5yc0的距离为1,则实数c的取值范围是_.答案(13,13)解析因为XN(1,2),所以1,所以P(X3)P(X1)1P(1X3),因为P(X3)0.158 65,所以P(1X3)0.682 7,所以11,13,所以2,由题意知,只需圆心(0,0)到直线12x5yc0的距离d满足0d1即可.d,01,0|c|13,13c13,c的取值范围是(13,13).14.(2021杭州一模)某高校通过自主招生方式在贵阳招收一名优秀的高三毕业生,经过层层筛选,甲、乙两名
33、学生进入最后测试,该校设计了一个测试方案:甲、乙两名学生各自从6个问题中随机抽3个问题.已知这6个问题中,学生甲能回答正确其中的4个问题,而学生乙能回答正确每个问题的概率均为,甲、乙两名学生对每个问题的回答都是相互独立、互不影响的.(1)求甲、乙两名学生共答对2个问题的概率;(2)请从期望和方差的角度分析,甲、乙两名学生哪位被录取的可能性更大.解(1)由题意可知,所求概率PCC.(2)设学生甲答对的题数为X,则X的所有可能取值为1,2,3.P(X1),P(X2),P(X3),E(X)1232,D(X)(12)2(22)2(32)2.设学生乙答对的题数为Y,则Y的所有可能取值为0,1,2,3.由题意可知YB,E(Y)32,D(Y)3.因为E(X)E(Y),D(X)D(Y),所以甲被录取的可能性更大.