1、第6讲 离散型随机变量及其分布列 1.理解取有限个值的离散型随机变量及其分布列的概念,了解分布列对于刻画随机现象的重要性.2.理解超几何分布及其导出过程,并能进行简单的应用.3.了解条件概率和两个事件相互独立的概念,理解 n 次独立重复试验的模型及二项分布,并能解决一些简单的实际问题.1.随机变量(1)随着试验结果变化而变化的变量称为随机变量,常用字母 X,Y,表示.(2)所有取值可以一一列出的随机变量称为离散型随机变量.(3)随机变量可以取某一区间内的一切值,这样的变量就叫做连续型随机变量.2.条件概率及其性质(1)条件概率的定义:设 A,B 为两个事件,且 P(A)0,称 P(B|A)为事
2、件A 发生的条件下,事件 B 发生的概率.(2)条件概率的求法:求条件概率除了可借助定义中的公式,还可以借助古典概型概率公式,即 P(B|A)n(AB).n(A)P(AB)P(A)(3)条件概率的性质:条件概率具有一般概率的性质,即_P(B|A)_;若 B 和 C 是两个互斥事件,则 P(BC|A)P(B|A)P(C|A).3.事件的相互独立性(1)设 A,B 为两个事件,若 P(AB)_,则称事件A 与事件 B 相互独立.(2)若事件 A 与事件 B 相互独立,则 A 与 B,A 与 B,A与B 也都相互独立.01P(A)P(B)X x1 x2 xi xn P p1 p2 pi pn 4.离
3、散型随机变量的分布列称为离散型随机变量 X 的概率分布列,简称为 X 的分布列.有时为了表达简单,也用等式P(Xxi)pi,i1,2,n表示 X 的分布列.一般地,若离散型随机变量X可能取的不同值为x1,x2,xi,xn,X取每一个值xi(i1,2,n)的概率P(Xxi)pi,则表X01P1pp5.离散型随机变量分布列的性质(1)pi0(i1,2,n).(2)p1p2pn1.6.常见的离散型随机变量的分布列(1)两点分布:如果随机变量 X 的分布列为:其中 0p1,称 X 服从两点分布,而称 pP(X1)为成功概率.(2)超几何分布:一般地,在含有 M 件次品的 N 件产品中,任取 n 件,其
4、中恰有 X 件次品,则随机事件 X k 发生的概率为 P(X k)CkMCnkNMCnN,k0,1,2,m(其中 mminM,n,且 nN,MN,n,M,NN*),称随机变量 X 服从超几何分布,其分布列如下表:X01mPC0MCn0NMCnNC1MCn1NMCnNCmMCnmNMCnN(3)二项分布:一般地,在 n 次独立重复试验中,设事件 A 发生的次数为X,在每次试验中事件 A 发生的概率为 p,那么在 n 次独立重复(k0,1,2,n).此时称随机变量 X 服从二项分布.记作 XB(n,p),并称 p 为成功概率.其分布列如下表:试验中,事件 A 恰好发生 k 次的概率为 P(Xk)C
5、knpk(1p)nkX01knPC0np0(1p)n C1np1(1p)n1Cknpk(1p)nkCnnpn(1p)01.设随机变量 X 的分布列如下:X12345P112161316p则 p 为()A.16 B.13C.14D.112C解析:由分布列的性质,得 112161316p1,p13414.X45678910P0.020.040.060.090.280.290.222.某射手射击所得环数 X 的分布列为:C则此射手“射击一次命中环数大于 7”的概率为()A.0.28B.0.88C.0.79D.0.51解析:P(X7)P(X8)P(X9)P(X10)0.280.290.220.79.3
6、.某篮球运动员在三分线投球的命中率是12,他投球 5 次,恰好投进 3 个球的概率为()A.34B.58C.516D.532C4.设某项试验的成功率是失败率的 2 倍,用随机变量 X 去描述 1 次试验的成功次数,则 P(X0)()A.0 B.12C.13D.23C解析:由已知,得 X 的所有可能取值为 0,1,且 P(X1)2P(X0),由 P(X1)P(X0)1,得 P(X0)13.考点 1 离散型随机变量的分布列例 1:摩拜单车和 ofo 小黄车等各种共享单车的普及给我们的生活带来了便利.已知某共享单车的收费标准是:每车使用不超过 1 小时(包含 1 小时)是免费的,超过 1 小时的部分
7、每小时收费 1 元(不足 1 小时的部分按 1 小时计算,例如:骑行 2.5 小时收费为 2 元).现有甲、乙两人各自使用该种共享单车一次.设(1)求甲、乙两人所付的车费相同的概率;(2)设甲、乙两人所付的车费之和为随机变量,求的分布列及数学期望 E().甲、乙不超过 1 小时还车的概率分别为14,12;1 小时以上且不超过 2 小时还车的概率分别为12,14;两人用车时间都不会超过3 小时.解:(1)甲、乙两人用车时间超过 2 小时的概率分别为14,14,甲、乙两人所付车费用相同的概率 p141212141414516.(2)随机变量 的所有取值为 0,1,2,3,4.P(0)121418;
8、P(1)14141212 516;P(2)121412141414 516;P(3)12141414 316;P(4)1414 116.则随机变量 的分布列为:01234P18516516316116数学期望 E()180 5161 5162 3163 116474.【规律方法】离散型随机变量的分布列的求法:写出X 的所有可能取值(注意准确理解X 的含义,以免失误);利用概率知识(古典概型或相互独立事件的概率)求出X取各值的概率;列表并检验,写出分布列.【互动探究】1.为创建国家级文明城市,某城市号召出租车司机在高考期间至少参加一次“爱心送考”,该城市某出租车公司共 200名司机,他们参加“爱
9、心送考”的次数统计如图 9-6-1.(1)求该出租车公司的司机参加“爱心送考”的人均次数;(2)从这 200 名司机中任选两人,设这两人参加送考次数之差的绝对值为随机变量 X,求 X 的分布列及数学期望.图 9-6-1解:由图可知,参加送考次数为 1 次,2 次,3 次的司机人数分别为 20,100,80.(1)该出租车公司司机参加送考的人均次数为:12021003802002.3.(2)从该公司任选两名司机,记“这两人中一人参加 1 次,另一个参加 2 次送考”为事件 A,“这两人中一人参加 2 次,另一人参加 3 次送考”为事件 B,“这两人中一人参加 1 次,另一人参加 3 次送考”为事
10、件 C,“这两人参加次数相同”为事件 D.则 P(X1)P(A)P(B)C120C1100C2200 C1100C180C2200 100199,P(X2)P(C)C120C180C2200 16199,P(X0)P(D)C220C2100C280C2200 83199.则随机变量 X 的分布列为:X012P8319910019916199X 的数学期望 E(X)0 8319911001992 16199132199.考点 2 超几何分布例 2:(2017 年北京)为了研究一种新药的疗效,选 100 名患者随机分成两组,每组各 50 名,一组服药,另一组不服药.一段时间后,记录了两组患者的生理
11、指标 x 和 y 的数据,并制成图 9-6-2,其中“*”表示服药者,“”表示未服药者.图 9-6-2(1)从服药的 50 名患者中随机选出一人,求此人指标 y 的值小于 60 的概率;(2)从图中 A,B,C,D 四人中随机选出两人,记为选出的两人中指标 x 的值大于 1.7 的人数,求的分布列和数学期望E();(3)试判断这 100 名患者中服药者指标 y 数据的方差与未服药者指标 y 数据的方差的大小.(只需写出结论)解:(1)由题图知,在服药的 50 名患者中,指标的值小于60 的有 15 人,所以从服药的 50 名患者中随机选出一人,此人指标的值小于 60 的概率为0.3.(2)由图
12、知,A,B,C,D 四人中,指标的值大于 1.7 的有 2人:A 和 C.所以的所有可能取值为 0,1,2.1550P(0)C22C2416,P(1)C12C12C24 23,P(2)C22C2416.所以的分布列为:(3)在这 100 名患者中,服药者指标 y 数据的方差大于未服药者指标 y 数据的方差.012P162316故 的期望 E()0161232161.【规律方法】对于服从某些特殊分布的随机变量,其分布列可以直接应用公式给出.超几何分布描述的是不放回抽样问题,随机变量为抽到的某类个体的个数,超几何分布是一个重要分布,其理论基础是古典概型,主要应用于抽查产品、摸不同类别的小球等概率模
13、型.【互动探究】2.(2017 年山东)在心理学研究中,常采用对比试验的方法评价不同心理暗示对人的影响,具体方法如下:将参加试验的志愿者随机分成两组,一组接受甲种心理暗示,另一组接受乙种心理暗示,通过对比这两组志愿者接受心理暗示后的结果来评价两种心理暗示的作用,现有 6 名男志愿者A1,A2,A3,A4,A5,A6和4名女志愿者B1,B2,B3,B4,从中随机抽取5人接受甲种心理暗示,另 5 人接受乙种心理暗示.(1)求接受甲种心理暗示的志愿者中包含 A1 但不包含 B1 的频率;(2)用 X 表示接受乙种心理暗示的女志愿者人数,求 X 的分布列与数学期望 E(X).解:(1)记接受甲种心理暗
14、示的志愿者中包含 A1 但不包含B1 的事件为 M,则 P(M)C48C510 518.(2)由题意知 X 可取的值为 0,1,2,3,4.则:P(X0)C56C510 142,P(X1)C46C14C510 521,P(X2)C36C24C510 1021,P(X3)C26C34C510 521,P(X4)C16C44C510 142,因此 X 的分布列为:X 的数学期望是:E(X)0P(X0)1P(X1)2P(X2)3P(X3)4P(X4)X01234P142521102152114201 521210213 5214 1422.考点 3 二项分布的应用例 3:(2018 年新课标)某工厂
15、的某种产品成箱包装,每 箱 200 件,每一箱产品在交付用户之前要对产品作检验,如检验出不合格品,则更换为合格品.检验时,先从这箱产品中任取20 件作检验,再根据检验结果决定是否对余下的所有产品作检验,设每件产品为不合格品的概率都为 p(0p0;当 p(0.1,1)时,f(p)400,故应该对余下的产品作检验.【规律方法】(1)判断一个随机变量是否服从二项分布,关 键有两点:一是对立性,即一次试验中,事件发生与否必居其 一;二是重复性,即试验是否独立重复进行了n 次.(2)二项分布满足的条件:每次试验中,事件发生的概率是相同的;各次试验中的事件是相互独立的;每次试验只有两种结果:事件要么发生,
16、要么不发生;随机变量是这 n 次独立重复试验中事件发生的次数.年龄男性女性合计18,25)1804022025,35)36024060035,50)4010014050,80)202040【互动探究】3.自 2016 年底,共享单车日渐火爆起来,逐渐融入大家的日常生活中,某市针对 18 岁到 80 岁之间的不同年龄段的城市市民使用共享单车情况进行了抽样调查,结果如下表所示:(1)采用分层抽样的方式从年龄在25,35)内的人中抽取 10人,求其中男性、女性的使用人数各为多少?(2)在(1)中选出的 10 人中随机抽取 4 人,求其中恰有 2 人是女性的概率;(3)用样本估计总体,在全市 18 岁
17、到 80 岁的市民中抽 4 人,其中男性使用的人数记为,求的分布列.解:(1)因为年龄在25,35)人中男性,女性使用人数占总体的比例分别为36060035,24060025,所以抽取的 10 人中男性、女性人数分别为35106,25104,(2)由题意知,在(1)中选出的 10 人中,女性使用者人数为 4,所以恰有 2 人是女性使用者的概率为C26C24C410 37.(3)由题意知,的可能取值为 0,1,2,3,4,因为用样本估计总体,任取 1 人,是男性使用者的概率为600100035,所以随机变量 服从二项分布,即 B4,35,P(0)C04350254 16625;P(1)C1435
18、1253 96625;P(2)C24352252216625,P(3)C34353251216625;P(4)C44354250 81625.所以 的分布列为:01234P166259662521662521662581625思想与方法分类讨论思想与离散型随机变量的结合例题:(2014 年福建)为回馈顾客,某商场拟通过摸球兑奖 的方式对 1000 位顾客进行奖励,规定:每位顾客从一个装有 4个标有面值的球的袋中一次性随机摸出 2 个球,球上所标的面值之和为该顾客所获的奖励额.(1)若袋中所装的 4 个球中有 1 个所标的面值为 50 元,其余 3 个均为 10 元,求:顾客所获的奖励额为 60
19、 元的概率;顾客所获的奖励额的分布列及数学期望.(2)商场对奖励总额的预算是 60 000 元,并规定袋中的 4 个球只能由标有面值为 10 元和 50 元的两种球组成,或标有面值为 20 元和 40 元的两种球组成.为了使顾客得到的奖励总额尽可能符合商场的预算且每位顾客所获的奖励额相对均衡,请对袋中的 4 个球的面值给出一个合适的设计,并说明理由.X2060P0.50.5解:(1)设顾客所获的奖励额为 X.所以顾客所获的奖励额的期望为 E(X)200.5600.540.依题意,得 P(X60)C11C13C24 12,即顾客所获的奖励额为 60 元的概率为12.依题意,得 X 的所有可能取值
20、为 20,60.P(X60)12,P(X20)C23C2412.即 X 的分布列为:(2)根据商场的预算,每个顾客的平均奖励额为 60 元.所以先寻找期望为 60 元的可能方案.对于面值由10元和50元组成的情况,如果选择(10,10,10,50)的方案,因为 60 元是面值之和的最大值,所以期望不可能为60 元;如果选择(50,50,50,10)的方案,因为 60 元是面值之和的最小值,所以期望也不可能为60元,因此可能的方案是(10,10,50,50),记为方案 1;对于面值由 20 元和 40 元组成的情况,同理可排除(20,20,20,40)和(40,40,40,20)的方案,所以可能
21、的方案是(20,20,40,40),记为方案 2.以下是对两个方案的分析:对于方案 1,即方案(10,10,50,50),设顾客所获的奖励额为X1,则X1的分布列为:X12060100P162316X1 的期望为 E(X1)201660231001660,X1 的方差为 D(X1)(2060)216(6060)223(10060)21616003.对于方案 2,即方案(20,20,40,40),设顾客所获的奖励额为X2,则X2的分布列为:因为两种方案的奖励额的期望都符合要求,但方案 2 奖励额的方差比方案 1 的小,所以应该选择方案 2.X2406080P162316X2 的期望为 E(X2)
22、40166023801660,X2 的方差为 D(X2)(4060)216(6060)223(8060)2164003.【规律方法】本题主要考查相互独立事件及互斥事件概率的计算,考查分类讨论思想以及运用数学知识解决问题的能力.尤其是运用分类讨论思想解决离散型随机变量分布列问题的时候,可通过检查最后求出的分布列是否符合分布列的两个性质来检查分类讨论是否有所遗漏或重复.污水量230,250)250,270)270,290)290,310)310,330)330,350)频率0.30.440.150.10.0050.005【互动探究】4.十九大提出,加快水污染防治,建设美丽中国.根据环保部门对某河流
23、的每年污水排放量 X(单位:吨)的历史统计数据,得到如下频率分布表:将污水排放量落入各组的频率作为概率,并假设每年该河流的污水排放量相互独立.(1)求在未来 3 年里,至多 1 年污水排放量 X270,310)的概率;(2)该河流的污水排放对沿河的经济影响如下:当 X 230,270)时,没有影响;当 X270,310)时,经济损失为 10 万元;当 X310,350)时,经济损失为 60 万元.为减少损失,现有三种应对方案:方案一:防治 350 吨的污水排放,每年需要防治费 3.8 万元;方案二:防治 310 吨的污水排放,每年需要防治费 2 万元;方案三:不采取措施.试比较上述三种文案,哪
24、种方案好,并请说明理由.解:(1)由题意得 P(270X310)0.2514.设在未来 3 年里,河流的污水排放量 X270,310)的年数为 Y,则 YB3,14.设事件“在未来 3 年里,至多有一年污水排放量 X270,310)”为事件 A,则 P(A)P(Y0)P(Y1)C03343C13342142732.在未来 3 年里,至多 1 年污水排放量 X270,310)的概率为2732.(2)方案二好,理由如下:由题意得 P(230X270)0.74,P(310X350)0.01.用S1,S2,S3分别表示方案一、方案二、方案三的经济损失.则 S13.8 万元.S3 0 10 60 P0.740.250.01S2 2 62 P0.990.01S2 的分布列为:E(S2)20.99620.012.6(万元).S3 的分布列为:E(S3)00.74100.25600.013.1(万元).所以三种方案中方案二的平均损失最小,故采取方案二最好.