1、第五节离散型随机变量的分布列、均值与方差突破点一离散型随机变量的分布列1随机变量的有关概念(1)随机变量:随着试验结果变化而变化的变量,常用字母X,Y,表示(2)离散型随机变量:所有取值可以一一列出的随机变量2离散型随机变量分布列的概念及性质(1)概念:若离散型随机变量X可能取的不同值为x1,x2,xi,xn,X取每一个值xi(i1,2,n)的概率P(Xxi)pi,以表格的形式表示如下:Xx1x2xixnPp1p2pipn此表称为离散型随机变量X的概率分布列,简称为X的分布列有时也用等式P(Xxi)pi,i1,2,n表示X的分布列(2)分布列的性质:pi0,i1,2,3,n;i1.3常见的离散
2、型随机变量的分布列(1)两点分布X01P1pp若随机变量X的分布列具有上表的形式,则称X服从两点分布,并称pP(X1)为成功概率(2)超几何分布在含有M件次品的N件产品中,任取n件,其中恰有X件次品,则P(Xk),k0,1,2,m,其中mminM,n,且nN,MN,n,M,NN*.X01mP如果随机变量X的分布列具有上表的形式,则称随机变量X服从超几何分布一、判断题(对的打“”,错的打“”)(1)抛掷均匀硬币一次,出现正面的次数是随机变量()(2)离散型随机变量的分布列描述了由这个随机变量所刻画的随机现象()(3)某人射击时命中的概率为0.5,此人射击三次命中的次数X服从两点分布()(4)从4
3、名男演员和3名女演员中选出4名,其中女演员的人数X服从超几何分布()(5)离散型随机变量的分布列中,随机变量取各个值的概率之和可以小于1.()(6)离散型随机变量的各个可能值表示的事件是彼此互斥的()答案:(1)(2)(3)(4)(5)(6)二、填空题1设随机变量X的分布列如下:X12345Pp则p为_答案:2已知随机变量X的分布列为P(Xi)(i1,2,3)则P(X2)_.答案:3有一批产品共12件,其中次品3件,每次从中任取一件,在取到合格品之前取出的次品数X的所有可能取值是_答案:0,1,2,3考法一离散型随机变量分布列的性质例1(1)设随机变量X的概率分布列如下表所示:X012Pa若F
4、(x)P(Xx),则当x的取值范围是1,2)时,F(x)等于()A.B.C. D.(2)若随机变量X的分布列为X210123P0.10.20.20.30.10.1则当P(Xa)0.8时,实数a的取值范围是()A(,2 B1,2C(1,2 D(1,2)解析(1)由分布列的性质,得a1,所以a.而x1,2),所以F(x)P(Xx).(2)由随机变量X的分布列知:P(X1)0.1,P(X0)0.3,P(X1)0.5,P(X2)0.8,则当P(Xa)0.8时,实数a的取值范围是(1,2答案(1)D(2)C离散型随机变量分布列的性质的应用(1)利用“总概率之和为1”可以求相关参数的取值范围或值;(2)利
5、用“离散型随机变量在一范围内的概率等于它取这个范围内各个值的概率之和”求某些特定事件的概率;(3)可以根据性质判断所得分布列结果是否正确 考法二离散型随机变量的分布列求法例2(2019长春模拟)长春市的“名师云课”活动自开展以来获得广大家长和学生的高度赞誉,在推出的第二季名师云课中,数学学科共计推出36节云课,为了更好地将课程内容呈现给学生,现对某一时段云课的点击量进行统计:点击量0,1 000(1 000,3 000(3 000,)节数61812(1)现从36节云课中采用分层抽样的方式选出6节,求选出的点击量超过3 000的节数;(2)为了更好地搭建云课平台,现将云课进行剪辑,若点击量在区间
6、0,1 000内,则需要花费40分钟进行剪辑,若点击量在区间(1 000,3 000内,则需要花费20分钟进行剪辑,点击量超过3 000,则不需要剪辑,现从(1)中选出的6节课中随机取出2节课进行剪辑,求剪辑时间X的分布列解(1)根据分层抽样可知,选出的6节课中点击量超过3 000的节数为62.(2)由分层抽样可知,(1)中选出的6节课中点击量在区间0,1 000内的有1节,点击量在区间(1 000,3 000内的有3节,故X的可能取值为0,20,40,60.P(X0),P(X20),P(X40),P(X60),则X的分布列为X0204060P方法技巧求离散型随机变量分布列的步骤(1)找出随机
7、变量X的所有可能取值xi(i1,2,3,n);(2)求出各取值的概率P(Xxi)pi;(3)列成表格并用分布列的性质检验所求的分布列或某事件的概率是否正确考法三超几何分布例3在心理学研究中,常采用对比试验的方法评价不同心理暗示对人的影响,具体方法如下:将参加试验的志愿者随机分成两组,一组接受甲种心理暗示,另一组接受乙种心理暗示,通过对比这两组志愿者接受心理暗示后的结果来评价两种心理暗示的作用现有6名男志愿者A1,A2,A3,A4,A5,A6和4名女志愿者B1,B2,B3,B4,从中随机抽取5人接受甲种心理暗示,另5人接受乙种心理暗示(1)求接受甲种心理暗示的志愿者中包含A1但不包含B1的概率;
8、(2)用X表示接受乙种心理暗示的女志愿者人数,求X的分布列解(1)记接受甲种心理暗示的志愿者中包含A1但不包含B1的事件为M,则P(M.(2)由题意知X可取的值为0,1,2,3,4,则P(X0),P(X1),P(X2),P(X3),P(X4).因此X的分布列为X01234P方法技巧求超几何分布的分布列的步骤1.设X是一个离散型随机变量,其分布列为:X101P23qq2则q的值为()A1 B.C. D.解析:选C由分布列的性质知q.2.某项大型赛事,需要从高校选拔青年志愿者,某大学学生实践中心积极参与,从8名学生会干部(其中男生5名,女生3名)中选3名参加志愿者服务活动若所选3名学生中的女生人数
9、为X,求X的分布列解:因为8名学生会干部中有5名男生,3名女生,所以X的分布列服从参数N8,M3,n3的超几何分布X的所有可能取值为0,1,2,3,其中P(Xi)(i0,1,2,3),则P(X0),P(X1),P(X2),P(X3).所以X的分布列为X0123P3.有编号为1,2,3,n的n个学生,入坐编号为1,2,3,n的n个座位,每个学生规定坐一个座位,设学生所坐的座位号与该生的编号不同的学生人数为X,已知X2时,共有6种坐法(1)求n的值(2)求随机变量X的分布列解:(1)因为当X2时,有C种坐法,所以C6,即6,n2n120,解得n4或n3(舍去),所以n4.(2)因为学生所坐的座位号
10、与该生的编号不同的学生人数为X,由题意知X的可能取值是0,2,3,4,所以P(X0),P(X2),P(X3),P(X4)1,所以随机变量X的分布列为X0234P突破点二离散型随机变量的均值与方差1离散型随机变量的均值与方差若离散型随机变量X的分布列为Xx1x2xixnPp1p2pipn(1)称E(X)x1p1x2p2xipixnpn为随机变量X的均值或数学期望,它反映了离散型随机变量取值的平均水平(2)称D(X)(xiE(X)2pi为随机变量X的方差,它刻画了随机变量X与其均值E(X)的平均偏离程度,其算术平方根为随机变量X的标准差2均值与方差的性质(1)E(aXb)aE(X)b;(2)D(a
11、Xb)a2D(X)(a,b为常数)一、判断题(对的打“”,错的打“”)(1)期望是算术平均数概念的推广,与概率无关()(2)随机变量的方差和标准差都反映了随机变量取值偏离均值的平均程度,方差或标准差越小,则偏离均值的平均程度越小()(3)在篮球比赛中,罚球命中1次得1分,不中得0分如果某运动员罚球命中的概率为0.7,那么他罚球1次的得分X的均值是0.7.()答案:(1)(2)(3)二、填空题1已知随机变量X的分布列为P(Xk),k1,2,3,则E(3X5)_.答案:112一个正四面体ABCD的四个顶点上分别标有1分,2分,3分和4分,往地面抛掷一次记不在地面上的顶点的分数为X,则X的均值为_解
12、析:X的分布列为:X1234PE(X)1234.答案:3随机变量X的可能取值为0,1,2,若P(X0),E(X)1,则D(X)_.解析:设P(X1)p,P(X2)q,由题意得解得p,q,D(X)(01)2(11)2(21)2.答案:考法一离散型随机变量的均值与方差例1(2018天津高考)已知某单位甲、乙、丙三个部门的员工人数分别为24,16,16.现采用分层抽样的方法从中抽取7人,进行睡眠时间的调查(1)应从甲、乙、丙三个部门的员工中分别抽取多少人?(2)若抽出的7人中有4人睡眠不足,3人睡眠充足,现从这7人中随机抽取3人做进一步的身体检查用X表示抽取的3人中睡眠不足的员工人数,求随机变量X的
13、分布列与数学期望;设A为事件“抽取的3人中,既有睡眠充足的员工,也有睡眠不足的员工”,求事件A发生的概率解(1)由已知,甲、乙、丙三个部门的员工人数之比为322,由于采用分层抽样的方法从中抽取7人,因此应从甲、乙、丙三个部门的员工中分别抽取3人,2人,2人(2)随机变量X的所有可能取值为0,1,2,3.所以P(X0),P(X1),P(X2),P(X3),所以随机变量X的分布列为X0123P随机变量X的数学期望E(X)0123.设事件B为“抽取的3人中,睡眠充足的员工有1人,睡眠不足的员工有2人”;事件C为“抽取的3人中,睡眠充足的员工有2人,睡眠不足的员工有1人”,则ABC,且B与C互斥由知P
14、(B)P(X2),P(C)P(X1),故P(A)P(BC)P(X2)P(X1).所以事件A发生的概率为.求离散型随机变量均值与方差的关键及注意(1)求离散型随机变量的均值与方差关键是确定随机变量的所有可能值,写出随机变量的分布列,正确运用均值、方差公式进行计算(2)注意E(aXb)aE(X)b,D(aXb)a2D(X)的应用 考法二均值与方差在决策中的应用例2(2019开封模拟)某产品按行业生产标准分成8个等级,等级系数X依次为1,2,8,其中X5为标准A,X3为标准B,已知甲厂执行标准A生产该产品,产品的零售价为6元/件;乙厂执行标准B生产该产品,产品的零售价为4元/件假定甲、乙两厂的产品都
15、符合相应的执行标准(1)已知甲厂产品的等级系数X1的概率分布列如下表所示:X15678P0.4ab0.1且X1的数学期望EX16,求a,b的值;(2)为分析乙厂产品的等级系数X2,从该厂生产的产品中随机抽取30件,相应的等级系数组成一个样本,数据如下:用这个样本的频率分布估计总体分布,将频率视为概率,求等级系数X2的数学期望;(3)在(1),(2)的条件下,若以“性价比”为判断标准,则哪个工厂的产品更具可购买性?说明理由注:产品的“性价比”产品的等级系数的数学期望/产品的零售价;“性价比”大的产品更具可购买性解(1)EX16,50.46a7b80.16,即6a7b3.2,又0.4ab0.11,
16、即ab0.5,由得(2)由已知,用这个样本的频率分布估计总体分布,将频率视为概率,可得等级系数X2的概率分布列如下:X2345678P0.30.20.20.10.10.1EX230.340.250.260.170.180.14.8,即乙厂产品的等级系数X2的数学期望等于4.8.(3)乙厂的产品更具可购买性,理由如下:甲厂产品的等级系数的数学期望等于6,价格为6元/件,其性价比为1,乙厂产品的等级系数的数学期望等于4.8,价格为4元/件其性价比为1.2,又1.21,乙厂的产品更具可购买性利用均值、方差进行决策的2个方略(1)当均值不同时,两个随机变量取值的水平可见分歧,可对问题作出判断(2)若两
17、随机变量均值相同或相差不大,则可通过分析两变量的方差来研究随机变量的离散程度或者稳定程度,进而进行决策 1.随着网络营销和电子商务的兴起,人们的购物方式更具多样化某调查机构随机抽取10名购物者进行采访,5名男性购物者中有3名倾向于选择网购,2名倾向于选择实体店,5名女性购物者中有2名倾向于选择网购,3名倾向于选择实体店(1)若从10名购物者中随机抽取2名,其中男、女各一名,求至少1名倾向于选择实体店的概率;(2)若从这10名购物者中随机抽取3名,设X表示抽到倾向于选择网购的男性购物者的人数,求X的分布列和数学期望解:(1)设“随机抽取2名,其中男、女各一名,至少1名倾向于选择实体店”为事件A,
18、则表示事件“随机抽取2名,其中男、女各一名,都倾向于选择网购”,则P(A)1P()1.(2)X所有可能的取值为0,1,2,3,且P(Xk),则P(X0),P(X1),P(X2),P(X3).所以X的分布列为:X0123PE(X)0123.2.张老师开车上班,有路线与路线两条路线可供选择路线:沿途有A,B两处独立运行的交通信号灯,且两处遇到绿灯的概率依次为,若A处遇红灯或黄灯,则导致延误时间2分钟;若B处遇红灯或黄灯,则导致延误时间3分钟;若两处都遇绿灯,则全程所花时间为20分钟路线:沿途有a,b两处独立运行的交通信号灯,且两处遇到绿灯的概率依次为,若a处遇红灯或黄灯,则导致延误时间8分钟;若b
19、处遇红灯或黄灯,则导致延误时间5分钟;若两处都遇绿灯,则全程所花时间为15分钟(1)若张老师选择路线,求他20分钟能到校的概率;(2)为使张老师日常上班途中所花时间较少,你建议张老师选择哪条路线?并说明理由解:(1)走路线,20分钟能到校意味着张老师在A,B两处均遇到绿灯,记该事件发生的概率为P,则P.(2)设选择路线的延误时间为随机变量,则的所有可能取值为0,2,3,5.则P(0),P(2),P(3),P(5).的数学期望E()02352.设选择路线的延误时间为随机变量,则的所有可能取值为0,8,5,13.则P(0),P(8),P(5),P(13).的数学期望E()085135.因此选择路线
20、平均所花时间为20222分钟,选择路线平均所花时间为15520分钟,所以为使张老师日常上班途中所花时间较少,建议张老师选择路线.突破点三均值、方差与统计案例的综合问题典例(2019湖南湘东五校联考)已知具有相关关系的两个变量x,y之间的几组数据如下表所示:x246810y3671012(1)请根据上表数据绘制散点图;(2)请根据上表提供的数据,求出y关于x的线性回归方程x,并估计当x20时y的值;(3)将表格中的数据看作5个点的坐标,则从这5个点中随机抽取3个点,记落在直线2xy40右下方的点的个数为,求的分布列及数学期望参考公式:,.解(1)散点图如图所示(2)依题意得,(246810)6,
21、(3671012)7.6,4163664100220,iyi6244280120272,1.1,所以7.61.161,所以线性回归方程为1.1x1,故当x20时,23.(3)可以判断,落在直线2xy40右下方的点的坐标满足2xy40,所以符合条件的点的坐标为(6,7),(8,10),(10,12),故的所有可能取值为1,2,3.P(1),P(2),P(3),故的分布列为123PE()123.方法技巧解决此类问题的关键是读懂题意,从已知条件给出的图表中准确获取数据信息, 再根据相关公式正确计算并分析得出结论针对训练社会公众人物的言行在一定程序上影响着年轻人的人生观、价值观某媒体机构为了了解大学生
22、对影星、歌星以及著名主持人方面的新闻(简称“星闻”)的关注情况,随机调查了某大学的200位大学生,得到信息如下表:男大学生女大学生不关注“星闻”8040关注“星闻”4040(1)从所抽取的200人内关注“星闻”的大学生中,再抽取3人做进一步调查,求这3人性别不全相同的概率;(2)是否有95%以上的把握认为关注“星闻”与性别有关?并说明理由;(3)把以上的频率视为概率,若从该大学被调查的男大学生中随机抽取4人,设这4人中关注“星闻”的人数为,求的分布列及数学期望附:K2,nabcd.P(K2k0)0.0500.0100.001k03.8416.63510.828解:(1)由已知得,所求概率P1.(2)由于K2的观测值k5.5563.841,故有95%以上的把握认为关注“星闻”与性别有关(3)由题意可得,从被调查的男大学生中抽取一位关注“星闻”的男大学生的概率为,不关注“星闻”的概率为.的所有可能取值为0,1,2,3,4.P(0)4;P(1)C3;P(2)C22;P(3)C3;P(4)4.所以的分布列为01234P因为B,所以E().