1、第六节离散型随机变量的均值与方差、正态分布考纲传真1.理解取有限个值的离散型随机变量的均值、方差的概念.2.会求简单离散型随机变量的均值、方差,并能利用离散型随机变量的均值、方差概念解决一些简单实际问题.3.借助直观直方图认识正态分布曲线的特点及曲线所表示的意义1离散型随机变量的分布列、均值与方差一般地,若离散型随机变量X的分布列为Xx1x2xixnPp1p2pipn(1)均值:称E(X)x1p1x2p2xipixnpn为随机变量X的均值或数学期望,它反映了离散型随机变量取值的平均水平(2)方差:称D(X)xiE(X)2pi为随机变量X的方差,它刻画了随机变量X与其均值E(X)的平均偏离程度,
2、其算术平方根为随机变量X的标准差2均值与方差的性质(1)E(aXb)aE(X)b.(2)D(aXb)a2D(X)(a,b为常数)3两点分布与二项分布的均值、方差均值方差变量X服从两点分布E(X)pD(X)p(1p)XB(n,p)E(X)npD(X)np(1p)4.正态分布(1)正态曲线的特点:曲线位于x轴上方,与x轴不相交;曲线是单峰的,它关于直线x对称;曲线在x处达到峰值;曲线与x轴之间的面积为1;当一定时,曲线的位置由确定,曲线随着的变化而沿x轴平移;当一定时,曲线的形状由确定,越小,曲线越“瘦高”,表示总体的分布越集中;越大,曲线越“矮胖”,表示总体的分布越分散(2)正态分布的三个常用数
3、据P(X)0.682_6;P(2X2)0.954_4;P(3X3)0.997_4.常用结论1均值与方差的关系:D(X)E(X2)E2(X)2超几何分布的均值:若X服从参数为N,M,n的超几何分布,则E(X).基础自测1(思考辨析)判断下列结论的正误(正确的打“”,错误的打“”)(1)离散型随机变量的各个可能值表示的事件是彼此互斥的()(2)若XN(,2),则,2分别表示正态分布的均值和方差()(3)随机变量的均值是常数,样本的平均值是随机变量()(4)随机变量的方差和标准差都反映了随机变量取值偏离均值的平均程度,方差或标准差越小,则偏离均值的平均程度越小. ()答案(1)(2)(3)(4)2(
4、教材改编)已知X的分布列为X101Pa设Y2X3,则E(Y)的值为()A.B4C1D1A由概率分布列的性质可知:a1,a.E(X)(1)01.E(Y)32E(X)3.3已知随机变量X8,若XB(10,0.6),则随机变量的均值E()及方差D()分别是()A6和2.4 B2和2.4C2和5.6 D6和5.6B设随机变量X的均值及方差分别为E(X),D(X),因为XB(10,0.6),所以E(X)100.66,D(X)100.6(10.6)2.4,故E()E(8X)8E(X)2,D()D(8X)D(X)2.4,故选B.4已知随机变量服从正态分布N(2,2),且P(4)0.8,则P(04)_.06由
5、P(4)0.8,得P(4)0.2.又正态曲线关于x2对称则P(0)P(4)0.2,P(04)1P(0)P(4)0.6.5随机变量X的分布列为P(Xk),k1,2,3,C为常数,则P(0.5X2.5)_.由P(X1)P(X2)P(X3)1,得1,解得C.所以P(0.5X2.5)P(X1)P(X2).求离散型随机变量的均值、方差【例1】(1)(2017全国卷改编)一批产品的二等品率为0.02,从这批产品中每次随机取一件,有放回地抽取100次,X表示抽到的二等品件数,则D(X)()A1.96B1.98C2D2.02(2)甲、乙两人轮流投篮,每人每次投一球约定甲先投且先投中者获胜,一直到有人获胜或每人
6、都投球3次时投篮结束设甲每次投篮投中的概率为,乙每次投篮投中的概率为,且各次投篮互不影响求甲获胜的概率;求投篮结束时甲的投球次数的分布列与期望(1)A依题意,XB(100,0.02),所以D(X)1000.02(10.02)1.96.(2)解设Ak,Bk分别表示“甲、乙在第k次投篮投中”,则P(Ak),P(Bk),其中k1,2,3.记“甲获胜”为事件C,由互斥事件与相互独立事件的概率计算公式知P(C)P(A1)P(A2)P(A3)P(A1)P()P()P(A2)P()P()P()P()P(A3)22.的所有可能取值为1,2,3,且P(1)P(A1)P(B1),P(2)P(A2)P(B2)22,
7、P(3)P()22.综上知,的分布列为123P所以E()123.规律方法求离散型随机变量X的均值与方差的步骤(1)理解X的意义,写出X可能取的全部值.(2)求X取每个值时的概率.(3)写出X的分布列.(4)由均值的定义求E(X).(5)由方差的定义求D(X). 设袋子中装有a个红球,b个黄球,c个蓝球,且规定:取出一个红球得1分,取出一个黄球得2分,取出一个蓝球得3分(1)当a3,b2,c1时,从该袋子中任取(有放回,且每球取到的机会均等)2个球,记随机变量为取出此2球所得分数之和,求的分布列;(2)从该袋子中任取(每球取到的机会均等)1个球,记随机变量为取出此球所得分数若E(),D(),求a
8、bc.解(1)由题意得2,3,4,5,6,故P(2),P(3),P(4),P(5),P(6).所以的分布列为23456P(2)由题意知的分布列为123P所以E(),D()222,化简得解得a3c,b2c,故abc321.均值与方差在决策中的应用【例2】根据某水文观测点的历史统计数据,得到某河流每年最高水位X(单位:米)的频率分布直方图如图:将河流最高水位落入各组的频率视为概率,并假设每年河流最高水位相互独立(1)求在未来三年里,至多有一年河流最高水位X27,31)的概率(结果用分数表示);(2)该河流对沿河A企业影响如下:当X23,27)时,不会造成影响;当X27,31)时,损失10 000元
9、;当X31,35时,损失60 000元为减少损失,现有三种应对方案:方案一:防御35米的最高水位,每年需要工程费用3 800元;方案二:防御31米的最高水位,每年需要工程费用2 000元;方案三:不采取措施试比较上述三种方案,哪种方案好,并请说明理由解(1)由题意得P(27X31)0.25.设在未来3年里,河流最高水位x27,31)发生的年数为Y,则YN.设事件“在未来三年里,至多有一年河流最高水位X27,31)”为事件A,则P(A)P(Y0)P(Y1)C3C2.所以在未来三年里,至多有一年河流最高水位X27,31)的概率为.(2)方案二好,理由如下:由题意得P(23X27)0.74,P(31
10、X35)0.01,用X1,X2,X3分别表示方案一、方案二、方案三的损失,由题意得X13 800,X2的分布列为X22 00062 000P0.990.01所以E(X2)62 0000.012 0000.992 600.X3的分布列为X3010 00060 000P0.740.250.01所以E(X3)00.7460 0000.0110 0000.253 100.因为三种方案中方案二的平均损失最小,所以采取方案二好规律方法利用均值、方差进行决策的两个方略(1)当均值不同时,两个随机变量取值的水平可见分歧,可对问题作出判断.(2)若两随机变量均值相同或相差不大,则可通过分析两变量的方差来研究随机
11、变量的离散程度或者稳定程度,进而进行决策. 某供货商计划将某种大型节日商品分别配送到甲、乙两地销售,据以往数据统计,甲、乙两地该商品需求量(单位:件)的频率分布表如下:甲地需求量频率分布表需求量/件456频率0.50.30.2乙地需求量频率分布表需求量/件345频率0.60.30.1以两地需求量的频率估计需求量的概率(1)若此供货商计划将10件该商品全部配送至甲、乙两地,为保证两地不缺货(配送量需求量)的概率均大于0.7,问该商品的配送方案有哪几种?(2)已知甲、乙两地该商品的销售相互独立,该商品售出,供货商获利2万元/件;未售出的,供货商亏损1万元/件在(1)的前提下,若仅考虑此供货商所获净
12、利润,试确定最佳配送方案解(1)由表格可知,甲地不缺货的概率大于0.7时,至少需配货5件;乙地不缺货的概率大于0.7时,至少需配货4件故共有两种方案:方案一是甲地配5件,乙地配5件;方案二是甲地配6件,乙地配4件(2)方案一:甲地配5件,乙地配5件时,记甲地的利润为X1万元,乙地的利润为Y1万元,则X1,Y1的分布列分别为X1710P0.50.5Y14710P0.60.30.1所以选择方案一时,此供货商净利润的期望为E(X1)E(Y1)(70.5100.5)(40.670.3100.1)8.55.514(万元)方案二:甲地配6件,乙地配4件时,记甲地的利润为X2万元,乙地的利润为Y2万元,则X
13、2,Y2的分布列分别为X26912P0.50.30.2Y258P0.60.4所以选择方案二时,此供货商净利润的期望为E(X2)E(Y2)(60.590.3120.2)(50.680.4)8.16.214.3(万元)综上,仅考虑此供货商所获净利润,选择方案二更佳正态分布【例3】(2017全国卷)为了监控某种零件的一条生产线的生产过程,检验员每天从该生产线上随机抽取16个零件,并测量其尺寸(单位:cm)根据长期生产经验,可以认为这条生产线正常状态下生产的零件的尺寸服从正态分布N(,2)(1)假设生产状态正常,记X表示一天内抽取的16个零件中其尺寸在(3,3)之外的零件数,求P(X1)及X的数学期望
14、;(2)一天内抽检零件中,如果出现了尺寸在(3,3)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查试说明上述监控生产过程方法的合理性;下面是检验员在一天内抽取的16个零件的尺寸:9.9510.129.969.9610.019.929.9810.0410.269.9110.1310.029.2210.0410.059.95经计算得xi9.97,s)0.212,其中xi为抽取的第i个零件的尺寸,i1,2,16.用样本平均数作为的估计值,用样本标准差s作为的估计值,利用估计值判断是否需对当天的生产过程进行检查?剔除(3,3)之外的数据,用剩下的数据估计和
15、(精确到0.01)附:若随机变量Z服从正态分布N(,2),则P(3Z3)0.997 4,0.997 4160.959 2,0.09.解(1)抽取的一个零件的尺寸在(3,3)之内的概率为0.997 4,从而零件的尺寸在(3,3)之外的概率为0.002 6,故XB(16,0.002 6)因此P(X1)1P(X0)10.997 4160.040 8.X的数学期望E(X)160.002 60.041 6.(2)如果生产状态正常,一个零件尺寸在(3,3)之外的概率只有0.002 6,一天内抽取的16个零件中,出现尺寸在(3,3)之外的零件的概率只有0.040 8,发生的概率很小,因此一旦发生这种情况,就
16、有理由认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查,可见上述监控生产过程的方法是合理的由9.97,s0.212,得的估计值为9.97,的估计值为0.212,由样本数据可以看出有一个零件的尺寸在(3,3)之外,因此需对当天的生产过程进行检查剔除(3,3)之外的数据9.22,剩下数据的平均数为(169.979.22)10.02.因此的估计值为10.02.x160.2122169.9721 591.134,剔除(3,3)之外的数据9.22,剩下数据的样本方差为(1 591.1349.2221510.022)0.008,因此的估计值为0.09.规律方法正态分布下的概率
17、计算常见的两类问题(1)利用正态分布密度曲线的对称性研究相关概率问题,涉及的知识主要是正态曲线关于直线x对称,及曲线与x轴之间的面积为1的性质.(2)利用3原则求概率问题时,要注意把给出的区间或范围与正态变量的,进行对比联系,确定它们属于(,),(2,2),(3,3)中的哪一个.(1)在如图所示的正方形中随机投掷10 000个点,则落入阴影部分(曲线C为正态分布N(1,1)的密度曲线)的点的个数的估计值为()附:若XN(,2),则P(X)0.682 6,P(2X2)0.954 4.A1 193 B1 359C2 718 D3 413(2)甲、乙两厂生产的一批零件尺寸服从N(5,0.12),如果
18、零件尺寸在(3,3)以外,我们就有理由认为生产中可能出现了异常情况现从甲、乙两厂各抽取10件零件检测,尺寸如茎叶图所示:则以下判断正确的是()A甲、乙两厂生产都出现异常B甲、乙两厂生产都正常C甲厂生产正常,乙厂出现异常D甲厂生产出现异常,乙厂正常(1)B(2)D(1)对于正态分布N(1,1),1,1,正态曲线关于x1对称,故题图中阴影部分的面积为P(3X1)P(2X0)P(2X2)P(X)(0.954 40.682 6)0.135 9,所以点落入题图中阴影部分的概率P0.135 9,投入10 000个点,落入阴影部分的个数约为10 0000.135 91 359.(2)由甲、乙两厂生产的一批零
19、件尺寸服从N(5,0.12),得5,0.1,区间(3,3),即区间(4.7,5.3),根据茎叶图可知,甲厂生产的零件有1件尺寸超出上述区间,乙厂生产的零件尺寸均在上述区间,所以甲厂生产出现异常、乙厂生产正常故选D.(2018全国卷)某工厂的某种产品成箱包装,每箱200件,每一箱产品在交付用户之前要对产品作检验,如检验出不合格品,则更换为合格品检验时,先从这箱产品中任取20件作检验,再根据检验结果决定是否对余下的所有产品作检验设每件产品为不合格品的概率都为p(0p1),且各件产品是否为不合格品相互独立(1)记20件产品中恰有2件不合格品的概率为f(p),求f(p)的最大值点p0.(2)现对一箱产
20、品检验了20件,结果恰有2件不合格品,以(1)中确定的p0作为p的值已知每件产品的检验费用为2元,若有不合格品进入用户手中,则工厂要对每件不合格品支付25元的赔偿费用若不对该箱余下的产品作检验,这一箱产品的检验费用与赔偿费用的和记为X,求E(X);以检验费用与赔偿费用和的期望值为决策依据,是否该对这箱余下的所有产品作检验?解(1)20件产品中恰有2件不合格品的概率为f(p)Cp2(1p)18.因此f(p)C2p(1p)1818p2(1p)172Cp(1p)17(110p)令f(p)0,得p0.1.当p(0,0.1)时,f(p)0;当p(0.1,1)时,f(p)0.所以f(p)的最大值点为p00.1.(2)由(1)知,p0.1.令Y表示余下的180件产品中的不合格品件数,依题意知YB(180,0.1),X20225Y,即X4025Y.所以E(X)E(4025Y)4025E(Y)490.如果对余下的产品作检验,则这一箱产品所需要的检验费为400元由于E(X)400,故应该对余下的产品作检验