1、第9讲离散型随机变量的均值、方差和正态分布1离散型随机变量的均值与方差(1)若离散型随机变量X的分布列为Xx1x2xixnPp1p2pipn均值称E(X)x1p1x2p2xipixnpn为随机变量X的均值或数学期望,它反映了离散型随机变量取值的平均水平方差称D(X)(xiE(X)2pi为随机变量X的方差,它刻画了随机变量X与其均值E(X)的平均偏离程度,其算术平方根为随机变量X的标准差(2)均值与方差的性质E(aXb)aE(X)b.D(aXb)a2D(X)(a,b为常数)E(k)k(k为常数)E(X1X2)E(X1)E(X2)D(X)E(X2)(E(X)2.若X1,X2相互独立,则E(X1X2
2、)E(X1)E(X2)D(k)0(k为常数)若给定一组数据x1,x2,xn,其方差为s2,则ax1,ax2,axn的方差为a2s2.若给定一组数据x1,x2,xn,其方差为s2,则ax1b,ax2b,axnb的方差为a2s2,特别地,当a1时,有x1b,x2b,xnb的方差为s2,这说明将一组数据的每一个数据都加上一个相同的常数,方差是不变的,即不影响数据的波动性两点分布与二项分布的均值、方差均值方差变量X服从两点分布E(X)pD(X)p(1p)XB(n,p)E(X)npD(X)np(1p)2正态分布(1)正态曲线的性质曲线位于x轴上方,与x轴不相交;曲线是单峰的,它关于直线x对称;曲线在x处
3、达到峰值;曲线与x轴之间的面积为1;当一定时,曲线的位置由确定,曲线随着的变化而沿x轴平移,如图甲所示;当一定时,曲线的形状由确定,越小,曲线越“瘦高”,表示总体的分布越集中;越大,曲线越“矮胖”,表示总体的分布越分散,如图乙所示(2)正态分布的三个常用数据P(X)0.6826;P(2X2)0.9544;P(3X3)0.9974.1E(X)是一个实数,由X的分布列唯一确定随机变量X是可变的,可取不同的值,而E(X)是不变的,它描述X取值的平均状态2变量的方差与标准差都反映了随机变量取值的稳定与波动、集中与离散的程度,其中标准差与随机变量本身具有相同的单位3方差也是一个常数,它不具有随机性,方差
4、的值一定是非负的1已知随机变量服从正态分布N(,2),若P(6)0.1,则P(24)为()A0.7B0.5C0.4D0.35答案C解析由P(6)0.1,可得4,且P(24)(10.12)0.4.2(2021浙江台州模拟)随机变量的分布列如下表,且E()1.1,则D()()01xPpA0.36 B.0.52C0.49 D.0.68答案C解析先由随机变量分布列的性质求得p.由E()01x1.1,得x2.所以D()(01.1)2(11.1)2(21.1)20.49.3设整数m是从不等式x22x80的整数解的集合S中随机抽取的一个元素,记随机变量m2,则的数学期望E()()A1B5C2D答案B解析由x
5、22x80,得2x4,S2,1,0,1,2,3,4,m2,可取的值分别为0,1,4,9,16,相应的概率分别为,的数学期望E()0149165.故选B.4(2022山西大同模拟)已知袋中有3个白球、2个红球,现从中随机取出3个球,其中取出1个白球计1分,取出1个红球计2分,记X为取出3个球的总分值,则E(X)()A.BC4D答案B解析由题意,知X的所有可能取值为3,4,5,且P(X3),P(X4),P(X5),所以E(X)345.5某次考试共有12个选择题,每个选择题的分值为5分,每个选择题四个选项且只有一个选项是正确的,A学生对12个选择题中每个题的四个选项都没有把握,最后选择题的得分为X分
6、,B学生对12个选择题中每个题的四个选项都能判断其中有一个选项是错误的,对其他三个选项都没有把握,选择题的得分为Y分,则D(Y)D(X)的值为()A.BCD答案A解析设A学生答对题的个数为m,则得分X5m(分),mB,D(m)12,所以D(X)25,同理设B学生答对题的个数为n,可知nB,D(n)12,所以D(Y)25,所以D(Y)D(X).故选A.6(2020浙江高考)一个盒子里有1个红1个绿2个黄四个相同的球,每次拿一个,不放回,拿出红球即停,设拿出黄球的个数为,则P(0)_;E()_.答案1解析因为0对应事件为第一次拿红球或第一次拿绿球,第二次拿红球,所以P(0).随机变量的所有可能取值
7、为0,1,2,P(1),P(2)1,所以E()0121.精准设计考向,多角度探究突破考向一离散型随机变量的均值与方差角度与古典概型有关的均值与方差例1盒中共有9个球,其中有4个红球、3个黄球和2个绿球,这些球除颜色外完全相同(1)从盒中一次随机取出2个球,求取出的2个球颜色相同的概率P;(2)从盒中一次随机取出4个球,其中红球、黄球、绿球的个数分别记为x1,x2,x3,随机变量X表示x1,x2,x3中的最大数,求X的数学期望E(X)与方差D(X)解(1)取到2个颜色相同的球可能是2个红球、2个黄球或2个绿球,所以P.(2)随机变量X的所有可能取值为2,3,4,X4表示的随机事件是“取到的4个球
8、是4个红球”,故P(X4);X3表示的随机事件是“取到的4个球是3个红球和1个其他颜色的球,或3个黄球和1个其他颜色的球”,故P(X3);于是P(X2)1P(X3)P(X4)1.因此随机变量X的数学期望E(X)234,方差D(X)222.求离散型随机变量的均值与方差关键是确定随机变量的所有可能值,写出随机变量的分布列,正确运用均值、方差公式进行计算1.在甲、乙等6个单位参加的一次“唱读讲传”演出活动中,每个单位的节目集中安排在一起,若采用抽签的方式随机确定各单位的演出顺序(序号为1,2,6),求:(1)甲、乙两单位的演出序号至少有一个为奇数的概率;(2)甲、乙两单位之间的演出单位个数的均值与方
9、差解(1)设事件A表示“甲、乙两单位的演出序号至少有一个为奇数”,则事件表示“甲、乙两单位的演出序号均为偶数”,由等可能性事件的概率计算公式得P(A)1P()11.(2)的所有可能取值为0,1,2,3,4,且P(0),P(1),P(2),P(3),P(4).所以E()01234,D()22222.角度与二项分布有关的期望与方差例2(2021安徽芜湖模拟)设甲、乙两位同学上学期间,每天7:30之前到校的概率均为.假定甲、乙两位同学到校情况互不影响,且任一同学每天到校情况相互独立(1)用X表示甲同学上学期间的三天中7:30之前到校的天数,求随机变量X的数学期望与方差;(2)设M为事件“上学期间的三
10、天中,甲同学在7:30之前到校的天数比乙同学在7:30之前到校的天数恰好多2”,求事件M发生的概率解(1)因为甲同学上学期间的三天中到校情况相互独立,且每天7:30之前到校的概率为,故XB,从而随机变量X的数学期望E(X)32,方差D(X)3.(2)设乙同学上学期间的三天中7:30之前到校的天数为Y,则YB,且MX3,Y1X2,Y0由题意,知事件X3,Y1与X2,Y0互斥,且事件X3与Y1,事件X2与Y0均相互独立,可得P(M)P(X3,Y1X2,Y0)P(X3,Y1)P(X2,Y0)P(X3)P(Y1)P(X2)P(Y0).求随机变量X的均值与方差时,可首先分析X是否服从二项分布,如果XB(
11、n,p),则用公式E(X)np,D(X)np(1p)求解,可大大减少计算量2.张先生家住H小区,他在C科技园区工作,从家开车到公司上班路上有L1,L2两条路线(如图),L1路线上有A1,A2,A3三个路口,各路口遇到红灯的概率均为;L2路线上有B1,B2两个路口,各路口遇到红灯的概率依次为,.(1)若走L1路线,求最多遇到1次红灯的概率;(2)若走L2路线,求遇到红灯次数X的数学期望与方差;(3)按照“平均遇到红灯次数最少”的要求,请你帮助张先生从上述两条路线中选择一条最好的上班路线,并说明理由解(1)设走L1路线最多遇到1次红灯为A事件,则P(A)C3C2.所以走L1路线,最多遇到1次红灯的
12、概率为.(2)依题意,X的可能取值为0,1,2.P(X0),P(X1),P(X2).随机变量X的分布列为X012P故E(X)012,D(X)222.(3)设选择L1路线遇到红灯次数为Y,随机变量Y服从二项分布,即YB,所以E(Y)3.因为E(X)2知,方案2投资较少考向三正态分布例4(1)设随机变量服从正态分布N(3,4),若P(a2),则a的值为()A5B3CD答案D解析因为服从正态分布N(3,4),P(a2),所以x2a3与xa2关于x3对称,所以3,即3a7,解得a.故选D.(2)(2021安徽蚌埠模拟)我市高三年级第二次质量检测的数学成绩X近似服从正态分布N(82,2),且P(74X8
13、2)0.42.已知我市某校有800人参加此次考试,据此估计该校数学成绩不低于90分的人数为_答案64解析因为数学成绩X近似服从正态分布N(82,2),所以数学成绩X关于X82对称,因为P(74X82)0.42,所以P(82X90)0.42.P(X90)P(X74)0.08,所以我市某校有800人参加此次考试,据此估计该校数学成绩不低于90分的人数为0.0880064.正态分布下的概率计算常见的两类问题(1)利用正态分布密度曲线的对称性研究相关概率问题,涉及的知识主要是正态曲线关于直线x对称,及曲线与x轴之间的面积为1的性质(2)利用3原则求概率问题时,要注意把给出的区间或范围与正态变量的,进行
14、对比联系,确定它们属于(,(2,2,(3,3中的哪一个4.若随机变量服从正态分布N(0,1),已知P(1.96)0.025,则P(|1.96)()A0.025B0.050C0.950D0.975答案C解析由随机变量服从正态分布N(0,1),得P(1.96)1P(1.96),所以P(|1.96)P(1.961.96)P(1.96)P(1.96)12P(1.96)120.0250.950.5设XN(1,1),其正态分布密度曲线如图所示,那么向正方形ABCD中随机投掷10000个点,则落入阴影部分的点的个数的估计值是()注:若XN(,2),P(X)0.6826,P(2X2)0.9544.A7539B
15、6038C7028D6587答案D解析XN(1,1),1,1,P(X)0.6826,P(0X2)0.6826,则P(1X2)0.3413,阴影部分的面积为10.34130.6587.向正方形ABCD中随机投掷10000个点,落入阴影部分的点的个数的估计值是100006587.故选D.自主培优(二十一) 正态分布与概率、统计的综合题(2021河南濮阳模拟)近年来“双十一”已成为中国电子商务行业的年度盛事,并且逐渐影响到国际电子商务行业某商家为了准备2021年“双十一”的广告策略,随机调查了1000名客户在2020年“双十一”前后10天内网购所花时间T(单位:时),并将调查结果绘制成如图所示的频率
16、分布直方图由频率分布直方图可以认为,这10天网购所花的时间T近似服从N(,2),其中用样本平均值代替,20.24.(1)计算,并利用该正态分布求P(1.51T2.49);(2)利用由样本统计获得的正态分布估计整体,将这10天网购所花时间在(2,2.98小时内的人定义为目标客户,对目标客户发送广告提醒现若随机抽取10000名客户,记X为这10000人中目标客户的人数()求E(X);()问:10000人中目标客户的人数X为何值的概率最大?附:若随机变量Z服从正态分布N(,2),则P(Z)0.6826,P(2Z2)0.9544,P(3Z3)0.9974,0.49.解(1)0.4(0.0500.80.
17、2251.20.5501.60.8252.00.6002.40.2002.80.0503.2)2,从而T服从N(2,0.24),又0.49,从而P(1.51T2.49)P(T)0.6826.(2)()任意抽取1名客户,该客户是目标客户的概率为P(2T2.98)P(T2)P(2T2)0.95440.4772.由题意知X服从B(10000,0.4772),所以E(X)100000.47724772.()X服从B(10000,0.4772),P(Xk)C0.4772k(10.4772)10000kC0.4772k0.522810000k(k0,1,2,10000)设当Xk(k1,kN)时概率最大,则
18、有得解得k4772.故10000人中目标客户的人数为4772的概率最大答题启示本题考查正态分布、概率统计问题的综合,是在知识网络的交汇处命制的一道较为新颖的试题正态分布与统计案例有些知识点是所谓的高考“冷点”,由于考生对这些“冷点”的内容重视不够,复习不全面,一旦这些“冷点”知识出了考题,虽然简单但也做错,甚至根本不会做,因而错误率相当高此题告诉我们必须全面掌握每一个知识点对点训练“爱国,是人世间最深层、最持久的情感,是一个人的立德之源、立功之本”在中华民族几千年绵延发展的历史长河中,爱国主义始终是激昂的主旋律爱国汽车公司拟对“东方红”款高端汽车发动机进行科技改造,根据市场调研与模拟,得到科技
19、改造投入x(亿元)与科技改造直接收益y(亿元)的数据统计如下:x2346810132122232425y1322314250565868.56867.56666当017时,y与x满足的线性回归方程为0.7x.(1)根据下列表格中的数据,比较当0x17时模型,的相关指数R2,并选择拟合精度更高、更可靠的模型预测对“东方红”款汽车发动机科技改造的投入为17亿元时的直接收益;回归模型模型模型回归方程4.1x11.821.314.4(yii)2182.479.2(2)为鼓励科技创新,当科技改造的投入不少于20亿元时,国家给予公司补贴收益10亿元,以回归方程为预测依据,比较科技改造投入17亿元与20亿元
20、时公司实际收益的大小;(3)科技改造后,“东方红”款汽车发动机的热效率X大幅提高,X服从正态分布N(0.52,0.012),公司对科技改造团队的奖励方案如下:若发动机的热效率不超过50%,不予奖励;若发动机的热效率超过50%但不超过53%,每台发动机奖励2万元;若发动机的热效率超过53%,每台发动机奖励5万元求每台发动机获得奖励的数学期望附:刻画回归效果的相关指数R21,4.1.用最小二乘法求线性回归方程x的系数公式, .随机变量服从正态分布N(,2),则P()0.6826,P(279.2,即,所以模型的R2小于模型,说明回归模型刻画的拟合效果更好所以当x17亿元时,科技改造直接收益的预测值为
21、21.314.421.34.114.472.93(亿元)(2)由已知,得203,所以23,607.2,则67.2.所以 0.767.20.72383.3,即当x17亿元时,y与x满足的线性回归方程为 0.7x83.3.所以当x20亿元时,科技改造直接收益的预测值 0.72083.369.3.当x20亿元时,实际收益的预测值为69.31079.3亿元72.93亿元,即科技改造投入20亿元时,公司的实际收益更大(3)因为P(0.520.020.50)0.9772,P(X0.50)0.0228,又P(0.520.010.53)0.1587,则P(0.50X0.53)0.97720.15870.818
22、5.设每台发动机获得的奖励为Y(万元),则Y的分布列为Y025P0.02280.81850.1587则每台发动机获得奖励的数学期望为E(Y)00.022820.818550.15872.4305(万元).1已知的分布列101P则下列各式:E();D();P(0)中,正确的个数是()A0B1C2D3答案C解析E()(1)1,故正确D()222,故不正确由分布列知正确2已知随机变量,且N(,2),若P(31)P(35),则()A4B2C1D0答案C解析依题意,P(31)P(3P(X6),则期望E(X)()A4 B.5 C.6 D.7答案A解析因为D(X)np(1p)10p(1p)2.4,所以p0.
23、4或0.6,又P(X4)P(X6),则C(1p)6p4C(1p)4p6,解得pE(X)18A,B两个投资项目的利润率分别为随机变量X1和X2,根据市场分析,X1和X2的分布列分别如下表:X15%10%P0.80.2X22%8%12%P0.20.50.3(1)在A,B两个投资项目上各投资100万元,Y1和Y2分别表示投资项目A和B所获得的利润,求方差D(Y1),D(Y2);(2)将x(0x100)万元投资项目A,100x万元投资项目B,f(x)表示投资项目A所得利润的方差与投资项目B所得利润的方差的和求f(x)的最小值,并指出x为何值时,f(x)取得最小值解(1)根据题意,知Y1和Y2的分布列分
24、别如下表:Y1510P0.80.2Y22812P0.20.50.3从而E(Y1)50.8100.26,D(Y1)(56)20.8(106)20.24,E(Y2)20.280.5120.38,D(Y2)(28)20.2(88)20.5(128)20.312.(2)f(x)DD2D(Y1)2D(Y2)x23(100x)2(4x2600x30000)当x75时,f(x)取得最小值3.19(2021新高考卷)某学校组织“一带一路”知识竞赛,有A,B两类问题每位参加比赛的同学先在两类问题中选择一类并从中随机抽取一个问题回答,若回答错误则该同学比赛结束;若回答正确则从另一类问题中再随机抽取一个问题回答,无
25、论回答正确与否,该同学比赛结束A类问题中的每个问题回答正确得20分,否则得0分;B类问题中的每个问题回答正确得80分,否则得0分已知小明能正确回答A类问题的概率为0.8,能正确回答B类问题的概率为0.6,且能正确回答问题的概率与回答次序无关(1)若小明先回答A类问题,记X为小明的累计得分,求X的分布列;(2)为使累计得分的期望最大,小明应选择先回答哪类问题?并说明理由解(1)随机变量X的所有可能取值为0,20,100.P(X0)10.80.2,P(X20)0.8(10.6)0.32,P(X100)0.80.60.48.故随机变量X的分布列如下:X020100P0.20.320.48(2)设小明
26、先回答B类问题,记Y为小明的累计得分,则随机变量Y的所有可能取值为0,80,100,P(Y0)10.60.4,P(Y80)0.6(10.8)0.12,P(Y100)0.60.80.48.故E(Y)00.4800.121000.4857.6.由(1)知E(X)00.2200.321000.4854.4.因为E(Y)E(X),故应先回答B类问题20(2021陕西安康模拟)某食品店为了了解气温对销售量的影响,随机记录了该店1月份其中5天的日销售量y(单位:千克)与该地当日最低气温x(单位:)的数据,如下表:x258911y1210887(1)求出y与x的回归方程x;(2)判断y与x之间是正相关还是负
27、相关,若该地1月份某天的最低气温为6 ,请用所求回归方程预测该店当日的销售量;(3)设该地1月份的日最低气温XN(,2),其中近似为样本平均数,2近似为样本方差s2,求P(3.8X13.4)附:回归方程x中, .3.2,1.8.若XN(,2),则P(X)0.6826,P(2X2)0.9544.解(1)i7,i9,iyi5212510889811757928,522252829211257250, 0.56. 9(0.56)712.92.所求的回归方程是0.56x12.92.(2)由 0.560知,y与x之间是负相关,将x6代入回归方程可预测该店当日的销售量0.56612.929.56(千克)(3)由(1)知7,由2s2(27)2(57)2(87)2(97)2(117)210,得3.2.从而P(3.8X13.4)P(X2)P(X)P(X2)P(X)P(2X2)0.8185.