1、高考大题专项练六高考中的概率、统计与统计案例1.某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由.(2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m的工人数填入下面的列联表:生产方式是否超过m总计超过m不超过m第一种生产方式第二种生产方式总计40(3)根据(2)中的列联表,能否
2、有99%的把握认为两种生产方式的效率有差异?附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),P(K2k0)0.0500.0100.001k03.8416.63510.828解:(1)第二种生产方式的效率更高.理由如下:由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80分钟,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多79分钟.因此第二种生产方式的效率更高.由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为85.5分钟,用第二种生产方式的工人完成生产任务所需时间的中位数为73.5分钟.因此第二种生产方式的效
3、率更高.由茎叶图可知:用第一种生产方式的工人完成生产任务平均所需时间高于80分钟;用第二种生产方式的工人完成生产任务平均所需时间低于80分钟.因此第二种生产方式的效率更高.由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布.又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少.因此第二种生产方式的效率更高.以上给出了4种理由,考生答出其中任意一种或其他合理理由均可.
4、(2)由茎叶图知m=79+812=80.列联表如下:生产方式是否超过m总计超过m不超过m第一种生产方式15520第二种生产方式51520总计202040(3)因为K2=40(1515-55)220202020=106.635,所以有99%的把握认为两种生产方式的效率有差异.2.(2020山东,19)为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和SO2浓度(单位:g/m3),得下表:PM2.5SO20,50(50,150(150,4750,3532184(35,756812(75,1153710(1)估计事件“该市一天空气中PM2.5浓度
5、不超过75,且SO2浓度不超过150”的概率;(2)根据所给数据,完成下面的22列联表:PM2.5SO20,150(150,4750,75(75,115(3)根据(2)中的列联表,判断是否有99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关?附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),P(K2k0)0.0500.0100.001k03.8416.63510.828解:(1)根据抽查数据,该市100天空气中PM2.5浓度不超过75,且SO2浓度不超过150的天数为32+18+6+8=64,因此,该市一天空气中PM2.5浓度不超过75,且SO2浓度不超过150的
6、概率的估计值为64100=0.64.(2)根据抽查数据,可得22列联表:PM2.5SO20,150(150,4750,756416(75,1151010(3)根据(2)的列联表得K2的观测值k=100(6410-1610)2802074267.484.由于7.4846.635,故有99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关.3.11分制乒乓球比赛,每赢一球得1分.当某局打成1010平后,每球交换发球权,先多得2分的一方获胜,该局比赛结束.甲、乙两名同学进行单打比赛,假设甲发球时甲得分的概率为0.5,乙发球时甲得分的概率为0.4,各球的结果相互独立.在某局双方1010平后,甲先
7、发球,两人又打了X个球该局比赛结束.(1)求P(X=2);(2)求事件“X=4且甲获胜”的概率.答案:(1)证明X=2就是1010平后,两人又打了两个球该局比赛结束,则这两个球均由甲得分或者均由乙得分.因此P(X=2)=0.50.4+(1-0.5)(1-0.4)=0.5.(2)解事件“X=4且甲获胜”,就是1010平后,两人又打了4个球该局比赛结束,且这4个球的得分情况为:前两球是甲、乙各得1分,后两球均为甲得分.因此所求概率为0.5(1-0.4)+(1-0.5)0.40.50.4=0.1.4.某工厂的某种产品成箱包装,每箱200件,每一箱产品在交付用户之前要对产品作检验,如检验出不合格品,则
8、更换为合格品.检验时,先从这箱产品中任取20件作检验,再根据检验结果决定是否对余下的所有产品作检验.设每件产品为不合格品的概率都为p(0p0;当p(0.1,1)时,f(p)400,因此应该对余下的产品作检验.5.某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响.对近8年的年宣传费xi和年销售量yi(i=1,2,8)数据作了初步处理,得到下面的散点图及一些统计量的值.xywi=18(xi-x)2i=18(wi-w)2i=18(xi-x)(yi-y)i=18(wi-w)(yi-y)46.65636.8289.81.61
9、469108.8表中wi=xi,w=18i=18wi.(1)根据散点图判断,y=a+bx与y=c+dx哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;(3)已知这种产品的年利润z与x,y的关系为z=0.2y-x.根据(2)的结果回答下列问题:当年宣传费x=49时,年销售量及年利润的预报值是多少?当年宣传费x为何值时,年利润的预报值最大?附:对于一组数据(u1,v1),(u2,v2),(un,vn),其回归直线v=+u的斜率和截距的最小二乘估计分别为=i=1n(ui-u)(vi-v)i=1n(ui-
10、u)2,=v-u.解:(1)由散点图可以判断,y=c+dx适宜作为年销售量y关于年宣传费x的回归方程类型.(2)令w=x,先建立y关于w的线性回归方程.因为d=i=18(wi-w)(yi-y)i=18(wi-w)2=108.81.6=68,c=y-dw=563-686.8=100.6,所以y关于w的线性回归方程为y=100.6+68w,因此y关于x的回归方程为y=100.6+68x.(3)由(2)知,当x=49时,年销售量y的预报值y=100.6+6849=576.6,年利润z的预报值z=576.60.2-49=66.32.根据(2)的结果知,年利润z的预报值z=0.2(100.6+68x)-
11、x=-x+13.6x+20.12.所以当x=13.62=6.8,即x=46.24时,z取得最大值.故当年宣传费为46.24千元时,年利润的预报值最大.6.为了监控某种零件的一条生产线的生产过程,检验员每天从该生产线上随机抽取16个零件,并测量其尺寸(单位:cm).根据长期生产经验,可以认为这条生产线正常状态下生产的零件的尺寸服从正态分布N(,2).(1)假设生产状态正常,记X表示一天内抽取的16个零件中其尺寸在(-3,+3)之外的零件数,求P(X1)及X的数学期望;(2)一天内抽检零件中,如果出现了尺寸在(-3,+3)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的
12、生产过程进行检查.试说明上述监控生产过程方法的合理性;下面是检验员在一天内抽取的16个零件的尺寸:9.9510.129.969.9610.019.929.9810.0410.269.9110.1310.029.2210.0410.059.95经计算得x=116i=116xi=9.97,s=116i=116(xi-x)2=116(i=116xi2-16x2)0.212,其中xi为抽取的第i个零件的尺寸,i=1,2,16.用样本平均数x作为的估计值,用样本标准差s作为的估计值,利用估计值判断是否需对当天的生产过程进行检查?剔除(-3,+3)之外的数据,用剩下的数据估计和(精确到0.01).附:若随
13、机变量Z服从正态分布N(,2),则P(-3Z+3)0.997 3.0.997 3160.957 7,0.0080.09.解:(1)抽取的一个零件的尺寸在(-3,+3)之内的概率为0.9973,从而零件的尺寸在(-3,+3)之外的概率为0.0027,故XB(16,0.0027).因此P(X1)=1-P(X=0)=1-0.9973160.0423.X的数学期望为E(X)=160.0027=0.0432.(2)如果生产状态正常,一个零件尺寸在(-3,+3)之外的概率只有0.0027,一天内抽取的16个零件中,出现尺寸在(-3,+3)之外的零件的概率只有0.0423,发生的概率很小.因此一旦发生这种情
14、况,就有理由认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查,可见上述监控生产过程的方法是合理的.由x=9.97,s0.212,得的估计值为=9.97,的估计值为=0.212,由样本数据可以看出有一个零件的尺寸在(-3,+3)之外,因此需对当天的生产过程进行检查.剔除(-3,+3)之外的数据9.22,剩下数据的平均数为115(169.97-9.22)=10.02,因此的估计值为10.02.i=116xi2=160.2122+169.9721 591.134,剔除(-3,+3)之外的数据9.22,剩下数据的样本方差为115(1 591.134-9.222-1510.022)0.008,因此的估计值为0.0080.09.