1、高考解答题专项六概率与统计1.(2020全国,文18)某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):空气质量等级锻炼人次0,200(200,400(400,6001(优)216252(良)510123(轻度污染)6784(中度污染)720(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的22列联
2、表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?空气质量情况人次400人次400好不好附:2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),P(2k)0.100.050.01k2.7063.8416.635解:(1)由所给数据,该市一天的空气质量等级为1,2,3,4的概率的估计值如下表:空气质量等级1234概率的估计值0.430.270.210.09(2)一天中到该公园锻炼的平均人次的估计值为1100(10020+30035+50045)=350.(3)根据所给数据,可得22列联表:空气质量情况人次400人次400好3337不好228
3、根据列联表得2=100(338-2237)2554570305.820.由于5.8203.841,故有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关.2.(2021江苏无锡下学期2月模拟)已知某班有50位学生,现对该班关于举办辩论赛的态度进行调查,他们综合评价成绩(单位:分)的频数分布以及对举办辩论赛的赞成人数如下表:综合评价成绩40,50)50,60)60,70)70,80)80,90)90,100)频数510151055赞成人数4812431(1)请根据以上统计数据填写下面22列联表,并回答:是否有90%的把握认为综合评价成绩以80分为分界点与对举办辩论赛的态度有关?对举
4、办辩论赛的态度综合评价成绩小于80分的人数综合评价成绩不小于80分的人数合计赞成不赞成合计(2)若采用分层抽样在综合评价成绩在60,70),70,80)的学生中随机抽取5人进行追踪调查,并选其中2人担任辩论赛主持人,求担任主持人的2人中至少有1人在60,70)的概率.附:2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),P(2k)0.100.050.01k2.7063.8416.635解:(1)22列联表为对举办辩论赛的态度综合评价成绩小于80分的人数综合评价成绩不小于80分的人数合计赞成28432不赞成12618合计401050则2=50(286-412)232184010=3
5、.1252.706,所以有90%的把握认为综合评价成绩以80分为分界点与对举办辩论赛的态度有关.(2)采用分层抽样,会在60,70)里抽3人,用A,B,C表示,70,80)里抽2人,用D,E表示,设M为事件“担任主持人的2人中没有人在60,70)内”,则基本事件包含AB,AC,AD,AE,BC,BD,BE,CD,CE,DE,共10个,事件M包含DE,只有1个,则所求事件的概率即为P=1-P(A)=1-110=910.3.(2021山西太原二模)2017年国家发改委、住建部发布了生活垃圾分类制度实施方案,规定46个城市在2020年底实施生活垃圾强制分类.某市在实施垃圾分类之前,对人口数量在1万左
6、右的社区一天产生的垃圾量(单位:吨)进行了调查.已知该市这样的社区有200个,如图是某天从中随机抽取50个社区所产生的垃圾量绘制的频率分布直方图.现将垃圾量超过14吨/天的社区称为“超标”社区.(1)根据上述资料,估计当天这50个社区垃圾量的平均值x(精确到整数)(同一组中的数据用该组区间的中点值为代表);(2)若以上述样本的频率近似代替总体的概率,请估计这200个社区中“超标”社区的个数;(3)市环保部门决定对样本中“超标”社区的垃圾来源进行调查,先从这些社区中按垃圾量用分层抽样抽取5个,再从这5个社区随机抽取2个进行重点监控,求重点监控社区中至少有1个垃圾量为16,18的社区的概率.解:(
7、1)由频率分布直方图得该样本中垃圾量为4,6),6,8),8,10),10,12),12,14),14,16),16,18的频率分别为0.08,0.1,0.2,0.24,0.18,0.12,0.08,所以估计当天这50个社区垃圾量的平均值为x=50.08+70.10+90.20+110.24+130.18+150.12+170.08=11.0411.(2)由(1)得该样本中“超标”社区的频率为0.12+0.08=0.2,所以这200个社区中“超标”社区的概率为0.2,所以这200个社区中“超标”社区的个数为2000.2=40.(3)由题意知按垃圾量用分层抽样抽取的5个社区中,垃圾量为14,16
8、)的社区有3个,分别记为a,b,c,按垃圾量为16,18的社区有2个,分别记为d,e,从中任选2个的基本事件有(a,b),(a,c),(a,d),(a,e),(b,c),(b,d),(b,e),(c,d),(c,e),(d,e),共10个,其中所求事件“至少有1个垃圾量为16,18的社区”为(a,d),(a,e),(b,d),(b,e),(c,d),(c,e),(d,e),共7个.所以重点监控社区中至少有1个垃圾量为16,18的社区的概率为P=710=0.7.4.(2021江苏南京二模)某公司对项目A进行生产投资,所获得的利润有如下统计数据表:项目A投资金额x/百万元12345所获利润y/百万
9、元0.30.30.50.91(1)请用线性回归模型拟合y与x的关系,并用相关系数加以说明;(2)该公司计划用7百万元对A,B两个项目进行投资.若公司对项目B投资x(1x6)百万元所获得的利润y近似满足:y=0.16x-0.49x+1+0.49,求A,B两个项目投资金额分别为多少时,获得的总利润最大?附:对于一组数据(x1,y1),(x2,y2),(xn,yn),其回归直线y=bx+a的斜率和截距的最小二乘估计分别为b=i=1nxiyi-nxyi=1nxi2-nx2,a=y-bx.线性相关系数r=i=1nxiyi-nxy(i=1nxi2-nx2)(i=1nyi2-ny2).一般地,相关系数r的绝
10、对值在0.95以上(含0.95)认为线性相关性较强;否则,线性相关性较弱.参考数据:对项目A投资的统计数据表中i=15xiyi=11,i=15yi2=2.24,4.42.1.解:(1)由题意可得x=1+2+3+4+55=3,y=0.3+0.3+0.5+0.9+15=0.6,代入公式可得i=15xiyi-5xy=11-530.6=2,i=15xi2-5x2=55-532=10,i=15yi2-5y2=2.24-50.62=0.44,所以b=i=1nxiyi-nxyi=1nxi2-nx2=210=0.2,a=y-bx=0.6-0.23=0,所以y=bx+a=0.2x,且r=i=1nxiyi-nxy
11、(i=1nxi2-nx2)(i=1nyi2-ny2)=2100.4422.10.95240.95,则y与x的线性相关性较强.(2)由题意,公司对项目B投资x(1x6)百万元,则对项目A投资(7-x)百万元,则获得的利润y=0.16x-0.49x+1+0.49+0.2(7-x)=1.89-0.49x+1-0.04x=1.93-0.49x+1+0.04(x+1)1.93-20.49x+10.04(x+1)=1.93-0.28=1.65,当且仅当0.49x+1=0.04(x+1),即x=2.5时等号成立,此时取到最大值为1.65百万元,而7-x=4.5百万元.答:对A,B两个项目投资金额分别为4.5百万元、2.5百万元时,获得的总利润最大,最大为1.65百万元.