1、专题限时集训(十二)统计与概率1(2019全国卷)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液,每只小鼠给服的溶液体积相同、摩尔浓度相同经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比,根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表)解(1)由已知得0.70a0.200
2、.15,故a0.35.b10.050.150.700.10.(2)甲离子残留百分比的平均值的估计值为20.1530.2040.3050.2060.1070.054.05.乙离子残留百分比的平均值的估计值为30.0540.1050.1560.3570.2080.156.00.2(2017全国卷)某超市计划按月订购一种酸奶,每天进货量相同,进货成本每瓶4元,售价每瓶6元,未售出的酸奶降价处理,以每瓶2元的价格当天全部处理完根据往年销售经验,每天需求量与当天最高气温(单位:)有关如果最高气温不低于25,需求量为500瓶;如果最高气温位于区间20,25),需求量为300瓶;如果最高气温低于20,需求量
3、为200瓶为了确定六月份的订购计划,统计了前三年六月份各天的最高气温数据,得下面的频数分布表:最高气温10,15)15,20)20,25)25,30)30,35)35,40)天数216362574以最高气温位于各区间的频率估计最高气温位于该区间的概率(1)估计六月份这种酸奶一天的需求量不超过300瓶的概率;(2)设六月份一天销售这种酸奶的利润为Y(单位:元)当六月份这种酸奶一天的进货量为450瓶时,写出Y的所有可能值,并估计Y大于零的概率解(1)这种酸奶一天的需求量不超过300瓶,当且仅当最高气温低于25,由表格数据知,最高气温低于25的频率为0.6,所以这种酸奶一天的需求量不超过300瓶的概
4、率的估计值为0.6.(2)当这种酸奶一天的进货量为450瓶时,若最高气温不低于25,则Y64504450900;若最高气温位于区间20,25),则Y63002(450300)4450300;若最高气温低于20,则Y62002(450200)4450100,所以,Y的所有可能值为900,300,100.Y大于零当且仅当最高气温不低于20,由表格数据知,最高气温不低于20的频率为0.8,因此Y大于零的概率的估计值为0.8.3(2020全国卷)某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):锻炼人次空气质量等级0,200(200,400
5、(400,6001(优)216252(良)510123(轻度污染)6784(中度污染)720(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”根据所给数据,完成下面的22列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?人次400人次400空气质量好空气质量不好附:K2,P(K2k)0.0500.0100.001k3.8416.63510
6、.828解(1)由所给数据,该市一天的空气质量等级为1,2,3,4的概率的估计值如下表:空气质量等级1234概率的估计值0.430.270.210.09(2)一天中到该公园锻炼的平均人次的估计值为(100203003550045)350.(3)根据所给数据,可得22列联表:人次400人次400空气质量好3337空气质量不好228根据列联表得K25.820.由于5.8203.841,故有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关4(2018全国卷)如图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图为了预测该地区2018年的环境基础设施投资额,建立了
7、y与时间变量t的两个线性回归模型根据2000年至2016年的数据(时间变量t的值依次为1,2,17)建立模型:30.413.5t;根据2010年至2016年的数据(时间变量t的值依次为1,2,7)建立模型:9917.5t.(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;(2)你认为用哪个模型得到的预测值更可靠?并说明理由解(1)利用模型,该地区2018年的环境基础设施投资额的预测值为30.413.519226.1(亿元)利用模型,该地区2018年的环境基础设施投资额的预测值为9917.59256.5(亿元)(2)利用模型得到的预测值更可靠理由如下:(i)从折线图可以看
8、出,2000年至2016年的数据对应的点没有随机散布在直线y30.413.5t上下,这说明利用2000年至2016年的数据建立的线性模型不能很好地描述环境基础设施投资额的趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型9917.5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型得到的预测值更可靠()从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型得到的预测值226.1亿
9、元的增幅明显偏低,而利用模型得到的预测值的增幅比较合理,说明利用模型得到的预测值更可靠(以上给出了2种理由,答出其中任意一种或其他合理理由均可)1(2020大教育名校联盟第一次联考)我国在贵州省平塘县境内修建的500米口径球面射电望远镜(FAST)是目前世界上最大单口径射电望远镜使用三年来,已发现132颗优质的脉冲星候选体,其中有93颗已被确认为新发现的脉冲星,脉冲星是上世纪60年代天文学的四大发现之一,脉冲星就是正在快速自转的中子星,每一颗脉冲星每两脉冲间隔时间(脉冲星的自转周期)是一定的,最小小到0.001 4秒,最长的也不过11.765 735秒某一天文研究机构观测并统计了93颗已被确认
10、为新发现的脉冲星的自转周期,绘制了如图所示的频率分布直方图(1)在93颗新发现的脉冲星中,自转周期在2至10秒的大约有多少颗?(2)根据频率分布直方图,求新发现脉冲星自转周期的平均值解(1)第一到第六组的频率依次为01,0.2,0.3,0.2,2a,0.05,其和为1,所以2a1,解得a0.075,所以,自转周期在2至10秒的大约有9379.0579(颗)(2)新发现的脉冲星自转周期平均值为0110.230.350.270.1590.05115.5(秒)故新发现的脉冲星自转周期平均值为5.5秒2(2020滁州模拟)某机构为了了解不同年龄的人对一款智能家电的评价,随机选取了50名购买该家电的消费
11、者,让他们根据实际使用体验进行评分(1)设消费者的年龄为x,对该款智能家电的评分为y.若根据统计数据,用最小二乘法得到y关于x的线性回归方程为1.2x40,且年龄x的方差为s14.4,评分y的方差为s22.5.求y与x的相关系数r,并据此判断对该款智能家电的评分与年龄的相关性强弱;(2)按照一定的标准,将50名消费者的年龄划分为“青年”和“中老年”,评分划分为“好评”和“差评”,整理得到如下数据,请判断是否有99%的把握认为对该智能家电的评价与年龄有关好评差评青年816中老年206附:线性回归直线x的斜率;相关系数r,独立性检验中K2,其中nabcd.临界值表:P(K2k)0.0500.010
12、0.001k3.8416.63510.828解(1)相关系数r1.20.96.故对该款智能家电的评分与年龄的相关性较强(2)由列联表可得K29.6246.635.故有99%的把握认为对该智能家电的评价与年龄有关3(2020长沙雅礼中学模拟)某市房管局为了了解该市市民2018年1月至2019年1月期间买二手房情况,首先随机抽样其中200名购房者,并对其购房面积m(单位:平方米,60m130)进行了一次调查统计,制成了如图1所示的频率分布直方图,接着调查了该市2018年1月至2019年1月期间当月在售二手房均价y(单位:万元/平方米),制成了如图2所示的散点图(图中月份代码113分别对应2018年
13、1月至2019年1月)(1)试估计该市市民的购房面积的中位数m0;(2)现采用分层抽样的方法从购房面积位于的40位市民中随机抽取4人,再从这4人中随机抽取2人,求这2人的购房面积恰好有一人在的概率;(3)根据散点图选择和ln x两个模型进行拟合,经过数据处理得到两个回归方程,分别为0.936 90.028 5和0.955 40.030 6ln x,并得到一些统计量的值如下表所示:0.936 90.028 50.955 40.030 6ln x0.000 5910.000 1640.006 050请利用相关指数R2判断哪个模型的拟合效果更好,并用拟合效果更好的模型预测出2021年6月份的二手房购
14、房均价(精确到0.001)(参考数据:ln 20.69,ln 31.10,ln 142.64,ln 192.94,1.41,1.73,3.16,4.36.参考公式:R21)解(1)由频率分布直方图可得,前三组频率和为0.050.10.20.35,前四组频率和为0.050.10.20.250.6,故中位数出现在第四组,且m0901096.(2)设从位于的市民中抽取x人,从位于120,130的市民中抽取y人,由分层抽样可知:,则x3,y1在抽取的4人中,记3名位于110,120)的市民为A1,A2,A3,位于的市民为B,则所有抽样情况为:(A1,A2),(A1,A3),(A1,B),(A2,A3)
15、,(A2,B),(A3,B)共6种而其中恰有一人在120,130的情况共有3种,故所求概率P.(3)设模型0.936 90.028 5和0.955 40.030 6ln x的相关指数分别为R,R,则R1,R1,显然RR,故模型0.955 40.030 6ln x的拟合效果更好由2021年6月份对应的代码为42,则0.955 40.030 6ln 420.955 40.030 6(ln 3ln 14)1.070万元/平方米4(2020华南师大附中等三校联考)已知某保险公司的某险种的基本保费为a(单位:元),继续购买该险种的投保人称为续保人,续保人本年度的保费与其上年度出险次数的关联如下:上年度出
16、险次数01234保费(元)0.9aa1.5a2.5a4a随机调查了该险种的400名续保人在一年内的出险情况,得到下表:出险次数01234频数2808024124该保险公司这种保险的赔付规定如下:出险序次第1次第2次第3次第4次第5次及以上赔付金(元)2.5a1.5aa0.5a0将所抽样本的频率视为概率(1)求本年度续保人保费的平均值的估计值;(2)按保险合同规定,若续保人在本年度内出险3次,则可获得赔付(2.5a1.5aa)元;若续保人在本年度内出险6次,则可获得赔付(2.5a1.5aa0.5a)元;依此类推,求本年度续保人所获赔付金额的平均值的估计值;(3)续保人原定约了保险公司的销售人员在
17、上午10:3011:30之间上门签合同,因为续保人临时有事,外出的时间在上午10:4511:05之间,请问续保人在离开前见到销售人员的概率是多少?解(1)由题意可得:保费(元)0.9aa1.5a2.5a4a概率0.70.20.060.030.01本年度续保人保费的平均值的估计值为:09a0.7a0.21.5a0.062.5a0.034a0.011.035a.(2)由题意可得:赔偿金额(元)02.5a4a5a5.5a概率0.70.20.060.030.01本年度续保人所获赔付金额的平均值的估计值:00.72.5a0.24a0.065a0.035.5a0.010.945a.(3)设保险公司销售人员到达的时间为x,续保人离开的时间为y,看成平面上的点,全部结果所构成的区域为,则区域的面积S1.事件A表示续保人在离开前见到销售人员,所构成的区域为A,即图中的阴影部分,其面积S.所以P,即续保人在离开前见到销售人员的概率是.