1、专题限时集训(十二)统计与概率1(2019全国卷)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液,每只小鼠给服的溶液体积相同、摩尔浓度相同经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比,根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表)解(1)由已知得0.70a0.200
2、.15,故a0.35.b10.050.150.700.10.(2)甲离子残留百分比的平均值的估计值为20.1530.2040.3050.2060.1070.054.05.乙离子残留百分比的平均值的估计值为30.0540.1050.1560.3570.2080.156.00.2(2017全国卷)某超市计划按月订购一种酸奶,每天进货量相同,进货成本每瓶4元,售价每瓶6元,未售出的酸奶降价处理,以每瓶2元的价格当天全部处理完根据往年销售经验,每天需求量与当天最高气温(单位:)有关如果最高气温不低于25,需求量为500瓶;如果最高气温位于区间20,25),需求量为300瓶;如果最高气温低于20,需求量
3、为200瓶为了确定六月份的订购计划,统计了前三年六月份各天的最高气温数据,得下面的频数分布表:最高气温10,15)15,20)20,25)25,30)30,35)35,40)天数216362574以最高气温位于各区间的频率代替最高气温位于该区间的概率(1)求六月份这种酸奶一天的需求量X(单位:瓶)的分布列;(2)设六月份一天销售这种酸奶的利润为Y(单位:元),当六月份这种酸奶一天的进货量n(单位:瓶)为多少时,Y的数学期望达到最大值?解(1)由题意知,X所有可能取值为200,300,500,由表格数据知P(X200)0.2,P(X300)0.4,P(X500)0.4.因此X的分布列为X2003
4、00500P0.20.40.4(2)由题意知,这种酸奶一天的需求量至多为500,至少为200,因此只需考虑200n500.当300n500时,若最高气温不低于25,则Y6n4n2n;若最高气温位于区间20,25),则Y63002(n300)4n1 2002n;若最高气温低于20,则Y62002(n200)4n8002n.因此E(Y)2n0.4(1 2002n)0.4(8002n)0.26400.4n.当200n400空气质量好空气质量不好附:K2,P(K2k)0.0500.0100.001k3.8416.63510.828.解(1)由所给数据,该市一天的空气质量等级为1,2,3,4的概率的估计
5、值如下表:空气质量等级1234概率的估计值0.430.270.210.09(2)一天中到该公园锻炼的平均人次的估计值为(100203003550045)350.(3)根据所给数据,可得22列联表:人次400人次400空气质量好3337空气质量不好228根据列联表得K25.820.由于5.8203.841,故有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关4(2018全国卷)如图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型根据2000年至2016年的数据(时间变量t的
6、值依次为1,2,17)建立模型:30.413.5t;根据2010年至2016年的数据(时间变量t的值依次为1,2,7)建立模型:9917.5t.(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;(2)你认为用哪个模型得到的预测值更可靠?并说明理由解(1)利用模型,该地区2018年的环境基础设施投资额的预测值为30.413.519226.1(亿元)利用模型,该地区2018年的环境基础设施投资额的预测值为9917.59256.5(亿元)(2)利用模型得到的预测值更可靠理由如下:(i)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y30.413.5t
7、上下,这说明利用2000年至2016年的数据建立的线性模型不能很好地描述环境基础设施投资额的趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型9917.5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型得到的预测值更可靠()从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型得到的预测值226.1亿元的增幅明显偏低,而利用模型得到的预测值的增幅比较合理,说明利用模型得到的预测
8、值更可靠(以上给出了2种理由,答出其中任意一种或其他合理理由均可)1(2020肥城市第一高级中学高三月考)2019年4月,甲、乙两校的学生参加了某考试机构举行的大联考,现对这两校参加考试的学生的数学成绩进行统计分析,数据统计显示,考生的数学成绩X服从正态分布N(110,144),从甲、乙两校100分及以上的试卷中用系统抽样的方法各抽取了20份试卷,并将这40份试卷的得分制作成如图所示的茎叶图:(1)试通过茎叶图比较这40份试卷的两校学生数学成绩的中位数;(2)若把数学成绩不低于135分的记作数学成绩优秀,根据茎叶图中的数据,判断是否有90%的把握认为数学成绩在100分及以上的学生中数学成绩是否
9、优秀与所在学校有关?(3)从所有参加此次联考的学生中(人数很多)任意抽取3人,记数学成绩在134分以上的人数为,求的数学期望附:若随机变量X服从正态分布N(,2),则P(X)0.682 6,P(2X2)0.954 4,P(3X3)0.997 4.参考公式与临界值表:K2,其中nabcd.P(K2k)0.1000.0500.0250.0100.001k2.7063.8415.0246.63510.828解(1)由茎叶图可知:甲校学生数学成绩的中位数为131.5,乙校学生数学成绩的中位数为128.5,所以这40份试卷的成绩,甲校学生数学成绩的中位数比乙校学生数学成绩的中位数高. (2)由题意,作出
10、22列联表如下:甲校乙校总计数学成绩优秀10717数学成绩不优秀101323总计202040计算得K2的观测值k0.92072.706,所以没有90%的把握认为数学成绩在100分及以上的学生中数学成绩是否优秀与所在学校有关. (3)因为XN(110,144),所以110,12,所以P(86134)0.022 8,由题意可知B(3,0.022 8),所以E()30.022 80.068 4.2(2020长沙模拟)某市房管局为了了解该市市民2018年1月至2019年1月期间购买二手房情况,首先随机抽样其中200名购房者,并对其购房面积m(单位:平方米,60m130)进行了一次调查统计,制成了如图1
11、所示的频率分布直方图,接着调查了该市2018年1月至2019年1月期间当月在售二手房均价y(单位:万元/平方米),制成了如图2所示的散点图(图中月份代码1至13分别对应2018年1月至2019年1月)图1图2(1)试估计该市市民的平均购房面积;(2)从该市2018年1月至2019年1月期间所有购买二手房的市民中任取3人,用频率估计概率,记这3人购房面积不低于100平方米的人数为X,求X的分布列与数学期望;(3)根据散点图选择和ln x两个模型进行拟合,经过数据处理得到两个回归方程,分别为0.936 90.028 5和0.955 4 0.030 6ln x,并得到一些统计量的值,如表所示:0.9
12、36 90.028 50.955 40030 6ln x (yii)20.000 5910.000 164 (yi)20.006 050请利用相关指数R2判断哪个模型的拟合效果更好,并用拟合效果更好的模型预测2020年6月份的二手房购房均价(精确到0.001)参考数据:ln 20.69,ln 31.10,ln 102.30,ln 192.94,1.41,1.73,3.16,4.36.参考公式:R21.解(1)650.05750.1850.2950.251050.21150.151250.0596.(2)每一位市民购房面积不低于100平方米的概率为0.200.150.050.4,XB(3,0.4
13、),P(Xk)C0.4k0.63k(k0,1,2,3),P(X0)0.630.216,P(X1)C0.40.620.432,P(X2)C0.420.60.288,P(X3)0.430.064,X的分布列为:X0123P0.2160.4320.2880.064E(X)30.41.2.(3)设模型0.936 90.028 5和0.955 40.030 6ln x的相关指数分别为R,R,则R1,R1,RR,模型0.955 40.030 6ln x的拟合效果更好,2021年6月份对应的x42,0.955 40.030 6ln 420.955 40.030 6(ln 3ln 14)1.070万元/平方米
14、3(2020深圳模拟)2020年是中国改革开放的第42周年,为了充分认识新形势下改革开放的时代性,某地的民调机构随机选取了该地的100名市民进行调查,将他们的年龄分成6段:,并绘制了如图所示的频率分布直方图(1)现从年龄在,内的人员中按分层抽样的方法抽取8人,再从这8人中随机抽取3人进行座谈,用X表示年龄在内的人数,求X的分布列和数学期望;(2)若用样本的频率代替概率,用随机抽样的方法从该地抽取20名市民进行调查,其中有k名市民的年龄在的概率为P.当P最大时,求k的值解(1)按分层抽样的方法抽取的8人中,年龄在内的人数为81人,年龄在内的人数为82人,年龄在内的人数为85人所以X的可能取值为0
15、,1,2,所以P,P,P,所以X的分布列为X012PE(X)012.(2)设在抽取的20名市民中,年龄在内的人数为X,X服从二项分布由频率分布直方图可知,年龄在内的频率为100.35,所以XB,所以P(Xk)C(0.35)k(10.35)20k(k0,1,2,20)设t,若t1,则k7.35,PP;若t7.35,PP.所以当k7时,P最大,即当P最大时,k7.4(2020皖南八校第二次联考)2019全国美丽乡村篮球大赛在中国农村改革的发源地安徽凤阳举办,其间甲、乙两人轮流进行篮球定点投篮比赛(每人各投一次为一轮),在相同的条件下,每轮甲乙两人在同一位置,甲先投,每人投一次球,两人有1人命中,命
16、中者得1分,未命中者得1分;两人都命中或都未命中,两人均得0分,设甲每次投球命中的概率为,乙每次投球命中的概率为,且各次投球互不影响(1)经过1轮投球,记甲的得分为X,求X的分布列;(2)若经过n轮投球,用pi表示经过第i轮投球,累计得分,甲的得分高于乙的得分的概率求p1,p2,p3;规定p00,经过计算机计算可估计得piapi1bpicpi1(b1),请根据中p1,p2,p3的值分别写出a,c关于b的表达式,并由此求出数列的通项公式解(1)记一轮投球,甲命中为事件A,乙命中为事件B,A,B相互独立,由题意P(A),P(B),甲的得分X的取值为1,0,1,P(X1)P(B)P()P(B),P(
17、X0)P(AB)P()P(A)P(B)P()P(),P(X1)P(A)P(A)P(),X的分布列为:X101P(2)由(1)知p1,p2P(X0)P(X1)P(X1)(P(X0)P(X1),同理,经过2轮投球,甲的得分Y取值2,1,0,1,2:记P(X1)x,P(X0)y,P(X1)z,则P(Y2)x2,P(Y1)xyyx,P(Y0)xzzxy2,P(Y1)yzzy,P(Y2)z2,由此得甲的得分Y的分布列为:Y21012Pp3,piapi1bpicpi1(b1),p00,代入piapi1bpicpi1(b1)得:pipi1pi1,pi1pi(pipi1),数列pnpn1是等比数列,公比为q,首项为p1p0,pnpn1.pn(pnpn1)(pn1pn2)(p1p0).