1、五年(2019-2023)年高考真题分项汇编专题15 概率与统计(解答题)概率与统计题型主要包含二项式定理,排列组合,随机抽样,统计与概率等主要考查题型为:考点01 统计案例及应用考点02 随机事件分布列考点03 相关关系与回归分析考点04 独立性检验考点05 概率统计的综合应用考点01:统计案例及应用1(2022高考北京卷)在校运动会上,只有甲、乙、丙三名同学参加铅球比赛,比赛成绩达到以上(含)的同学将获得优秀奖为预测获得优秀奖的人数及冠军得主,收集了甲、乙、丙以往的比赛成绩,并整理得到如下数据(单位:m):甲:980,970,955,954,948,942,940,935,930,925;
2、乙:978,956,951,936,932,923;丙:985,965,920,916假设用频率估计概率,且甲、乙、丙的比赛成绩相互独立(1)估计甲在校运动会铅球比赛中获得优秀奖的概率;(2)设X是甲、乙、丙在校运动会铅球比赛中获得优秀奖的总人数,估计X的数学期望E(X);(3)在校运动会铅球比赛中,甲、乙、丙谁获得冠军的概率估计值最大?(结论不要求证明)【答案】【解析】:(1)由频率估计概率可得甲获得优秀的概率为04,乙获得优秀的概率为05,丙获得优秀的概率为05,故答案为04(2)设甲获得优秀为事件A1,乙获得优秀为事件A2,丙获得优秀为事件A3,X的分布列为X0123P(3)丙夺冠概率估
3、计值最大因为铅球比赛无论比赛几次就取最高成绩比赛一次,丙获得985的概率为,甲获得980的概率为,乙获得978的概率为并且丙的最高成绩是所有成绩中最高的,比赛次数越多,对丙越有利2(2023年全国乙卷理科)某厂为比较甲乙两种工艺对橡胶产品伸缩率的处理效应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品的伸缩率甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为,试验结果如下:试验序号12345678910伸缩率545533551522575544541568596548伸缩率536527543530560533522
4、550576536记,记样本平均数为,样本方差为(1)求,;(2)判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率是否有显著提高(如果,则认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高,否则不认为有显著提高)【答案】(1),; (2)认为甲工艺处理后橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高【解析】:(1), 的值分别为: ,故(2)由(1)知:,故有,所以认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高3(2020年高考课标卷理科)甲、乙、丙三位同学进行羽毛球比赛,约定赛制如下:累计负两场者被淘汰;比
5、赛前抽签决定首先比赛的两人,另一人轮空;每场比赛的胜者与轮空者进行下一场比赛,负者下一场轮空,直至有一人被淘汰;当一人被淘汰后,剩余的两人继续比赛,直至其中一人被淘汰,另一人最终获胜,比赛结束经抽签,甲、乙首先比赛,丙轮空设每场比赛双方获胜的概率都为,(1)求甲连胜四场的概率;(2)求需要进行第五场比赛的概率;(3)求丙最终获胜的概率【答案】(1);(2);(3)【解析】:”(1)记事件甲连胜四场,则;(2)记事件为甲输,事件为乙输,事件为丙输,则四局内结束比赛的概率为,所以,需要进行第五场比赛的概率为;(3)记事件为甲输,事件为乙输,事件为丙输,记事件甲赢,记事件丙赢,则甲赢的基本事件包括:
6、、,所以,甲赢概率为由对称性可知,乙赢的概率和甲赢的概率相等,所以丙赢的概率为4(2021年高考全国乙卷理科)某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:旧设备98103100102999810010110297新设备101104101100101103106105104105旧设备和新设备生产产品的该项指标的样本平均数分别记为和,样本方差分别记为和(1)求,;(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果,则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不
7、认为有显著提高)【答案】(1);(2)新设备生产产品的该项指标的均值较旧设备有显著提高【解析】:(1),(2)依题意,所以新设备生产产品的该项指标的均值较旧设备有显著提高5(2021年新高考卷)某学校组织“一带一路”知识竞赛,有A,B两类问题,每位参加比赛的同学先在两类问题中选择一类并从中随机抽取一个问题回答,若回答错误则该同学比赛结束:若回答正确则从另一类问题中再随机抽取一个问题回答,无论回答正确与否,该同学比赛结束A类问题中的每个问题回答正确得20分,否则得0分:B类问题中的每个问题回答正确得80分,否则得0分,己知小明能正确回答A类问题的概率为08,能正确回答B类问题的概率为06,且能正
8、确回答问题的概率与回答次序无关(1)若小明先回答A类问题,记为小明的累计得分,求的分布列;(2)为使累计得分期望最大,小明应选择先回答哪类问题?并说明理由【答案】【解析】:(1)由题可知,的所有可能取值为,;所以的分布列为(2)由(1)知,若小明先回答问题,记为小明的累计得分,则的所有可能取值为,;所以因为,所以小明应选择先回答类问题6(2022新高考全国II卷)在某地区进行流行病学调查,随机调查了100位某种疾病患者的年龄,得到如下的样本数据的频率分布直方图:(1)估计该地区这种疾病患者的平均年龄(同一组中的数据用该组区间的中点值为代表);(2)估计该地区一位这种疾病患者的年龄位于区间的概率
9、;(3)已知该地区这种疾病的患病率为,该地区年龄位于区间的人口占该地区总人口的从该地区中任选一人,若此人的年龄位于区间,求此人患这种疾病的概率(以样本数据中患者的年龄位于各区间的频率作为患者的年龄位于该区间的概率,精确到00001)【答案】(1)岁; (2); (3)【解析】:(1)平均年龄 (岁)(2)设一人患这种疾病的年龄在区间,所以 (3)设任选一人年龄位于区间,任选一人患这种疾病,则由条件概率公式可得 2(2019全国理)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成两组,每组100只,其中组小鼠给服甲离子溶液,组小鼠给服乙离子溶液每只小鼠给服的溶液体积
10、相同、摩尔浓度相同经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比根据试验数据分别得到如下直方图:记为事件:“乙离子残留在体内的百分比不低于”,根据直方图得到的估计值为(1)求乙离子残留百分比直方图中的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表)【答案】(1),;(2),.00【官方【解析】(1)由已知得,故,(2)甲离子残留百分比的平均值的估计值为乙离子残留百分比的平均值的估计值为【点评】本题考查频率分布直方图的相关概念和频率分布直方图中平均数法人计算,属于基础题考点02 随机事件分布列1(2022年高考全国甲卷数学(理)甲、乙两个学校
11、进行体育比赛,比赛共设三个项目,每个项目胜方得10分,负方得0分,没有平局三个项目比赛结束后,总得分高的学校获得冠军已知甲学校在三个项目中获胜的概率分别为05,04,08,各项目的比赛结果相互独立(1)求甲学校获得冠军的概率;(2)用X表示乙学校的总得分,求X的分布列与期望【答案】(1); (2)分布列见【解析】,【解析】(1)设甲在三个项目中获胜的事件依次记为,所以甲学校获得冠军的概率为(2)依题可知,的可能取值为,所以,,,即的分布列为0102030016044034006期望2(2021高考北京)在核酸检测中, “k合1” 混采核酸检测是指:先将k个人的样本混合在一起进行1次检测,如果这
12、k个人都没有感染新冠病毒,则检测结果为阴性,得到每人的检测结果都为阴性,检测结束:如果这k个人中有人感染新冠病毒,则检测结果为阳性,此时需对每人再进行1次检测,得到每人的检测结果,检测结束现对100人进行核酸检测,假设其中只有2人感染新冠病毒,并假设每次检测结果准确(I)将这100人随机分成10组,每组10人,且对每组都采用“10合1”混采核酸检测(i)如果感染新冠病毒的2人在同一组,求检测的总次数;(ii)已知感染新冠病毒的2人分在同一组的概率为设X是检测的总次数,求X的分布列与数学期望E(X)(II)将这100人随机分成20组,每组5人,且对每组都采用“5合1”混采核酸检测设Y是检测的总次
13、数,试判断数学期望E(Y)与(I)中E(X)的大小(结论不要求证明)【答案】(1)次;分布列见【解析】;期望为;(2)【解析】:(1)对每组进行检测,需要10次;再对结果为阳性的组每个人进行检测,需要10次;所以总检测次数为20次;由题意,可以取20,30,则的分布列:所以;(2)由题意,可以取25,30,两名感染者在同一组的概率为,不在同一组的概率为,则3(2020江苏高考)甲口袋中装有个黑球和个白球,乙口袋中装有个白球现从甲、乙两口袋中各任取一个球交换放入另一口袋,重复次这样的操作,记甲口袋中黑球个数为,恰有个黑球的概率为,恰有个黑球的概率为(1)求和;(2)求与的递推关系式和的数学期望(
14、用表示)【答案】(1)(2)【解析】(1),(2),因此,从而,即又的分布列为 012 故4(2019全国理)分制乒乓球比赛,每赢一球得分,当某局打成平后,每球交换发球权,先多得分的一方获胜,该局比赛结束甲、乙两位同学进行单打比赛,假设甲发球时甲得分的概率为,乙发球时甲得分的概率为,各球的结果相互独立在某局双方平后,甲先发球,两人又打了个球该局比赛结束求;求事件“且甲获胜”的概率【答案】;.【解析】就是平后,两人又打了个球该局比赛结束,则这个球均由甲得分,或者均由乙得分因此且甲获胜,就是平后,两人又打了个球该局比赛结束,且这个球的得分情况为:前两球是甲、乙各得分,后两球均为甲得分因此所求概率为
15、【解析】:由题意可知,所包含的事件为“甲连赢两球或乙连赢两球”,所以.由题意可知,包含的事件为“前两球甲乙各得分,后两球均为甲得分”所以.5(2019天津理)设甲、乙两位同学上学期间,每天7:30之前到校的概率均为假定甲、乙两位同学到校情况互不影响,且任一同学每天到校情况相互独立()用表示甲同学上学期间的三天中7:30之前到校的天数,求随机变量的分布列和数学期望;()设为事件“上学期间的三天中,甲同学在7:30之前到校的天数比乙同学在7:30之前到校的天数恰好多2”,求事件发生的概率【答案】本小题主要考查离散型随机变量的分布列与数学期望,互斥事件和相互独立事件的概率计算公式等基础知识考查运用概
16、率知识解决简单实际问题的能力满分13分()解:因为甲同学上学期间的三天中到校情况相互独立,且每天7:30之前到校的概率均为,故,从而所以,随机变量的分布列为0123随机变量的数学期望()解:设乙同学上学期间的三天中7:30之前到校的天数为,则,且由题意知事件与互斥,且事件与,事件与均相互独立,从而由()知 考点03 相关关系与回归分析1(2022年高考全国乙卷数学(理)某地经过多年的环境治理,已将荒山改造成了绿水青山为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:)和材积量(单位:),得到如下数据:样本号12345678910总和根部横截面积00400
17、600400800800500500700700606材积量02504002205405103403604604204039并计算得(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到001);(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为已知树木的材积量与其根部横截面积近似成正比利用以上数据给出该林区这种树木的总材积量的估计值附:相关系数【答案】(1); (2) (3)【解析】:【小问1详解】样本中10棵这种树木的根部横截面积的平均值样本中10棵这种树木的材积量的平均值据此
18、可估计该林区这种树木平均一棵的根部横截面积为,平均一棵的材积量为【小问2详解】则小问3详解】设该林区这种树木的总材积量的估计值为,又已知树木的材积量与其根部横截面积近似成正比,可得,解之得则该林区这种树木的总材积量估计为2(2020年高考课标卷理科)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加为调查该地区某种野生动物数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(xi,yi)(i=1,2,20),其中xi和yi分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得,(1)求该地区这种野生动物数量
19、的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求样本(xi,yi)(i=1,2,20)的相关系数(精确到001);(3)根据现有统计资料,各地块间植物覆盖面积差异很大为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由附:相关系数r=,1414【答案】(1);(2);(3)详见【解析】【解析】:(1)样区野生动物平均数为,地块数为200,该地区这种野生动物的估计值为(2)样本(i=1,2,20)的相关系数为(3)由(2)知各样区的这种野生动物的数量与植物覆盖面积有很强的正相关性,由于各地块间植物覆盖面积
20、差异很大,从俄各地块间这种野生动物的数量差异很大,采用分层抽样的方法较好地保持了样本结构与总体结构得以执行,提高了样本的代表性,从而可以获得该地区这种野生动物数量更准确的估计 考点04 独立性检验1(2023年全国甲卷理科)一项试验旨在研究臭氧效应实验方案如下:选40只小白鼠,随机地将其中20只分配到实验组,另外20只分配到对照组,实验组的小白鼠饲养在高浓度臭氧环境,对照组的小白鼠饲养在正常环境,一段时间后统计每只小白鼠体重的增加量(单位:g)(1)设表示指定的两只小白鼠中分配到对照组的只数,求的分布列和数学期望;(2)实验结果如下:对照组的小白鼠体重的增加量从小到大排序为:152 188 2
21、02 213 225 232 258 265 275 301326 343 348 356 356 358 362 373 405 432对照组的小白鼠体重的增加量从小到大排序为:78 92 114 124 132 155 165 180 188 192198 202 216 228 236 239 251 282 323 365(i)求40只小鼠体重的增加量的中位数m,再分别统计两样本中小于m与不小于的数据的个数,完成如下列联表:对照组实验组(ii)根据(i)中的列联表,能否有95%的把握认为小白鼠在高浓度臭氧环境中与正常环境中体重的增加量有差异附:010000500010270638416
22、635【答案】(1)分布列见【解析】, (2)(i);列联表见【解析】,(ii)能【解析】:(1)依题意,的可能取值为,则,所以的分布列为:故(2)(i)依题意,可知这40只小白鼠体重增量的中位数是将两组数据合在一起,从小到大排后第20位与第21位数据的平均数,观察数据可得第20位为,第21位数据为,所以,故列联表为:合计对照组61420实验组14620合计202040(ii)由(i)可得,所以能有的把握认为小白鼠在高浓度臭氧环境中与正常环境中体重的增加量有差异2(2021年高考全国甲卷理科)甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各
23、生产了200件产品,产品的质量情况统计如下表:一级品二级品合计甲机床15050200乙机床12080200合计270130400(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?(2)能否有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异?附:005000100001k3841663510828【答案】(1)75%;60%;(2)能【解析】:(1)甲机床生产的产品中的一级品的频率为,乙机床生产的产品中的一级品的频率为(2),故能有99%的把握认为甲机床的产品与乙机床的产品质量有差异3(2020年高考课标卷理科)某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园
24、锻炼的人次,整理数据得到下表(单位:天):锻炼人次空气质量等级0,200(200,400(400,6001(优)216252(良)510123(轻度污染)6784(中度污染)720(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”根据所给数据,完成下面的22列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?人次400人次400空气质量好空
25、气质量不好附:,P(K2k)0050 0010 0001k3841663510828【答案】(1)该市一天的空气质量等级分别为、的概率分别为、;(2);(3)有,理由见【解析】【解析】:(1)由频数分布表可知,该市一天的空气质量等级为的概率为,等级为的概率为,等级为的概率为,等级为的概率为;(2)由频数分布表可知,一天中到该公园锻炼的人次的平均数为(3)列联表如下:人次人次空气质量不好空气质量好,因此,有的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关【点睛】本题考查利用频数分布表计算频率和平均数,同时也考查了独立性检验的应用,考查数据处理能力,属于基础题4(2020年新高考全国卷)
26、为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了天空气中的和浓度(单位:),得下表: 3218468123710(1)估计事件“该市一天空气中浓度不超过,且浓度不超过”的概率;(2)根据所给数据,完成下面的列联表: (3)根据(2)中列联表,判断是否有的把握认为该市一天空气中浓度与浓度有关?附:,0050 0010 00013841 6635 10828【答案】(1);(2)答案见【解析】;(3)有【解析】:(1)由表格可知,该市100天中,空气中的浓度不超过75,且浓度不超过150的天数有天,所以该市一天中,空气中的浓度不超过75,且浓度不超过150的概率为;(2
27、)由所给数据,可得列联表为:合计641680101020合计7426100(3)根据列联表中的数据可得,因为根据临界值表可知,有的把握认为该市一天空气中浓度与浓度有关5(2020年新高考全国卷数学)为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了天空气中的和浓度(单位:),得下表:(1)估计事件“该市一天空气中浓度不超过,且浓度不超过”的概率;(2)根据所给数据,完成下面的列联表:(3)根据(2)中的列联表,判断是否有的把握认为该市一天空气中浓度与浓度有关?附:,【答案】(1);(2)答案见【解析】;(3)有【解析】:(1)由表格可知,该市100天中,空气中的浓度不
28、超过75,且浓度不超过150的天数有天,所以该市一天中,空气中的浓度不超过75,且浓度不超过150的概率为;(2)由所给数据,可得列联表为:合计641680101020合计7426100(3)根据列联表中的数据可得,因为根据临界值表可知,有的把握认为该市一天空气中浓度与浓度有关考点05 概率统计综合应用1(2023年新高考全国卷)甲、乙两人投篮,每次由其中一人投篮,规则如下:若命中则此人继续投篮,若末命中则换为对方投篮无论之前投篮情况如何,甲每次投篮的命中率均为0.6,乙每次投篮的命中率均为0.8由抽签确定第1次投篮的人选,第1次投篮的人是甲、乙的概率各为0.5(1)求第2次投篮的人是乙的概率
29、;(2)求第次投篮的人是甲的概率;(3)已知:若随机变量服从两点分布,且,则记前次(即从第1次到第次投篮)中甲投篮的次数为,求【答案】(1)(2)(3)【解析】:(1)记“第次投篮的人是甲”为事件,“第次投篮的人是乙”为事件,所以,.(2)设,依题可知,则,即,构造等比数列,设,解得,则,又,所以是首项为,公比为的等比数列,即(3)因为,所以当时,故2(2023年新课标全国卷)某研究小组经过研究发现某种疾病的患病者与未患病者的某项医学指标有明显差异,经过大量调查,得到如下的患病者和未患病者该指标的频率分布直方图:利用该指标制定一个检测标准,需要确定临界值c,将该指标大于c的人判定为阳性,小于或
30、等于c的人判定为阴性此检测标准的漏诊率是将患病者判定为阴性的概率,记为;误诊率是将未患病者判定为阳性的概率,记为假设数据在组内均匀分布,以事件发生的频率作为相应事件发生的概率(1)当漏诊率时,求临界值c和误诊率;(2)设函数,当时,求的【解析】式,并求在区间的最小值【答案】(1),;(2),最小值为【分析】(1)根据题意由第一个图可先求出,再根据第二个图求出的矩形面积即可解出;(2)根据题意确定分段点,即可得出的【解析】式,再根据分段函数的最值求法即可解出【解析】:(1)依题可知,左边图形第一个小矩形的面积为,所以,所以,解得:,(2)当时, ;当时, , 故,所以在区间的最小值为3(2021
31、年新高考全国卷第21题)一种微生物群体可以经过自身繁殖不断生存下来,设一个这种微生物为第0代,经过一次繁殖后为第1代,再经过一次繁殖后为第2代,该微生物每代繁殖的个数是相互独立的且有相同的分布列,设X表示1个微生物个体繁殖下一代的个数,(1)已知,求;(2)设p表示该种微生物经过多代繁殖后临近灭绝概率,p是关于x的方程:的一个最小正实根,求证:当时,当时,;(3)根据你的理解说明(2)问结论的实际含义【答案】【解析】:(1)(2)设,因为,故,若,则,故,因为,故有两个不同零点,且,且时,;时,;故在,上为增函数,在上为减函数,若,因为在为增函数且,而当时,因为在上为减函数,故,故为的一个最小
32、正实根,若,因为且在上为减函数,故1为的一个最小正实根,综上,若,则若,则,故此时,故有两个不同零点,且,且时,;时,;故在,上为增函数,在上为减函数,而,故,又,故在存在一个零点,且所以为的一个最小正实根,此时,故当时,(3)意义:每一个该种微生物繁殖后代的平均数不超过1,则若干代必然灭绝,若繁殖后代的平均数超过1,则若干代后被灭绝的概率小于14(2019全国理第21题)为治疗某种疾病,研制了甲、乙两种新药,希望知道哪种新药更有效,为此进行动物试验试验方案如下:每一轮选取两只白鼠对药效进行对比试验对于两只白鼠,随机选一只施以甲药,另一只施以乙药一轮的治疗结果得出后,再安排下一轮试验当其中一种
33、药治愈的白鼠比另一种药治愈的白鼠多4只时,就停止试验,并认为治愈只数多的药更有效为了方便描述问题,约定,对于每轮试验,若施以甲药的白鼠治愈且施以乙药的白鼠未治愈则甲药得1分,乙药得1分;若施以乙药的白鼠治愈且施以甲药的白鼠未治愈则乙药得1分,甲药得1分;若都治愈或都未治愈则两种药均得0分甲、乙两种药的治愈率分别记为和,一轮试验中甲药的得分记为X(1)求X的分布列;(2)若甲药、乙药在试验开始时都赋予4分,表示“甲药的累计得分为时,最终认为甲药比乙药更有效”的概率,则(),其中,假设,(i)证明:为等比数列;(ii)求,并根据的值解释这种试验方案的合理性【答案】【解析】(1)解:X的所有可能取值为,所以的分布列为X 01P(2)(i)由(1)得因此,故,即又因为,所以为公比为4,首项为的等比数列(ii)由(i)可得.由于,故,所以表示最终认为甲药更有效的概率,由计算结果可以看出,在甲药治愈率为0.5,乙药治愈率为0.8时,认为甲药更有效的概率为,此时得出错误结论的概率非常小,说明这种试验方案合