1、11.3概率与统计的综合问题题型一抽样与古典概型例1某高校在2021年的自主招生考试成绩中随机抽取100名中学生的笔试成绩,按成绩分组,得到的频率分布表如下所示组号分组频数频率第1组160,165)50.050第2组165,170)0.350第3组170,175)30第4组175,180)200.200第5组180,185)100.100合计1001.00(1)请先求出频率分布表中,位置的相应数据,再完成频率分布直方图;(2)为了能选拔出最优秀的学生,高校决定在笔试成绩高的第3,4,5组中用分层抽样的方法抽取6名学生进入第二轮面试,求第3,4,5组每组各抽取多少名学生进入第二轮面试;(3)在(
2、2)的前提下,学校决定在6名学生中随机抽取2名学生接受考官A的面试,求第4组至少有一名学生被考官A面试的概率解(1)由题可知,第2组的频数为0.35010035,第3组的频率为0.300,频率分布直方图如图所示,(2)因为第3,4,5组共有60名学生,所以利用分层抽样的方法在60名学生中抽取6名学生进入第二轮面试,每组抽取的人数分别为第3组:63(人),第4组:62(人),第5组:61(人),所以第3,4,5组分别抽取3人,2人,1人进入第二轮面试(3)设第3组的3位同学为A1,A2,A3,第4组的2位同学为B1,B2,第5组的1位同学为C1,则从这六位同学中抽取两位同学有(A1,A2),(A
3、1,A3),(A1,B1),(A1,B2),(A1,C1),(A2,A3),(A2,B1),(A2,B2),(A2,C1),(A3,B1),(A3,B2),(A3,C1),(B1,B2),(B1,C1),(B2,C1),共15种情况,其中第4组的2位同学B1,B2中至少有一位同学入选的有(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2),(B1,C1),(B2,C1),共有9种情况,所以第4组至少有一名学生被考官A面试的概率为.【教师备选】某市宣传部门为了解全民利用“学习强国”了解国家动态的情况,从全市抽取2 000名人员进行调查,统
4、计他们每周利用“学习强国”学习的时长,如图是根据调查结果绘制的频率分布直方图(1)试估计被抽查人员利用“学习强国”学习的平均时长和中位数;(2)宣传部为了解大家利用“学习强国”学习的具体情况,准备采用分层抽样的方法从学习时长在8,10)和10,12)内的人中选取50人了解情况,则应从两组中各选取多少人?再利用分层抽样的方法从选取的50人中选5人参加一个座谈会,现从参加座谈会的5人中随机选取2人发言,求学习时长在10,12)内的人中至少有1人发言的概率解(1)设被抽查人员利用“学习强国”学习的平均时长为,中位数为y,则0.0510.130.2550.370.1590.1110.05136.8,0
5、050.10.250.15(y6)0.5,解得y,所以估计被抽查人员利用“学习强国”学习的平均时长为6.8,中位数为.(2)学习时长在8,10)内的人数为2 0000.15300,设选取的人数为a.学习时长在10,12)内的人数为2 0000.1200,设选取的人数为b.则,解得a30,b20,所以应从学习时长在8,10)和10,12)内的人中分别选取30人和20人若再从这50人中选取5人,则从学习时长在8,10)内的人中选取3人,标记为A1,A2,A3,从学习时长在10,12)内的人中选取2人,标记为B1,B2.现从这5人中随机选取2人,则共有(A1,A2),(A1,A3),(A1,B1),
6、(A1,B2),(A2,A3),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2)10个基本事件,其中事件“从学习时长在10,12)内的人中至少选取1人”包含7个基本事件故学习时长在10,12)内的人中至少有1人发言的概率为.思维升华解决抽样与古典概型的综合问题的方法(1)定数,利用统计知识确定频数;(2)定型,根据事件“有限性和等可能性”判断是否为古典概型;(3)定性,由题意用列举的方法确定事件的基本事件数;(4)代入公式求解跟踪训练1教育部关于落实主体责任强化校园食品安全管理的指导意见指出:非寄宿制中小学、幼儿园原则上不得在校内设置食品小卖部、超市,已经设置的,
7、要逐步退出为了了解学生对校内开设小卖部的意见,某校对65名住校生30天内在小卖部消费过的天数进行了统计,情况如下:天数5,10)10,15)15,20)20,25)25,30人数4718927(1)用分层抽样的方法在消费天数不低于15天的住校生中选择6人进行意见调查,分别求其中消费天数在区间15,20),20,25),25,30内的人数;(2)从(1)中选择的6人中任意抽取2人对取消校内小卖部给出具体意见,求这2人消费天数均在25,30内的概率解(1)消费天数不低于15天的住校生共有1892754(人),所以抽样比为,消费天数在区间15,20)内的人数为182,消费天数在区间20,25)内的人
8、数为91,消费天数在区间25,30内的人数为273.(2)分别记6名消费天数在区间15,20),20,25),25,30内的住校生为a1,a2,b,c1,c2,c3,从中任取2人有(a1,a2),(a1,b),(a1,c1),(a1,c2),(a1,c3),(a2,b),(a2,c1),(a2,c2),(a2,c3),(b,c1),(b,c2),(b,c3),(c1,c2),(c1,c3),(c2,c3)共15种情况,其中这2人消费天数均在25,30内的有(c1,c2),(c1,c3),(c2,c3)共3种情况,故这2人消费天数均在25,30内的概率为.题型二茎叶图与概率的综合例2(2022鹰
9、潭模拟)第24届冬季奥林匹克运动会于2022年2月在中国北京举行为迎接此次冬奥会,北京市组织大学生开展冬奥会志愿者的培训活动,并在培训结束后统一进行了一次考核为了了解本次培训活动的效果,从A,B两所大学各随机抽取10名学生的考核成绩,并作出如图所示的茎叶图(1)计算A,B两所大学学生的考核成绩的平均值;(2)由茎叶图判断A,B两所大学学生考核成绩的稳定性;(不用计算)(3)将学生的考核成绩分为两个等级,如下表所示现从样本考核等级为优秀的学生中任取2人,求2人来自同一所大学的概率考核成绩60,8586,100考核等级合格优秀解(1)A80,B80.(2)由茎叶图可知,A所大学学生的成绩比B所大学
10、学生的成绩稳定(3)记事件M为“从样本考核等级为优秀的学生中任取2人,2人来自同一所大学”样本中,A校考核等级为优秀的学生共有3人,分别记为a,b,c,B校考核等级为优秀的学生共有3人,分别记为A,B,C,从这6人中任取2人,所有的基本事件为ab,ac,aA,aB,aC,bc,bA,bB,bC,cA,cB,cC,AB,AC,BC共15个,而事件M包含的基本事件是ab,ac,bc,AB,AC,BC共6个,因此P(M).【教师备选】(2022萍乡模拟)某中学高三共有男生800人,女生1 200人现学校某兴趣小组为研究学生日均消费水平是否与性别有关,采用分层抽样的方式从高三年级抽取男女生若干人记录其
11、日均消费,得到如图所示男生日均消费的茎叶图和女生日均消费的频率分布直方图将所抽取的女生的日均消费分为以下五组:(15,20,(20,25,(25,30,(30,35,(35,40,规定日均消费不超过25元的人为“节俭之星”(1)请完成下面22的列联表;“节俭之星”非“节俭之星”总计男生女生总计根据以上22的列联表,能否有90%的把握认为学生是否为“节俭之星”与性别有关?(2)现已知学校某小组有6名“节俭之星”,其中男生2人,女生4人现从中选取2人在学校做勤俭节约宣讲活动报告,求选取的2人中至少有一名男生的概率附:K2,其中nabcd.P(K2k0)0.150.100.050.0250.010.
12、005k02.0722.7063.8415.0246.6357.829解(1)由茎叶图可知此次抽样男生共20人,由于采用分层抽样的方式,抽取女生为30人依题意,男“节俭之星”共7人,女“节俭之星”共18人,填表如下:“节俭之星”非“节俭之星”总计男生71320女生181230总计252550从而K23.0002.706,故有90%的把握认为学生是否为“节俭之星”与性别有关(2)记2名男生分别为A1,A2,记4名女生分别为B1,B2,B3,B4,则从这6名“节俭之星”选取2名的所有可能有(A1,A2),(A1,B1),(A1,B2),(A1,B3),(A1,B4),(A2,B1),(A2,B2)
13、,(A2,B3),(A2,B4),(B1,B2),(B1,B3),(B1,B4),(B2,B3),(B2,B4),(B3,B4),共15种,其中至少有1名男生的情况有9种,因此,所求概率为P.思维升华在统计中,一些问题可以通过图表获取信息,然后利用这些信息进行计算跟踪训练2(2022安庆模拟)某中学高一年级从甲、乙两个班级各选出7名学生参加学科测试,他们取得的成绩的茎叶图如图,其中甲班学生的平均分是85,乙班学生成绩的中位数是83.(1)求x和y的值,并计算甲班7位学生成绩的方差s2;(2)从成绩在90分以上的学生中随机抽取两名学生,求至少有一名学生是甲班的概率解(1)由题意知85779788
14、080x859296,解得x5.又因为乙班学生成绩的中位数是83,所以y3.s2(7985)2(7885)2(8085)2(8585)2(8585)2(9285)2(9685)240.(2)设甲班成绩在90分以上的学生为A,B,乙班成绩在90分以上的学生为C,D,E.从成绩在90分以上的学生中随机抽取两名学生,共有AB,AC,AD,AE,BC,BD,BE,CD,CE,DE,10种情况,其中至少有一名学生是甲班的学生共有7种情况,记“至少有一名学生是甲班的学生”为事件M,则P(M).题型三频率分布直方图与独立性检验例3(2022齐齐哈尔模拟)已知某体育学校有学生2 000人,其中男生1 200人
15、,女生800人现按性别采用分层抽样的方法抽取了200名学生,并记录他们每天的平均跑步时间(单位:min)得到如下频率分布表:每天平均跑步时间/min频数频率0,20)100.0520,40)m0.2040,60)300.1560,80)500.2580,100)pn100,120100.05合计2001(1)根据频率分布表,求实数m,n,p的值,完成如图所示的频率分布直方图;(2)若在被抽取的200名学生中有100名男生每天的平均跑步时间不低于40 min,完成下列22列联表,能否在犯错误的概率不超过0.001的情况下,认为该学校学生每天的平均跑步时间不低于40 min与性别有关?男生女生总计
16、每天平均跑步时间低于40 min每天平均跑步时间不低于40 min总计附:K2,其中nabcd.P(K2k0)0.150.100.050.0250.010.001k02.0722.7063.8415.0246.63510.828解(1)n10.050.200.150.250.050.30,p2000.3060,m2000.2040,频率分布直方图如图(2)22列联表:男生女生总计每天平均跑步时间低于40 min203050每天平均跑步时间不低于40 min10050150总计12080200所以K211.111,又因为11.11110.828,所以能在犯错误的概率不超过0.001的情况下认为该
17、校学生每天的平均跑步时间不低于40 min与性别有关【教师备选】(2022广元模拟)某中学调查了该校某班全部40名同学参加棋艺社团和武术社团的情况,数据如下表:(单位:人)参加棋艺社团未参加棋艺社团参加武术社团810未参加武术社团715(1)能否有95%的把握认为参加棋艺社团和参加武术社团有关?(2)已知在参加武术社团且未参加棋艺社团的10人中,从2到11进行编号,从中抽取一人先后两次抛掷一枚骰子,出现的点数之和为被抽取的序号,试求抽到6号或7号的概率附:K2,其中nabcd.P(K2k0)0.100.050.025k02.7063.8415.024解(1)由K20.673 4,则K26.63
18、5,有99%的把握认为该企业生产的这种产品的质量指标值与设备改造有关(2)用频率估计概率,1 000件产品中大约有960件合格品,40件不合格品,则获利约为18096010040168 800(元),因此,该企业大约能获利168 800元课时精练1(2022东三省四市联考)在一个文艺比赛中,5名专业人士和5名观众代表各组成一个评委小组,给参赛选手打分下面是两组评委对同一名选手的打分:小组A9295939590小组B9880908597(1)请判断小组A与小组B哪一个更像是由专业人士组成的?(2)若从A组的5位评委中任选2名评委,求其中恰有一位评委打分为95分的概率解(1)由表格数据,知A93,
19、B90,s(xAiA)23.63.841,有95%的把握认为选择“网页制作”选修课与文、理科类别有关(2)由题意得,5名文科同学中有3人做出“选择”,设为A1,A2,A3;有2人“不选择”,设为B1,B2,从中选3人的总体情况有A1A2A3,A1A2B1,A1A2B2,A1A3B1,A1A3B2,A1B1B2,A2A3B1,A2A3B2,A2B1B2,A3B1B2,共10种,至多有1人不选择“网页制作”选修课有7种,概率为P.4近年来,国资委、党委高度重视扶贫开发工作,坚决贯彻落实中央扶贫工作重大决策部署,在各个贫困县全力推进定点扶贫各项工作,取得了积极成效,某贫困县为了响应国家精准扶贫的号召
20、,特地承包了一块土地,已知土地的使用面积以及相应的管理时间的关系如下表所示:土地使用面积x(单位:亩)12345管理时间y(单位:月)810132524并调查了某村300名村民参与管理的意愿,得到的部分数据如下表所示:愿意参与管理不愿意参与管理男性村民15050女性村民50(1)求y关于x的线性回归方程;(计算结果保留两位小数)(2)是否有99.9%的把握认为村民的性别与参与管理的意愿具有相关性?参考公式:,K2,其中nabcd.临界值表:P(K2k0)0.1000.0500.0250.0100.001k02.7063.8415.0246.63510.828解(1)依题意得,3,16,故(xi
21、)(yi)(2)(8)(1)(6)192847,(xi)2411410, 则4.7,164.731.9,所以y关于x的线性回归方程为4.7x1.9.(2)依题意,女性不愿意参与管理的人数为50,计算得K2的观测值为k18.7510.828,故有99.9%的把握认为村民的性别与参与管理的意愿具有相关性5(2022开封模拟)人耳的听力情况可以用电子测听器检测,正常人听力的等级为025 dB(分贝),并规定测试值在区间(0,5为非常优秀,测试值在区间(5,10为优秀某校500名同学参加了听力测试,从中随机抽取了50名同学的测试值作为样本,制成如下频率分布直方图:(1)从总体的500名学生中随机抽取1
22、人,估计其测试值在区间(0,10内的概率;(2)已知样本中听力非常优秀的学生有4人,估计总体中听力为优秀的学生人数;(3)现选出一名同学参加另一项测试,测试规则如下:四个音叉的发音情况不同,由强到弱的编号分别为1,2,3,4.测试前将音叉顺序随机打乱,被测试的同学依次听完后,将四个音叉按发音由强到弱重新排序,所对应的音叉编号分别为a1,a2,a3,a4(其中集合a1,a2,a3,a41,2,3,4)记Y|1a1|2a2|3a3|4a4|,可用Y描述被测试者的听力偏离程度,求Y2的概率解(1)根据频率分布直方图知,样本中测试值在区间(0,10内的频率为1(0.060.080.02)510.80.
23、2,以频率为概率,从总体的500名学生中随机抽取1人,估计其测试值在区间(0,10内的概率为0.2.(2)由(1)知,样本中听力为优秀的学生人数为0.25046,估计总体中听力为优秀的学生人数为50060.(3)当a11时,序号a1,a2,a3,a4的情况为6种,分别记为(1,2,3,4),(1,2,4,3),(1,3,2,4),(1,3,4,2),(1,4,2,3),(1,4,3,2),同理,当a12,3,4时,序号a1,a2,a3,a4的情况也分别为6种,序号a1,a2,a3,a4所有的情况总数为24种当Y0时,a11,a22,a33,a44,当Y|1a1|2a2|3a3|4a4|2时,a1,a2,a3,a4的取值为a11,a22,a34,a43,或a11,a23,a32,a44,或a12,a21,a33,a44,当Y2时,序号a1,a2,a3,a4对应的情况为4种,即P(Y2).