1、第九章概率、统计与统计案例第四节 概率与统计的综合问题考点一 概率与频率分布直方图的综合应用例 为了调查某省高中男生身高情况,现从某校高三年级男生中随机抽取 50 名测量身高,测量发现被测学生身高全部介于 157.5 cm 和 187.5 cm 之间,将测量结果按如下方式分成 6 组:第一组157.5,162.5),第二组162.5,167.5),第六组182.5,187.5,下图是按照上述分组方法得到的频率分布直方图(1)求该学校高三年级男生的平均身高;(2)利用分层抽样的方式,从这 50 名男生中抽出 20 人,求抽出的这 20 人中,身高在177.5 cm 以上(含 177.5 cm)的
2、人数;(3)从(2)中选出的身高在 177.5 cm 以上(含 177.5 cm)的男生中任意抽取 2 人,求此 2人来自于不同组的概率解析(1)由直方图可知该校高三年级男生的平均身高为 1600.11650.21700.31750.21800.11850.1171.5(cm)(2)由频率分布直方图知,后两组的频率和为 0.2,人数为 0.25010,即这 50 名男生身高在 177.5 cm 以上(含 177.5 cm)的人数为 10,故抽出的 20 人中身高在 177.5 cm以上(含 177.5 cm)的人数为 4.(3)由(2)知,身高在 177.5 cm 以上(含 177.5 cm)
3、的 4 人中有 2 人来自177.5,182.5),记作 A1,A2,另外 2 人来自182.5,187.5,记作 B1,B2,从中选出 2 人共有(A1,A2),(A1,B1),(A1,B2),(A2,B1),(A2,B2),(B1,B2),6个基本事件其中有 4 种情况来自不同组,从而所求概率 P23.破题技法 破解概率与统计图表综合问题的 3 步骤学校将高二年级某班级 50 位同学期中考试的数学成绩(均为整数)分为 7 组进行统计,得到如图所示的频率分布直方图观察图中信息,回答下列问题(1)试估计该班级同学数学成绩的平均分;(2)现准备从该班级数学成绩不低于 130 分的同学中随机选出两
4、人参加某活动,求选出的两人在同一组的频率解析:(1)由频率分布直方图可知,所求数学成绩的平均分为 850.06950.11050.241150.281250.21350.081450.04113.6,故该班级同学数学成绩的平均分约为 113.6.(2)由频率分布直方图可知,数学成绩不低于 130 分的人数为 500.08500.04426,其中,分数在130,140)的有 4 人,分别记作 a,b,c,d,分数在140,150的有 2 人,分别记作 m,n.从该班级数学成绩不低于 130 分的同学中选出 2 人共有 15 个基本事件,列举如下:ab,ac,ad,am,an,bc,bd,bm,b
5、n,cd,cm,cn,dm,dn,mn.其中,选出的两人在同一组的有 7 个基本事件,分别是:ab,ac,ad,bc,bd,cd,mn.故选出的两人在同一组的概率 P 715.考点二 概率与茎叶图及数字特征综合例(2020太原八校联考)为了解甲、乙两个快递公司的工作状况,假设同一个公司快递员的工作状况基本相同,现从甲、乙两公司各随机抽取一名快递员,并从两人某月(30 天)的快递件数记录结果中随机抽取 10 天的数据,制图如下:每名快递员完成一件货物投递可获得的劳务费情况如下:甲公司规定每件 4.5 元;乙公司规定每天 35 件以内(含 35 件)的部分每件 4 元,超出35 件的部分每件 7
6、元(1)根据图中数据写出甲公司员工 A 在这 10 天投递的快递件数的平均数和众数;(2)为了解乙公司员工 B 每天所得劳务费的情况,从这 10 天中随机抽取 1 天,他所得的劳务费记为 X(单位:元),求 X182 的概率;(3)根据图中数据估算两公司的每位员工在该月所得的劳务费解析(1)甲公司员工 A 在这 10 天投递的快递件数的平均数为 110(32333338353639334140)36,众数为 33.(2)设 a 为乙公司员工 B 每天的投递件数,则当 a35 时,X140,当 a35 时,X354(a35)7,令 X354(a35)7182,得 a41,则 a 的取值为 44,
7、42,所以 X182 的概率 P 41025.(3)根据题图中数据,可估算甲公司的每位员工该月所得劳务费为 4.536304 860(元),易知乙公司员工 B 每天所得劳务费 X 的可能取值为 136,147,154,189,203,所以乙公司的每位员工该月所得劳务费约为 110(136147315421893203)30165.5304 965(元)破题技法 本题主要考查概率与数字特征,涉及频率分布直方图,平均数、中位数、分层抽样、古典概型的概率计算等知识解决此类问题的关键是正确理解图表中各个量的意义,牢记相关定义和公式,在利用频率分布直方图求平均值时,不要与求中位数,众数混淆(2020唐山
8、五校联考)某篮球队在本赛季已结束的 8 场比赛中,队员甲得分统计的茎叶图如下:(1)求甲在比赛中得分的均值和方差;(2)从甲比赛得分在 20 分以下的 6 场比赛中随机抽取 2 场进行失误分析,求抽到 2 场都不超过均值的概率解析:(1)甲在比赛中得分的均值x18(78101517192123)15,方差s218(8)2(7)2(5)2022242628232.25.(2)甲得分在 20 分以下的 6 场比赛分别为:7,8,10,15,17,19.从中随机抽取 2 场,这 2 场比赛的得分如下:(7,8),(7,10),(7,15),(7,17),(7,19),(8,10),(8,15),(8
9、,17),(8,19),(10,15),(10,17),(10,19),(15,17),(15,19),(17,19),共 15 种,其中抽到 2 场都不超过均值的情形是:(7,8),(7,10),(7,15),(8,10),(8,15),(10,15),共 6 种,所以所求概率 P 61525.考点三 概率与回归分析的综合例 某商店为了更好地规划某种商品进货的量,该商店从某一年的销售数据中,随机抽取了 8 组数据作为研究对象,如下表所示(x(吨)为该商品进货量,y(天)为销售天数):x/吨234568911y/天12334568(1)根据上表数据在网格中绘制散点图;(2)根据上表提供的数据,
10、求出 y 关于 x 的线性回归方程 ybxa;(3)在该商品进货量 x(吨)不超过 6(吨)的前提下任取 2 个值,求该商品进货量 x(吨)恰有一个值不超过 3(吨)的概率参考公式和数据:bni1(xix)(yiy)ni1(xix)2,aybx.8i1x2i356,8i1xiyi241.解析(1)散点图如图所示:(2)依题意,得x18(234568911)6,y18(12334568)4,b8i1(xix)(yiy)8i1(xix)28i1xiyi8xy8i1x2i8x2 241864356862 4968,a4496861134,y 关于 x 的线性回归方程为 y4968x1134.(3)由
11、题意知,该商品进货量不超过 6 吨的共有 5 个,从小到大依次设编号为 1,2,3,4,5 号,任取 2 个有(1,2)(1,3)(1,4)(1,5)(2,3)(2,4)(2,5)(3,4)(3,5)(4,5),共 10 种情况,该商品进货量不超过 3 吨的是编号 1,2 号,超过 3 吨的是编号 3,4,5 号,该商品进货量恰有一次不超过 3 吨的有(1,3)(1,4)(1,5)(2,3)(2,4)(2,5),共 6 种情况,故该商品进货量恰有一次不超过 3 吨的概率为 P 61035.破题技法 回归分析是重要的统计思想与分析方法,与概率结合,是对回归分析总体的一个补充与印证最近青少年的视力
12、健康问题引起习主席的高度重视,某地区为了解当地 24 所小学,24 所初中和 12 所高中的学生的视力状况,准备采用分层抽样的方法从这些学校中随机抽取 5 所学校对学生进行视力调查(1)若从所抽取的 5 所学校中再随机抽取 3 所学校进行问卷调查,求抽到的这 3 所学校中,小学、初中、高中分别有一所的概率;(2)若某小学被抽中,调查得到了该小学前五个年级近视率 y 的数据如下表:年级号 x12345近视率 y 0.05 0.09 0.16 0.20 0.25根据前五个年级的数据,利用最小二乘法求出 y 关于 x 的线性回归方程,并根据方程预测六年级学生的近视率附:回归直线 ybxa 的斜率和截
13、距的最小二乘法,估计公式分别为 bni1xiyinxyni1x2inx2,aybx.参考数据:5i1xiyi2.76,5i1x2i55.解析:(1)由 242412221,得抽取的 5 所学校中有 2 所小学、2 所初中、1所高中,分别设为 a1,a2,b1,b2,c,从这 5 所学校中随机抽取 3 所学校的所有基本事件为(a1,a2,b1),(a1,a2,b2),(a1,a2,c),(a1,b1,b2),(a1,b1,c),(a1,b2,c),(a2,b1,b2),(a2,b1,c),(a2,b2,c),(b1,b2,c),共 10 种,设事件 A 表示“抽到的这 3 所学校中,小学、初中、
14、高中分别有一所”,则事件 A包含的基本事件为(a1,b1,c),(a1,b2,c),(a2,b1,c),(a2,b2,c),共 4 种,故P(A)41025.(2)由题中表格数据得x3,y0.15,nxy2.25,5x245,且由参考数据:5i1xiyi2.76,5i1x2i55,得 b2.762.255545 0.051,a0.150.05130.003,得线性回归方程为 y0.051x0.003.当 x6 时,代入得 y0.05160.0030.303,所以六年级学生的近视率在 0.303 左右考点四 概率与独立性检验综合例 2019 年全国“两会”,即中华人民共和国第十三届全国人大二次会
15、议和中国人民政治协商会议第十三届全国委员会第二次会议,分别于 2019 年 3 月 5 日和 3 月 3日在北京召开为了了解哪些人更关注“两会”,某机构随机抽取了年龄在 1575岁之间的 200 人进行调查,并按年龄绘制的频率分布直方图如图所示,把年龄落在区间15,35)和35,75内的人分别称为“青少年人”和“中老年人”经统计“青少年人”和“中老年人”的人数之比为 1921.其中“青少年人”中有 40 人关注“两会”,“中老年人”中关注“两会”和不关注“两会”的人数之比是 21.(1)求图中 a,b 的值;(2)现采用分层抽样的方法在25,35)和45,55)中随机抽取 8 名代表,从 8
16、人中任选2 人,求 2 人中至少有 1 个是“中老年人”的概率;(3)根据已知条件,完成下面的 22 列联表,并根据此统计结果判断:能否有 99.9%的把握认为“中老年人”比“青少年人”更加关注“两会”.关注不关注合计青少年人中老年人合计解析(1)由题意得(b0.03)101940,(a0.02)102140,解得a0.032 5,b0.017 5.(2)由题意得在25,35)中抽取 6 人,记为 A,B,C,D,E,F,在45,55)中抽取 2人,记为 1,2.则从 8 人中任取 2 人的全部基本事件(共 28 种)列举如下:AB,AC,AD,AE,AF,A1,A2,BC,BD,BE,BF,
17、B1,B2,CD,CE,CF,C1,C2,DE,DF,D1,D2,EF,E1,E2,F1,F2,12,记 2 人中至少有 1 个是“中老年人”为事件 A,则 P(A)1328.(3)22 列联表如下:关注不关注合计青少年人405595中老年人7035105合计110902002200(40355570)2951051109012.15710.828,所以有 99.9%的把握认为“中老年人”比“青少年人”更加关注“两会”破题技法 样本中的两个分类变量所提供的数据除了可以进行独立性检验之外,也可以具有某种特性的某事件的概率对总体作进一步的分析(2020湖南郴州第三次质量检测)某市环保部门对该市市民
18、进行了一次垃圾分类知识的网络问卷调查,每位市民仅有一次参加机会,通过随机抽样,得到参与问卷调查的100 人的得分(满分:100 分)数据,统计结果如下表所示组别 40,50)50,60)60,70)70,80)80,90)90,00男235151812女051010713(1)若规定问卷得分不低于 70 分的市民称为“环保关注者”,请完成下面的 22 列联表,并判断能否在犯错误概率不超过 0.05 的前提下,认为是不是“环保关注者”与性别有关;非“环保关注者”是“环保关注者”合计男女合计(2)若问卷得分不低于 80 分的人称为“环保达人”现在从本次调查的“环保达人”中利用分层抽样的方法随机抽取
19、 5 名市民参与环保知识问答,再从这 5 名市民中抽取2 人参与座谈会,求抽取的 2 名市民中,既有男“环保达人”又有女“环保达人”的概率附表及公式:2n(adbc)2(ab)(cd)(ac)(bd),nabcd,P(2k0)0.150.100.05 0.025 0.010 0.005 0.001k02.072 2.706 3.841 5.024 6.635 7.879 10.828解析:(1)22 列联表如下:非“环保关注者”是“环保关注者”合计男104555女153045合计2575100将 22 列联表中的数据代入公式计算得2100(30104515)2257555453.033.841,所以在犯错误的概率不超过 0.05 的前提下,不能认为是不是“环保关注者”与性别有关(2)由题可知,利用分层抽样的方法抽得男“环保达人”3 人,女“环保达人”2 人设 3 个男“环保达人”分别为 A,B,C;2 个女“环保达人”分别为 D,E.从中抽取 2 人的所有情况为(AB),(AC),(AD),(AE),(BC),(BD),(BE),(CD),(CE),(DE),共 10 种情况既有男“环保达人”又有“女环保达人”的情况有(AD),(AE),(BD),(BE),(CD),(CE),共 6 种情况故所求概率 P 61035.课时规范练