1、专题七 概率与统计 题型 1 概率与统计概率与统计的综合题,自从 2005 年走进新高考试题后,就以崭新的姿态,在高考中占有极其重要的地位,每年出现一道大题(都有一定的命题背景,其地位相当于原来的应用题).连续五年都为一题多问,前面考统计,后面考概率,预计这一趋势在全国高考中会得到延续!例 1:(2016 年新课标)某公司计划购买2 台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个 200 元.在机器使用期间,如果备件不足再购买,则每个 500 元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了 100 台这种机器在三年使用期
2、内更换的易损零件数,得下面柱状图 7-1:图 7-1以这 100 台机器更换的易损零件数的频率代替 1 台机器更换的易损零件数发生的概率,记 X 表示 2 台机器三年内共需更换的易损零件数,n 表示购买 2 台机器的同时购买的易损零件数.(1)求 X 的分布列;(2)若要求 P(Xn)0.5,确定 n 的最小值;(3)以购买易损零件所需费用的期望值为决策依据,在 n19 与 n20 之中选其一,应选用哪个?解:(1)由柱状图并以频率代替概率可得,一台机器在三年内需更换的易损零件数为 8,9,10,11 的概率分别为 0.2,0.4,0.2,0.2,从而P(X16)0.20.20.04;P(X1
3、7)20.20.40.16;P(X18)20.20.20.40.40.24;P(X19)20.20.220.40.20.24;P(X20)20.20.40.20.20.2;X16171819202122P0.040.160.240.240.20.080.04P(X21)20.20.20.08;P(X22)0.20.20.04.所以 X 的分布列为:(2)由(1)知,P(X18)0.44,P(X19)0.68,P(Xn)0.5 中,n 的最小值为 19.(3)记 Y 表示 2 台机器在购买易损零件上所需的费用(单位:元).当n19时,E(Y)192005000.210000.0815000.04
4、4040.当 n20 时,E(Y)202005000.0810000.044080.可知当 n19 时所需费用的期望值小于 n20 时所需费用的期望值,故应选 n19.【名师点评】(1)高考中经常以统计图的形式显示相关的数据信息,以统计图为载体来考查概率的相关问题.本小题主要考 查频率分布直方图、概率、期望等概念和用样本频率估计总体 分布的统计方法,考查运用概率统计知识解决实际问题的能力;(2)散点图与线性回归方程的有关知识,是高考考试的重要知识点,因此是高考命题的一种重要题型,要注意熟练掌握.统计问题最容易出错的两个方面:公式记错、计算出错!学期 x123456总分 y/分512518523
5、528534535【互动探究】1.为建立健全国家学生体质健康监测评价机制,激励学生积极参加身体锻炼,教育部印发国家学生体质健康标准(2014年修订),要求各学校每学期开展覆盖本校各年级学生的标准测试工作,并根据学生每个学期总分评定等级.某校决定针对高中学生,每学期进行一次体质健康测试,以下是小明同学六个学期体质健康测试的总分情况.(1)请根据上表提供的数据,用相关系数 r 说明 y 与 x 的线性相关程度,并用最小二乘法求出 y 关于 x 的线性回归方程(线性相关系数保留两位小数);(2)在第六个学期测试中学校根据标准,划定 540 分以上为优秀等级,已知小明所在的学习小组 10 个同学有 6
6、 个被评定为优秀,测试后同学们都知道了自己的总分但不知道别人的总分,小明随机的给小组内 4 个同学打电话询问对方成绩,优秀的同学有 X 人,求 X 的分布列和期望.参考公式:b121()()()niiiniixxyyxx,a yb x;相关系数 r12211()()()()niiinniiiixxyyxxyy;参考数据:721084.91,61(i xi x)(yi y)84.综上所述,y 与 x 的线性相关程度较高.解:(1)由表中数据计算,得 x3.5,y525,61(i xi x)217.5,61(i yi y)2412,r6162211()()()()iiiniiiixxyyxxyy8
7、417.54120.990.75.又b61621()()()iiiiixxyyxx 8417.54.8,a5253.54.8508.2.故所求线性回归方程为y4.8x508.2.(2)X 服从超几何分布,所有可能取值为 1,2,3,4,P(Xk)Ck6C4k3C49(k1,2,3,4).X 的分布列为:X1234P1215141021542期望 E(X)1 1212 514310214 54283.题型 2 离散型随机变量的期望与方差随机变量的分布列与数学期望紧密相连,只有知道随机变量的分布列,才能够计算出随机变量的数学期望,它们之间是层层递进的关系.因此,这类试题经常是以两个小题的形式出现,
8、第一问是为第二问作铺垫的.产假安排(单位:周)1415161718有生育意愿家庭数48162026例 2:自2016 年 1 月 1 日起,我国全面二孩政策正式实施,这次人口与生育政策的历史性调整,使得“要不要再生一个”“生二孩能休多久产假”等成为千千万万个家庭在生育决策上避不开的话题.为了解针对产假的不同安排方案形成的生育意愿,某调查机构随机抽取了 200 户有生育二胎能力的适龄家庭进行问卷调查,得到如下数据:(1)若用表中数据所得的频率代替概率,面对产假为 14 周与 16 周,估计某家庭有生育意愿的概率分别为多少?(2)假设从 5 种不同安排方案中,随机抽取 2 种不同安排分别作为备选方
9、案,然后由单位根据单位情况自主选择.求两种安排方案休假周数和不低于 32 周的概率;如果用表示两种方案休假周数和,求随机变量的分布列及期望.解:(1)由表中信息可知,当产假为 14 周时某家庭有生育意愿的概率为 p1 4200 150;当产假为 16 周时某家庭有生育意愿的概率为 p2 16200 225.(2)设“两种安排方案休假周数和不低于32周”为事件A,由已知从 5 种不同安排方案中,随机地抽取 2 种方案选法共有C2510(种),其和不低于 32 周的选法有(14,18),(15,17),(15,18),(16,17),(16,18),(17,18),共 6 种,由古典概型概率计算公
10、式,得 P(A)61035.由题知随机变量的可能取值为 29,30,31,32,33,34,35.P(29)1100.1,P(30)1100.1,P(31)2100.2,P(32)2100.2,P(33)2100.2,P(34)1100.1,P(35)1100.1.29303132333435P0.10.10.20.20.20.10.1因而的分布列为:所以 E()290.1300.1310.2320.2330.2340.1350.132.【规律方法】(1)会用频率估计概率,然后把问题转化为互斥事件的概率;(2)首先确定 X 的取值,然后确定有关概率,注意运用对立事件、相互独立事件的概率公式进行
11、计算,列出分布列后即可计算数学期望.(3)离散型随机变量分布列的性质p1p2pn1,这条性质是我们检验分布列是否正确最有效的工具,希望同学们在求分布列时尽量将每个变量的概率求出,而不要偷懒,否则将失去自我检查的机会.消费金额(单位:元)(0,200(200,400(400,600(600,800(800,1000购物单张数252530【互动探究】2.某大型商场去年国庆期间累计生成 2 万张购物单,从中随机抽出 100 张,对每单消费金额进行统计得到下表:由于工作人员失误,后两栏数据无法辨识,但当时记录表明,根据由以上数据绘制成的频率分布直方图所估计出的每单消费额的中位数与平均数恰好相等.用频率
12、估计概率,完成下列问题:(1)估计去年国庆期间该商场累计生成的购物单中,单笔消费额超过 800 元的概率;(2)为鼓励顾客消费,该商场计划在今年国庆期间进行促销活动,凡单笔消费超过 600 元者,可抽奖一次.抽奖规则为:从装有大小材质完全相同的 5 个红球和 5 个黑球的不透明口袋中,随机摸出 4 个小球,并记录两种颜色小球的数量差的绝对值 X,当 X4,2,0 时,消费者可分别获得价值 500 元、200 元和 100元的购物券.求参与抽奖的消费者获得购物券的价值的数学期望.解:(1)因消费额在区间(0,400的频率为 0.5,故中位数估计值为 400.设所求概率为 p,而消费额在(0,60
13、0的概率为 0.8.故消费额在区间(600,800内的概率为 0.2p.因此消费额的平均值可估计为 1000.25 3000.25 5000.3700(0.2p)900p.令其与中位数 400 相等,解得 p0.05.(2)根据题意,得 P(X4)C45C45C410 121,P(X2)C15C35C35C15C4101021,P(X0)C25C25C410 1021.设抽奖顾客获得的购物券价值为 Y,则 Y 的分布列为:X420Y500200100P12110211021故 E(Y)500 121200102110010215003(元).题型 3 独立性检验独立性检验是新课标增加的内容,高
14、考试卷多次以解答题形式考查,体现新课程的理念,因此我们在备考时也应该引起足够的重视.例 3:(2017 年新课标)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了 100 个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如图 7-2:图 7-2养殖法箱产量50 kg箱产量50 kg旧养殖法新养殖法(1)设两种养殖方法的箱产量相互独立,记 A 表示事件“旧养殖法的箱产量低于 50 kg,新养殖法的箱产量不低于 50 kg”,估计 A 的概率;(2)填写下面列联表,并根据列联表判断是否有 99%的把握认为箱产量与养殖方法有关:(3)根据箱产量的频率分布直方图,求
15、新养殖法箱产量的中位数的估计值(精确到 0.01).P(K2k)0.050 0.010 0.001 k3.8416.63510.828附:K2nadbc2abcdacbd解:(1)记 B 表示事件“旧养殖法的箱产量低于 50 kg”,C 表示事件“新养殖法的箱产量不低于 50 kg”,由题意知 P(A)P(BC)P(B)P(C),旧养殖法的箱产量低于 50 kg 的频率为(0.012 0.014 0.0240.0340.040)50.62,故 P(B)0.62.新养殖法的箱产量不低于 50 kg 的频率为(0.0680.0460.0100.008)50.66,故 P(C)0.66.因此,事件
16、A 的概率估计值为 0.620.660.4092.养殖法箱产量6.635,故有 99%的把握认为箱产量与养殖方法有关.K22006266343821001009610415.705.(3)因为新养殖法的箱产量频率分布直方图中,箱产量低于50 kg 的直方图面积为(0.0040.0200.044)50.340.5,故新养殖法箱产量的中位数的估计值为 500.50.340.06852.35(kg).【规律方法】(1)本题是独立性检验问题,关键是由22列联表确定 a,b,c,d,n 的值.高考对独立性检验这部分的要求是:了解独立性检验(只要求 22 列联表)的基本思想、方法 及其简单应用.在复习中,
17、不可小视.(2)利用公式K2计算要准确,近似计算要精确到小数点后三位,可选择满足条件P(K2k0)a的k0作为拒绝域的临界值.nadbc2abcdacbd年龄15,25)25,35)35,45)45,55)55,65支持“延迟退休”的人数155152817【互动探究】3.中央政府为了应对因人口老龄化而造成的劳动力短缺等问题,拟定出台“延迟退休年龄政策”.为了解人们对“延迟退休年龄政策”的态度,责成人社部进行调研.人社部从网上年龄在 1565 岁的人群中随机调查 100 人,调查数据的频率分布直方图和支持“延迟退休”的人数与年龄的统计结果如下:图 7-3(1)由以上统计数据填 22 列联表,并判
18、断能否在犯错误的概率不超过 0.05 的前提下认为以 45 岁为分界点的不同人群对“延迟退休年龄政策”的支持度有差异;年龄45 岁以下45 岁以上总计支持不支持总计(2)若以 45 岁为分界点,从不支持“延迟退休”的人中按分层抽样的方法抽取 8 人参加某项活动.现从这 8 人中随机抽 2人.抽到 1 人是 45 岁以下时,求抽到的另一人是 45 岁以上的概率;P(K2k0)0.100 0.050 0.010 0.001 k0 2.706 3.841 6.635 10.828 记抽到 45 岁以上的人数为 X,求随机变量 X 的分布列及数学期望.参考数据:K2nadbc2abcdacbd,其中
19、nabcd.45 岁以下45 岁以上总计支持354580不支持15520总计5050100解:由频率分布直方图知 45 岁以下与 45 岁以上各 50 人,故填充 22 列联表如下:因为 K2 的观测值 k10035545152505080206.253.841,所以在犯错误的概率不超过 0.05 的前提下认为以 45 岁为分界点的不同人群对“延迟退休年龄政策”有差异.从不支持“延迟退休”的人中抽取 8 人,则 45 岁以下的应抽 6 人,45 岁以上的应抽 2 人.(2)抽到 1 人是 45 岁以下的概率为6834,抽到 1 人是 45岁以下且另一人是 45 岁以上的概率为C16C12C28 37,故所求概率p373447.所以 X 的可能取值为 0,1,2,故随机变量 X 的分布列为:P(X0)C26C281528,P(X1)C16C12C28 37,P(X2)C22C28 128.X012P152837128所以 E(X)1372 12812.