1、7.2 概率、统计与统计案例-2-试题统计 题型 命题规律 复习策略(2013 全国,理 3)(2013 全国,理 14)(2014 全国,理 5)(2015 全国,理 19)(2015 全国,理 3)(2015 全国,理 18)(2016 全国,理 4)(2016 全国,理 18)(2016 全国,理 4)(2016 全国,理 18)(2017 全国,理 2)(2017 全国,理 18)(2017 全国,理 3)选择题填空题解答题 从近五年高考试题来看,高考对概率的考查重点是基本概念和基本公式,如互斥事件的概率、古典概型、几何概型等;高考对统计与统计案例的考查密度小,有增强的趋势,考查的重点
2、有用样本估计总体、回归分析和独立性检验等.抓住考查的主要题目类型进行训练,重点是互斥事件的概率、古典概型、几何概型、用样本估计总体、回归分析、独立性检验等.-3-命题热点一 命题热点二 命题热点三 命题热点四 命题热点五 古典概型的概率【思考】怎样判断一个概率模型是古典概型?如何计算古典概型的基本事件总数?例1(1)4位同学各自在周六、周日两天中任选一天参加公益活动,则周六、周日都有同学参加公益活动的概率为()A.18B.38C.58D.78 答案 解析 解析 关闭(1)(方法一)由题意知基本事件总数为 24=16,对 4 名同学平均分组共有C42A22=3(种),对 4 名同学按 1,3 分
3、组共有C41种,所以周六、周日都有同学参加共有 3 A22+C41A22=14(种).由古典概型得所求概率为1416=78.(方法二)周六没有同学参加公益活动即 4 位同学均在周日参加公益活动,此时只有一种情况;同理周日没有同学参加公益活动也只有一种情况,所以周六、周日均有同学参加公益活动的情况共有16-2=14(种).故所求概率为1416=78.故选 D.答案 解析 关闭D-4-命题热点一 命题热点二 命题热点三 命题热点四 命题热点五(2)将一颗质地均匀的骰子(一种各个面上分别标有1,2,3,4,5,6个点的正方体玩具)先后抛掷2次,则出现向上的点数之和小于10的概率是 .答案 解析 解析
4、 关闭(2)(方法一)将一颗质地均匀的骰子先后抛掷 2 次,共有 36 个基本事件.其中向上的点数之和小于 10 的基本事件共有 30 个,所以所求概率为3036=56.(方法二)将一颗质地均匀的骰子先后抛掷 2 次,共有 36 个基本事件.记 A 表示“向上的点数之和小于 10”,则表示“向上的点数之和不小于 10”,的基本事件共有 6 个,所以 P()=636=16,P(A)=1-P()=56.答案 解析 关闭56 -5-命题热点一 命题热点二 命题热点三 命题热点四 命题热点五 题后反思1.具有以下两个特点的概率模型简称古典概型:(1)试验中所有可能出现的基本事件只有有限个;(2)每个基
5、本事件出现的可能性相等.2.对古典概型的基本事件总数,利用两个计数原理或者排列组合的知识进行计算.-6-命题热点一 命题热点二 命题热点三 命题热点四 命题热点五 对点训练1(1)某冬奥会开幕,在冰壶比赛场馆服务的大学生志愿者中,有2名来自莫斯科国立大学,有4名来自圣彼得堡国立大学,现从这6名志愿者中随机抽取2人,至少有1名志愿者来自莫斯科国立大学的概率是()A.35B.25C.115D.1415 答案 解析 解析 关闭(1)P=1-C42C62=1-615=35.故选 A.答案 解析 关闭A-7-命题热点一 命题热点二 命题热点三 命题热点四 命题热点五(2)三人乘同一列火车,火车有10节车
6、厢,则至少有2人上了同一车厢的概率为()A.29200B.725C.27100D.718 答案 解析 解析 关闭(2)每人选车厢有 10 种情况,则基本事件总数为 101010=1 000,2人上了同一车厢有C32 C101 9=270 种情况,3 人上了同一车厢有 10种情况,故至少有 2 人上了同一车厢的概率为2801 000=725.答案 解析 关闭B-8-命题热点一 命题热点二 命题热点三 命题热点四 命题热点五 几何概型的概率【思考】几何概型有什么特点?解答几何概型问题的关键点是什么?例2(1)(2017全国,理2)如图,正方形ABCD内的图形来自中国古代的太极图.正方形内切圆中的黑
7、色部分和白色部分关于正方形的中心成中心对称.在正方形内随机取一点,则此点取自黑色部分的概率是()A.14B.8C.12D.4 答案 解析 解析 关闭不妨设正方形边长为 2,则圆半径为 1,正方形的面积为 22=4,圆的面积为 12=.由图形的对称性,可知图中黑色部分的面积为圆面积的一半,即12 r2=12,所以此点取自黑色部分的概率为24=8.答案 解析 关闭B-9-命题热点一 命题热点二 命题热点三 命题热点四 命题热点五(2)(2016山东高考)在-1,1上随机地取一个数k,则事件“直线y=kx与圆(x-5)2+y2=9相交”发生的概率为 .答案 解析 解析 关闭直线 y=kx 与圆(x-
8、5)2+y2=9 相交,需要满足圆心到直线的距离小于半径,即 d=|5k|1+k23,解得-34k34,而 k-1,1,所以发生的概率为34-34 2=34.答案 解析 关闭34 -10-命题热点一 命题热点二 命题热点三 命题热点四 命题热点五 题后反思1.几何概型的两个基本特点:(1)无限性:在一次试验中可能出现的结果有无限多个;(2)等可能性:每个试验结果的发生具有等可能性.2.求解几何概型的概率问题的关键点是:一定要正确确定试验的全部结果构成的区域,从而正确选择合理的测度(长度、面积、体积),进而利用概率公式求解.-11-命题热点一 命题热点二 命题热点三 命题热点四 命题热点五 对点
9、训练2(1)在区间0,上随机取一个数x,则事件“sin x+cos x1”发生的概率为()A.14B.13C.12D.23 3 答案 解析 解析 关闭由 sin x+3cos x1,得 sin +3 12,由于 0 x,则2 x,由几何概型概率公式得,所求概率 P=-2=12.答案 解析 关闭A-12-命题热点一 命题热点二 命题热点三 命题热点四 命题热点五(2)如图,在边长为1的正方形中随机撒1 000粒豆子,有180粒落到阴影部分,据此估计阴影部分的面积为 .答案 解析 解析 关闭由题意知,这是个几何概型问题,阴正=1801 000=0.18,由 S 正=1,则 S 阴=0.18.答案
10、解析 关闭0.18-13-命题热点一 命题热点二 命题热点三 命题热点四 命题热点五 频率分布直方图的应用【思考】观察频率分布直方图能得到哪些信息?例3经销商经销某种农产品,在一个销售季度内,每售出1 t该产品获利润500元,未售出的产品,每1 t亏损300元.根据历史资料,得到销售季度内市场需求量的频率分布直方图,如图所示.经销商为下一个销售季度购进了130 t该农产品.以X(单位:t,100X150)表示下一个销售季度内的市场需求量,T(单位:元)表示下一个销售季度内经销该农产品的利润.-14-命题热点一 命题热点二 命题热点三 命题热点四 命题热点五(1)将T表示为X的函数;(2)根据直
11、方图估计利润T不少于57 000元的概率;(3)在直方图的需求量分组中,以各组的区间中点值代表该组的各个值,并以需求量落入该区间的频率作为需求量取该区间中点值的概率(例如:若需求量X100,110),则取X=105,且X=105的概率等于需求量落入100,110)的频率),求T的数学期望.答案 答案 关闭解:(1)当 X100,130)时,T=500X-300(130-X)=800X-39 000,当 X130,150时,T=500130=65 000.所以 T=800-39 000,100 130,65 000,130 150.(2)由(1)知利润 T 不少于 57 000 元当且仅当 12
12、0X150.由直方图知需求量 X120,150的频率为 0.7,所以下一个销售季度内的利润 T 不少于 57 000 元的概率的估计值为 0.7.(3)依题意可得 T 的分布列为 T 45 000 53 000 61 000 65 000 P 0.1 0.2 0.3 0.4 所以 E(T)=45 0000.1+53 0000.2+61 0000.3+65 0000.4=59400.-15-命题热点一 命题热点二 命题热点三 命题热点四 命题热点五 题后反思解决频率分布直方图的问题,关键在于找出图中数据之间的联系.在这些数据中,直接的有组距、,间接的有频率、小长方形的面积,合理使用这些数据,再结
13、合两个等量关系:小长方形面积=组距=频率,小长方形面积之和等于1,即频率之和等于1,就可以解决频率分布直方图的有关问题.频率组距频率组距-16-命题热点一 命题热点二 命题热点三 命题热点四 命题热点五 对点训练3某学校为了解学生身体发育情况,随机从高一学生中抽取40人作样本,测量出他们的身高(单位:cm),身高分组区间及人数见下表:分组 155,160)160,165)165,170)170,175)175,180)人数 a 8 14 b 2 -17-命题热点一 命题热点二 命题热点三 命题热点四 命题热点五(1)求a,b的值并根据题目补全直方图;(2)在所抽取的40人中任意选取两人,设Y为
14、身高超过170 cm的人数,求Y的分布列及数学期望.答案 答案 关闭解:(1)由题图可得 a=0.03540=6,b=40-6-8-14-2=10.补全的直方图如图所示.(2)由题意知,Y 的可能取值为 0,1,2.P(Y=0)=C282C402=63130;P(Y=1)=C281 C121C402=2865;P(Y=2)=C122C402=11130.Y 0 1 2 P 63130 2865 11130 E(P)=063130+12865+211130=35.-18-命题热点一 命题热点二 命题热点三 命题热点四 命题热点五 回归方程的求法及回归分析【思考】两个变量具备什么关系才能用线性回归
15、方程来预测?如何判断两个变量具有这种关系?例4某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响.对近8年的年宣传费xi和年销售量yi(i=1,2,8)数据作了初步处理,得到下面的散点图及一些统计量的值.-19-命题热点一 命题热点二 命题热点三 命题热点四 命题热点五 x y w i=18(xi-x)2 i=18(wi-w)2 i=18(xi-x)(yi-y)i=18(wi-w)(yi-y)46.6 563 6.8 289.8 1.6 1 469 108.8 表中 wi=,=18=18wi.(1)根据散点图判断,y=
16、a+bx与y=c+d哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;x-20-命题热点一 命题热点二 命题热点三 命题热点四 命题热点五(3)已知这种产品的年利润z与x,y的关系为z=0.2y-x.根据(2)的结果回答下列问题:年宣传费x=49时,年销售量及年利润的预报值是多少?年宣传费x为何值时,年利润的预报值最大?附:对于一组数据(u1,v1),(u2,v2),(un,vn),其回归直线v=+u的斜率和截距的最小二乘估计分别为=1(-)(-)=1(-)2,=.-21-命题热点一 命题热点二 命
17、题热点三 命题热点四 命题热点五 解:(1)由散点图可以判断,y=c+d 适宜作为年销售量 y 关于年宣传费 x 的回归方程类型.(2)令 w=,先建立 y 关于 w 的线性回归方程.由于=i=18(-)(-)=18(-)2=108.81.6=68,=563-686.8=100.6,所以 y 关于 w 的线性回归方程为=100.6+68w,因此 y 关于 x的回归方程为=100.6+68.-22-命题热点一 命题热点二 命题热点三 命题热点四 命题热点五(3)由(2)知,当 x=49 时,年销售量 y 的预报值=100.6+68 49=576.6,年利润 z 的预报值=576.60.2-49=
18、66.32.根据(2)的结果知,年利润 z 的预报值=0.2(100.6+68)-x=-x+13.6+20.12.所以当 =13.62=6.8,即 x=46.24 时,取得最大值.故年宣传费为 46.24 千元时,年利润的预报值最大.题后反思当两个变量之间具有相关关系时,才可通过线性回归方程来估计和预测.对两个变量的相关关系的判断有两种方法:一是根据散点图,具有很强的直观性,直接得出两个变量是正相关或负相关;二是计算相关系数法,这种方法能比较准确地反映相关程度,相关系数的绝对值越接近1,相关性就越强.-23-命题热点一 命题热点二 命题热点三 命题热点四 命题热点五 对点训练4(2017湖南郴
19、州第二次质检)为了探究车流量与PM2.5的浓度是否相关,现采集到北方某城市2016年12月份某星期星期一到星期日某一时间段车流量与PM2.5的数据如下表:时 间 星期一 星期二 星期三 星期四 星期五 星期六 星期日 车流量x/万辆 1 2 3 4 5 6 7 PM2.5 的浓度y/(微克/立方米)28 30 35 41 49 56 62 -24-命题热点一 命题热点二 命题热点三 命题热点四 命题热点五(1)由散点图知y与x具有线性相关关系,求y关于x的线性回归方程;(2)利用(1)所求的回归方程,预测该市车流量为8万辆时PM2.5的浓度;规定:当一天内PM2.5的浓度平均值在(0,50内,
20、空气质量等级为优;当一天内PM2.5的浓度平均值在(50,100内,空气质量等级为良.为使该市某日空气质量为优或良,则应控制当天车流量在多少万辆以内?(结果以万辆为单位,保留整数)参考公式:回归直线的方程是=bx+,其中=1-=12-2,=.-25-命题热点一 命题热点二 命题热点三 命题热点四 命题热点五 解:(1)由数据可得=17(1+2+3+4+5+6+7)=4,=17(28+30+35+41+49+56+62)=43,=17xiyi=1372,i=172=140,=17-7=172-72=1 372-1 204140-112=6,=43-64=19,故 y 关于 x 的线性回归方程为=
21、6x+19.(2)当车流量为 8 万辆,即 x=8 时,=68+19=67.故当车流量为 8 万辆时,PM2.5 的浓度为 67 微克/立方米.根据题意得 6x+19100,即 x13.5,故要使该市某日空气质量为优或良,应控制当天车流量在 13 万辆以内.-26-命题热点一 命题热点二 命题热点三 命题热点四 命题热点五 独立性检验【思考】独立性检验有什么用途?例5(2017全国,理18)某海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:旧养殖法新养殖法 -27-命题热点一 命题热点二 命题热点三
22、 命题热点四 命题热点五(1)设两种养殖方法的箱产量相互独立,记A表示事件“旧养殖法的箱产量低于50 kg,新养殖法的箱产量不低于50 kg”,估计A的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关;(3)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01).箱产量50 kg 箱产量50 kg 旧养殖法 新养殖法 附:,K2=(-)2(+)(+)(+)(+).-28-命题热点一 命题热点二 命题热点三 命题热点四 命题热点五 解:(1)记B表示事件“旧养殖法的箱产量低于50 kg”,C表示事件“新养殖法的箱产量不低于50 kg”
23、.由题意知P(A)=P(BC)=P(B)P(C).旧养殖法的箱产量低于50 kg的频率为(0.012+0.014+0.024+0.034+0.040)5=0.62,故P(B)的估计值为0.62.新养殖法的箱产量不低于50 kg的频率为(0.068+0.046+0.010+0.008)5=0.66.故P(C)的估计值为0.66.因此,事件A的概率估计值为0.620.66=0.409 2.-29-命题热点一 命题热点二 命题热点三 命题热点四 命题热点五(2)根据箱产量的频率分布直方图得列联表 箱产量6.635,故有 99%的把握认为箱产量与养殖方法有关.-30-命题热点一 命题热点二 命题热点三
24、 命题热点四 命题热点五(3)因为新养殖法的箱产量频率分布直方图中,箱产量低于50 kg的直方图面积为(0.004+0.020+0.044)5=0.340.5,故新养殖法箱产量的中位数的估计值为 50+0.5-0.340.068 52.35(kg).-31-命题热点一 命题热点二 命题热点三 命题热点四 命题热点五 题后反思利用独立性检验,能够帮助我们对日常生活中的实际问题作出合理的推断和预测.独立性检验就是考查两个分类变量是否有关系,并能较为准确地给出这种判断的可信度,具体做法是根据公式计算随机变量的观测值k,k值越大,说明“两个变量有关系”的可能性越大.K2=(-)2(+)(+)(+)(+
25、)-32-命题热点一 命题热点二 命题热点三 命题热点四 命题热点五 对点训练5某学生对其亲属30人的饮食习惯进行了一次调查,并用右图所示的茎叶图表示30人的饮食指数(说明:图中饮食指数低于70的人,饮食以蔬菜为主;饮食指数高于70的人,饮食以肉类为主).-33-命题热点一 命题热点二 命题热点三 命题热点四 命题热点五(1)根据以上数据完成下列22列联表:主食蔬菜 主食肉类 合计 50 岁以下 50 岁以上 合计 (2)能否在犯错误的概率不超过0.01 的前提下认为其亲属的饮食习惯与年龄有关系?并写出简要分析.附 K2=(-)2(+)(+)(+)(+),其中 n=a+b+c+d.P(K2k0
26、)0.10 0.05 0.010 0.005 k0 2.706 3.841 6.635 7.879 -34-命题热点一 命题热点二 命题热点三 命题热点四 命题热点五 解:(1)22列联表如下:主食蔬菜 主食肉类 合计 50 岁以下 4 8 12 50 岁以上 16 2 18 合计 20 10 30 (2)因为 K2=30(42-168)212182010=106.635,所以能在犯错误的概率不超过0.01的前提下认为其亲属的饮食习惯与年龄有关系.-35-规律总结 拓展演练 1.对古典概型,从集合的角度看概率,在一次试验中,等可能出现的全部结果组成一个集合I,基本事件的个数n就是集合I的元素个
27、数,事件A是集合I的一个包含m个元素的子集.故 2.对于几何概型的概率公式中的“测度”要有正确的认识,它只与大小有关,而与形状和位置无关,在解题时,要掌握“测度”为长度、面积、体积等常见的几何概型的求解方法.3.用样本频率分布来估计总体分布的重点是频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布;难点是频率分布表和频率分布直方图的理解及应用.在计数和计算时一定要准确,在绘制小长方形时,宽窄要一致.通过频率分布表和频率分布直方图可以对总体作出估计.P(A)=card()card()=.-36-规律总结 拓展演练 4.回归分析是处理变量相关关系的一种数学方法.主要解决:(1)确定特定量
28、之间是否有相关关系,如果有就找出它们之间贴近的数学表达式;(2)根据一组观察值,预测变量的取值及判断变量取值的变化趋势;(3)求出线性回归方程.5.根据K2的值可以判断两个分类变量有关的可信程度.-37-规律总结 拓展演练 1.某棉纺厂为了了解一批棉花的质量,从中随机抽取了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据都在区间5,40中,其频率分布直方图如图所示.从抽样的100根棉花纤维中任意抽取一根,则其棉花纤维的长度小于20 mm的概率约是()A.310B.25C.38D.35 答案 解析 解析 关闭由题意知所求概率约为100(0.015+0.015+0.045)1
29、00=310.故选 A.答案 解析 关闭A-38-规律总结 拓展演练 答案 解析 解析 关闭由已知得=110=110 xi=22.5,y=110 i=110yi=160,又=4,所以=160-422.5=70,故当 x=24 时,=424+70=166.故选 C.答案 解析 关闭C 2.(2017 山东,理 5)为了研究某班学生的脚长 x(单位:厘米)和身高y(单位:厘米)的关系,从该班随机抽取 10 名学生,根据测量数据的散点图可以看出 y 与 x 之间有线性相关关系,设其回归直线方程为=bx+.已知=110 xi=225,=110yi=1 600,=4,该班某学生的脚长为 24,据此估计其
30、身高为()A.160B.163C.166D.170-39-规律总结 拓展演练 答案 解析 解析 关闭由 6+x-x20,即 x2-x-60 得-2x3,所以 D=-2,3-4,5,由几何概型的概率公式得 xD 的概率 P=3-(-2)5-(-4)=59,答案为59.答案 解析 关闭59 3.(2017 江苏,7)记函数 f(x)=6+-2的定义域为 D.在区间-4,5上随机取一个数 x,则 xD 的概率是 .-40-规律总结 拓展演练 4.袋中有形状、大小都相同的4只球,其中1只白球,1只红球,2只黄球,若从中一次随机摸出2只球,则这2只球颜色不同的概率为 .答案 解析 解析 关闭根据条件得P
31、=C11C11+C11C21+C11C21C42=56或 P=1-C22C42=56.答案 解析 关闭56 -41-规律总结 拓展演练 5.在棱长为2的正方体ABCD-A1B1C1D1中,点O为底面ABCD的中心,若在正方体ABCD-A1B1C1D1内随机取一点P,则点P与点O的距离大于1的概率为 .答案 解析 解析 关闭如图,在正方体 ABCD-A1B1C1D1中,与点 O 的距离等于 1 的点的轨迹是一个半球面,其体积 V1=12 43 13=23.事件“点 P 与点 O 的距离大于 1 的概率”对应的区域体积为 23-23.根据几何概型概率公式,得点 P 与点 O 的距离大于 1 的概率P=23-2323=1-12.答案 解析 关闭1-12