1、第16讲 概率与统计 题型1 选填题 练熟练稳 少丢分考情分析 统计的主要内容包括随机抽样、用样本估计总体、变量的相关关系;概率部分以考查古典(几何)概型、互斥事件、相互独立事件、独立重复试验等为主,主要以选择或填空的方式呈现,多为低、中档题目.1 热点题型分析 PART ONE 热点 1 抽样方法与用样本估计总体1.抽样方法(1)抽样过程中每个个体被抽到的概率相等,均为nN;(2)每次抽出个体后不再将它放回,即不放回抽样从总体中逐个抽取最基本的抽样方法总体中的个数较少将总体均分成几部分,按事先确定的规则在各部分抽取在起始部分抽样时采用简单随机抽样总体中的个数较多将总体分成几层,分层进行抽取每
2、层抽样时采用简单随机抽样或系统抽样总体由差异明显的几部分组成2样本的数字特征(1)众数:在样本数据中,出现次数最多的那个数据;(2)中位数:样本数据中,将数据按大小排列,位于最中间的一个或两个数据的平均数,是样本数据的“中心点”;(3)平均数:样本数据的算术平均数,即 x1n(x1x2xn),是样本数据的平均水平;(4)方差与标准差:是样本数据到平均数的一种平均距离,表示样本数据的离散程度,标准差(方差)越大,数据的离散程度越大;标准差(方差)越小,数据的离散程度越小方差:s21n(x1 x)2(x2 x)2(xn x)2;标准差:s1nx1 x2x2 x2xn x2.3直方图的两个结论(1)
3、小长方形的面积组距频率组距频率;(2)各小长方形的面积之和等于 1.4直方图与众数、中位数和平均数的关系(1)众数:是直方图中最高矩形的底边中点横坐标;(2)中位数:是直方图中平分所有矩形面积和,且垂直于横轴的直线与横轴交点的横坐标;(3)平均数:是每个小矩形的面积乘以小矩形底边中点的横坐标之和1(2019东三省三校一模)如图是某居民小区年龄在 20 岁到 45 岁的居民上网情况的频率分布直方图,现已知年龄在30,35),35,40),40,45的上网人数呈现递减的等差数列,且年龄在30,35)的频率为 0.3,则由此频率分布直方图估计该小区在 20 岁到 45 岁的居民上网年龄的()A平均数
4、为 32.5 B众数为 32.25C中位数为953D在40,45的频率为 0.15答案 C解析 由题意可知20,25),25,30),30,35)的频率分别为 0.05,0.35,0.3.设35,40),40,45的频率分别为 a,b.因为已知年龄在30,35),35,40),40,45的上网人数呈现递减的等差数列,所以他们的频率也成递减的等差数列,则有 ab0.3 且 2ab0.3,解得 a0.2,b0.1,故选项 D 不正确;居民上网年龄的平均数为 22.50.0527.50.3532.50.337.50.242.50.132.25,所以 A 不正确;根据众数和直方图的关系,可得上网年龄的
5、众数为27.5,故 B 不正确;由前面计算可知中位数在30,35)组中,设中位数为 x,则x3050.10.3,解得 x953,故选 C.2一个总体中的 100 个个体的号码分别为 0,1,2,99,并依次将其分为 10 个小组,组号为 0,1,2,9.要用系统抽样方法抽取一个容量为 10的样本,规定如果在第 0 组随机抽取的号码为 m,那么依次错位地得到后面各组的号码,即第 k 组(k1,2,9)中抽取的号码个位数字为 mk 或 mk10(如果 mk10),当 m5 时,第 8 组抽取的号码为_解析 因为 m5,k8,则 mk13,则第 8 组中抽取号码的个位数字为 mk103,所以第 8
6、组抽取的号码为 83.答案 833(2019江苏高考)已知一组数据 6,7,8,8,9,10,则该组数据的方差是_解析 这组数据的平均数为 8,故方差为 s216(68)2(78)2(88)2(88)2(98)2(108)253.答案 53(1)对于以统计图为载体的概率与统计问题,认真观察图表,从中提取有用信息和数据是解题关键特别是利用频率直方图解题时,常把直方图的高误认为是频率而导致错误因此,应注意每个小矩形的面积为频率,所有面积和为 1.对于第 1 题这类,利用直方图考查众数、中位数和平均数的问题,关键在于相应的计算公式是否掌握,特别是中位数问题,找准中位数所在的区间是解题关键;(2)对于
7、抽样方法的问题,要明确总体的基本特征符合哪种抽样特点对于系统抽样通常是等距抽样,但也有例外情况,如第 2 题给出的规则即为每组号码错后一位,如果还按照等距原则计算,就会出现错解 85.因此解决系统抽样的问题时,要认真审题,分析题目给出的抽取规则,按照规则进行抽样;(3)对于样本的数字特征的一系列问题(如第 3 题),解题关键在于计算公式的准确使用和计算准确,应掌握简便运算的方法,减小计算量,提高准确率热点 2 统计案例1线性回归方程方程ybxa称为线性回归方程,利用最小二乘法估计公式斜率和截距分别为bi1nxi xyi yi1nxi x2i1nxiyin x yi1nx2in x2,a ybx
8、,其中(x,y)是样本点的中心,且回归直线恒过该点2相关系数ri1nxi xyi yi1nxi x2i1nyi y2,当 r0 时,表明变量 x 与 y 正相关,r3.841时,则有 95%的把握说两个事件有关;当 K26.635 时,则有 99%的把握说两个事件有关1(2017山东高考)为了研究某班学生的脚长 x(单位:厘米)和身高 y(单位:厘米)的关系,从该班随机抽取 10 名学生,根据测量数据的散点图可以看出 y 与 x 之间有线性相关关系设其回归直线方程为ybxa.已知i110 xi225,i110yi1600,b4.该班某学生的脚长为 24,据此估计其身高为()A160 B163
9、C166 D170答案 C解析 i110 xi225,x 110i110 xi22.5.i110yi1600,y 110i110yi160.又b4,a ybx160422.570.回归直线方程为y4x70.将 x24 代入上式得y42470166.故选 C.2为了判断高中三年级学生选修文科是否与性别有关,现随机抽取 50名学生,得到如图所示 22 列联表:理科 文科 总计男131023女72027总计203050已知 P(K23.841)0.05,P(K25.024)0.025.根据表中数据,得到 K2的观测值 k5013201072232720304.844,则有_的把握认为选修文科与性别有
10、关答案 95%解析 由题意,K25013201072232720304.844,因为 4.8443.841,所以有 95%的把握认为选修文科与性别有关(1)线性回归分析是对有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的线性回归方程才有实际意义;同时,根据回归方程预测仅是一个预测值,而不是真实发生的值(如第 1 题)(2)独立检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表在分析问题时一定要注意不可对某个问题下确定性结论,否则就可能对统计计算的结果做出错误的解释热点 3 古典概型、几何概型及条件概率1古典概型P(A
11、)事件A所包含的基本事件数基本事件总数.2几何概型P(A)构成事件A的区域长度面积或体积试验的全部结果所构成的区域长度面积或体积.3条件概率:在事件 A 发生的条件下事件 B 发生的条件概率为 P(B|A)PABPA.1(2019全国卷)我国古代典籍周易用“卦”描述万物的变化每一“重卦”由从下到上排列的 6 个爻组成,爻分为阳爻“”和阴爻“”,右图就是一重卦在所有重卦中随机取一重卦,则该重卦恰有 3 个阳爻的概率是()A.516 B.1132 C.2132 D.1116答案 A解析 在所有重卦中随机取一重卦,其基本事件总数 n2664,恰有 3个阳爻的基本事件数为 C3620,所以在所有重卦中
12、随机取一重卦,该重卦恰有 3 个阳爻的概率 P2064 516.故选 A.2(2019西安调研)若函数 f(x)ex,0 x1,ln xe,1xe,在区间0,e上随机取一个实数 x,则 f(x)的值不小于常数 e 的概率是()A.1e B11e C.e1e D.11e解析 当 0 x1 时,恒有 f(x)exe,不满足题意当 1xe 时,f(x)ln xe.由 ln xee,得 1xe.所求事件的概率 Pe1e 11e.答案 B3(2019东三省三校一模)从标有 1,2,3,4,5 的五张卡片中,依次抽出 2 张,则在第一次抽到奇数的情况下,第二次抽到偶数的概率为()A.14B.12C.13D
13、.23答案 B解析 解法一:设事件 B 为“第二次抽到偶数”,事件 A 为“第一次抽到奇数”,则 P(AB)C13C12A25 310,P(A)C13C1535,所以 P(B|A)PABPA 12,故选 B.解法二:设事件 A 为“在第一次抽到奇数的情况下,第二次抽到偶数”,因为第一次抽到奇数共有 C13C1412 个基本事件,其中第一次抽到奇数的情况下第二次抽到偶数共有 C13C126 个基本事件,则 P(A)61212,故选 B.(1)运用古典概型和几何概型计算公式的前提,是当所述试验的所有基本事件是等可能的(2)有序无序易混淆如第 3 题要求“依次抽出 2 张”,因此(1,2)和(2,1
14、)为两个不同的结果,故计算概率 P(AB)时,分母为 A25,而不能错误的用 C25.(3)几何概型的考查重点是几何测度的选择,通常为长度、面积、体积、弧长、夹角等(4)计算条件概率时,易与独立事件混淆,因此理清条件概率中的条件是解决问题的重点如第 3 题,条件为“第一次抽到奇数”,因此除了使用条件概率的计算公式外,还可以使用根据条件缩小样本空间的办法,即在“第一次抽到奇数”的条件下,总的基本事件数缩小为 12 个,从而进一步使用古典概型的方法计算热点 4 随机变量的分布列1两点分布随机变量 X 的分布列满足 P(X0)q,P(X1)p(0p1,0q1,pq1),就称 X 服从两点分布,而称
15、pP(X1)为成功概率两点分布又称 01 分布由于只有两个可能结果的随机试验叫伯努利试验,所以还称这种分布为伯努利分布其中 E(X)p,D(X)p(1p)2超几何分布一般地,在含有 M 件次品的 N 件产品中,任取 n 件,其中恰有 X 件次品数,则事件Xk发生的概率为 P(Xk)CkMCnkNMCnN(k0,1,2,m),其中 mminM,n,且 nN,MN,n,M,NN*.称随机变量 X 的分布列为超几何分布列3二项分布在一次随机试验中,某事件可能发生也可能不发生,在 n 次独立重复试验中这个事件发生的次数 X 是一个随机变量如果在一次试验中某事件发生的概率是 p,那么在 n 次独立重复试
16、验中这个事件恰好发生 k 次的概率是 Pn(Xk)Cknpkqnk,(k0,1,2,n,q1p)称这样的随机变量 X 服从二项分布,记作 XB(n,p),其中 p 为成功概率,其中 E(X)np,D(X)np(1p)4正态分布一般地,如果对于任何实数 ab,随机变量 X 满足 P(aXb)ab,(x)dx,则称 X 的分布为正态分布正态分布完全由参数 和 确定,因此正态分布常记作 XN(,2)其中 E(X),D(X)2.1(2018全国卷)某群体中的每位成员使用移动支付的概率都为 p,各成员的支付方式相互独立,设 X 为该群体的 10 位成员中使用移动支付的人数,D(X)2.4,P(X4)P(
17、X6),则 p()A0.7 B0.6 C0.4 D0.3解析 D(X)np(1p),p0.4 或 p0.6.P(X4)C410p4(1p)6P(X6)C610p6(1p)4,(1p)20.5,故选 B.答案 B2(2017浙江高考)已知随机变量 i 满足 P(i1)pi,P(i0)1pi(i1,2)若 0p1p212,则()AE(1)E(2),D(1)D(2)BE(1)D(2)CE(1)E(2),D(1)E(2),D(1)D(2)答案 A解析 由题意可知 i(i1,2)服从两点分布,E(1)p1,E(2)p2,D(1)p1(1p1),D(2)p2(1p2)又0p1p212,E(1)E(2)把方
18、差看作函数 yx(1x),根据 0p1p212知,D(1)D(2)故选 A.3(2019浙江高考)设 0a1,随机变量 X 的分布列是X0a1P131313则当 a 在(0,1)内增大时,()AD(X)增大BD(X)减小CD(X)先增大后减小DD(X)先减小后增大答案 D解析 由题意知 E(X)013a13113a13,因此,D(X)a13 0213a13 a 213a13 1 213 127(a1)2(12a)2(a2)2 127(6a26a6)29a12234.当 0a12时,D(X)单调递减;当12a1 时,D(X)单调递增即当 a 在(0,1)内增大时,D(X)先减小后增大故选 D.4
19、袋中有 3 个白球,2 个黑球,若每次抽取 1 个,有放回地连续抽取 3次,则取到黑球的个数 X 的数学期望是_;若从袋中任取 3 个球,则取到黑球的个数 Y 的数学期望是_解析(1)因为每次抽取 1 个,有放回地连续抽取 3 次,所以该试验可看作是每次抽到黑球的概率均为25的独立重复试验,所以 XB3,25,则 E(X)3251.2;答案 1.2 1.2(2)从袋中任取 3 个球,则取到黑球的个数 Y 的可能取值为 0,1,2,且有P(Y0)C02C33C35 110,P(Y1)C12C23C35 610,P(Y2)C22C13C35 310,所以 E(Y)0 1101 6102 3101.
20、2.(1)对于二项分布的问题,应注意弄清楚题目给出的问题是否是独立重复试验,要看两点:一是每次试验中事件 A 发生的概率是否相同;二是每次试验之间是否互不影响对于第 1 题,每位成员使用移动支付的概率都为 p,且支付方式相互独立,从而是独立重复试验问题,因此解答时可以使用二项分布的相关公式进行计算,从而简化解题过程特别值得注意的是,二项分布概率的计算公式与二项展开式通项的区别(2)要正确区分二项分布与超几何分布对于第 4 题第 1 问的有放回抽样,每次抽取时的总体没有改变,因而每次抽到黑球的概率相同,可看作是独立重复试验,属于二项分布模型;而对于第 4 题第 2 问一次抽取 3 个,看黑球的个
21、数问题,属于超几何分布模型,使用超几何计算公式进行求解.3对于两点分布的问题,应注意随机变量是否只有两个结果,即要么成功要么失败.同时两点分布是特殊的二项分布,因此解题时可以使用二项分布求期望和方差的公式进行计算.4对于正态分布的问题,应注意 为总体的平均数,为总体的标准差.同时,要注意正态分布在各区间的取值概率,不可混淆,否则将出现计算失误.2 真题自检感悟 PART TWO 1(2018全国卷)右图来自古希腊数学家希波克拉底所研究的几何图形此图由三个半圆构成,三个半圆的直径分别为直角三角形 ABC 的斜边 BC,直角边 AB,AC.ABC 的三边所围成的区域记为,黑色部分记为,其余部分记为
22、.在整个图形中随机取一点,此点取自,的概率分别记为 p1,p2,p3,则()Ap1p2Bp1p3Cp2p3Dp1p2p3答案 A解析 不妨取 ABAC2,则 BC2 2,所以区域的面积为 SABC2;区域的面积为 2;区域的面积为(2)2,所以根据几何概型的概率公式,易得 p1p2,故选 A.2(2018全国卷)我国数学家陈景润在哥德巴赫猜想的研究中取得了世界领先的成果哥德巴赫猜想是“每个大于 2 的偶数可以表示为两个素数的和”,如 30723.在不超过 30 的素数中,随机选取两个不同的数,其和等于 30 的概率是()A.112 B.114 C.115 D.118解析 不超过 30 的素数有
23、 2,3,5,7,11,13,17,19,23,29,共 10 个,随机选取两个不同的数,共有 C21045 种方法,因为 7231119131730,所以随机选取两个不同的数,其和等于 30 的有 3 种方法,故概率为 345 115,选 C.答案 C3(2019全国卷)生物实验室有 5 只兔子,其中只有 3 只测量过某项指标若从这 5 只兔子中随机取出 3 只,则恰有 2 只测量过该指标的概率为()A.23 B.35 C.25 D.15答案 B解析 设 5 只兔子中测量过某项指标的 3 只为 a1,a2,a3,未测量过这项指标的 2 只为 b1,b2,则从 5 只兔子中随机取出 3 只的所
24、有可能情况为(a1,a2,a3),(a1,a2,b1),(a1,a2,b2),(a1,a3,b1),(a1,a3,b2),(a1,b1,b2),(a2,a3,b1),(a2,a3,b2),(a2,b1,b2),(a3,b1,b2),共 10 种可能其中恰有 2 只测量过该指标的情况为(a1,a2,b1),(a1,a2,b2),(a1,a3,b1),(a1,a3,b2),(a2,a3,b1),(a2,a3,b2),共 6 种可能故恰有 2 只测量过该指标的概率为 61035.故选 B.4(2019全国卷)两位男同学和两位女同学随机排成一列,则两位女同学相邻的概率是()A.16 B.14 C.13
25、 D.12解析 设两位男同学分别为 A,B,两位女同学分别为 a,b,则用“树形图”表示四位同学排成一列所有可能的结果如图所示答案 D由图知,共有 24 种等可能的结果,其中两位女同学相邻的结果(画“”的情况)共有 12 种,故所求概率为122412.故选 D.5(2019全国卷)甲、乙两队进行篮球决赛,采取七场四胜制(当一队赢得四场胜利时,该队获胜,决赛结束)根据前期比赛成绩,甲队的主客场安排依次为“主主客客主客主”设甲队主场取胜的概率为 0.6,客场取胜的概率为0.5,且各场比赛结果相互独立,则甲队以41获胜的概率是_答案 0.18解析 甲队以 41 获胜,甲队在第 5 场(主场)获胜,前
26、 4 场中有一场输若在主场输一场,则概率为 20.60.40.50.50.6;若在客场输一场,则概率为 20.60.60.50.50.6.甲队以 41 获胜的概率 P20.60.50.5(0.60.4)0.60.18.3 专题作业 PART THREE 一、选择题1(2017山东高考)从分别标有 1,2,9 的 9 张卡片中不放回地随机抽取 2 次,每次抽取 1 张,则抽到的 2 张卡片上的数奇偶性不同的概率是()A.518 B.49 C.59 D.79答案 C解析 解法一:9 张卡片中有 5 张奇数卡片,4 张偶数卡片,且为不放回地随机抽取,P(第一次抽到奇数,第二次抽到偶数)5948 51
27、8,P(第一次抽到偶数,第二次抽到奇数)4958 518.P(抽到的 2 张卡片上的数奇偶性不同)518 51859.故选 C.解法二:依题意,得 P(抽到的 2 张卡片上的数奇偶性不同)54C29 59.故选 C.2(2019成都七中诊断)若随机变量 XN(3,2),且 P(X5)0.2,则P(1X1的概率为()A.13 B.12 C.23 D.34解析 由 sinx 3cosx1,得 sinx3 12,因为 x0,所以 sinx 3cosx1 的解集为0,2,由几何概型可知所求概率 P212,故选 B.答案 B5设离散型随机变量 X 可能的取值为 1,2,3,4,P(Xk)akb,又 X
28、的均值为 E(X)3,则 ab 等于()A.110 B0 C 110 D.15答案 A解析 依题意可得 X 的分布列为X1234Pab2ab3ab4ab依题意得ab2ab3ab4ab1,ab22ab33ab44ab3,解得 a 110,b0,故 ab 110.故选 A.6(2018兰州实战考试)采用系统抽样的方法从 1000 人中抽取 50 人做问卷调查,将他们随机编号 1,2,1000.适当分组后在第一组采用简单随机抽样的方法抽到的号码为 8.若抽到的 50 人中,编号落入区间1,400的人做问卷 A,编号落入区间401,750的人做问卷 B,其余的人做问卷 C,则抽到的人中做问卷 C 的人
29、数为()A12 B13 C14 D15答案 A解析 根据系统抽样的特点可知,所有做问卷调查的人的编号构成首项为 8,公差 d100050 20 的等差数列an,所以 an820(n1)20n12,令 75120n121000,解得76320 n2535,又 nN*,所以 39n50,则做问卷 C 的共有 12 人,故选 A.7(2019兰州一模)已知某种商品的广告费支出 x(单位:万元)与销售额y(单位:万元)之间有如下对应数据:x24568y 30 40 50 m70根据表中提供的全部数据,用最小二乘法得出 y 与 x 的线性回归方程为y6.5x17.5,则表中 m 的值为()A45 B50
30、 C55 D60解析 由回归直线恒过(x,y),可得 x2456855,y304050m70538m5,即 38m56.5517.5,解得 m60,故选 D.答案 D8(2017全国卷)从分别写有 1,2,3,4,5 的 5 张卡片中随机抽取 1 张,放回后再随机抽取 1 张,则抽得的第一张卡片上的数大于第二张卡片上的数的概率为()A.110 B.15 C.310 D.25答案 D解析 从 5 张卡片中随机抽取 1 张,放回后再随机抽取 1 张的情况如图:基本事件总数为 25,第一张卡片上的数大于第二张卡片上的数的事件数为 10,所以所求概率 P102525.故选 D.9甲、乙两人进行乒乓球比
31、赛,约定每局胜者得 1 分,负者得 0 分,比赛进行到有一人比对方多 2 分或打满 6 局时停止设甲在每局中获胜的概率为23,乙在每局中获胜的概率为13,且各局胜负相互独立,则比赛停止时已打局数 X 的期望 E(X)为()A.24181 B.26681 C.27481 D.670243答案 B解析 依题意,知 X 的所有可能值为 2,4,6,设每两局比赛为一轮,则该轮结束时比赛停止的概率为23213259.若该轮结束时比赛还将继续,则甲、乙在该轮中必是各得一分,此时,该轮比赛结果对下轮比赛是否停止没有影响从而有 P(X2)59,P(X4)49592081,P(X6)4921681,故 E(X)
32、259420816168126681.二、填空题10(2017全国卷)一批产品的二等品率为 0.02,从这批产品中每次随机取一件,有放回地抽取 100 次,X 表示抽到的二等品件数,则 D(X)_.解析 由题意得 XB(100,0.02),D(X)1000.02(10.02)1.96.答案 1.9611一个不透明袋中装有大小、质地完全相同的四个球,四个球上分别标有数字 2,3,4,6.现从中随机选取三个球,则所选的三个球上的数字能构成等差数列的概率是_解析 因为从四个球中随机选三个共有 C344 种不同的选法,其中能构成等差数列的三个数分别为(2,3,4),(2,4,6),共 2 种不同的选法,所以根据古典概型概率计算公式,得 P2412.答案 1212(2019衡水中学模拟)由数字 0,1 组成的一串数字代码,其中恰好有 7个 1,3 个 0,则这样的不同数字代码共有_个解析 依题意,一串数字代码一共有 10 个数字,则取 7 个位置排 1,剩下的位置排 0,则不同数字的代码有 C710120 个答案 120本课结束