1、第15讲 概率与统计 题型1 选填题 练熟练稳 少丢分考情分析 统计的主要内容包括随机抽样、用样本估计总体、变量的相关关系;概率部分以考查古典(几何)概型、互斥事件、对立事件等为主,主要以选择或填空的方式呈现,多为低、中档题目1 热点题型分析 PART ONE 热点 1 抽样方法与用样本估计总体1.抽样方法 2样本的数字特征(1)众数:在样本数据中,出现次数最多的那个数据;(2)中位数:样本数据中,将数据按大小排列,位于最中间的一个或两个数据的平均数,是样本数据的“中心点”;(3)平均数:样本数据的算术平均数,即 x1n(x1x2xn),是样本数据的平均水平;(4)方差与标准差:是样本数据到平
2、均数的一种平均距离,表示样本数据的离散程度,标准差(方差)越大,数据的离散程度越大;标准差(方差)越小,数据的离散程度越小方差:s21n(x1 x)2(x2 x)2(xn x)2;标准差:s1nx1 x2x2 x2xn x2.3直方图的两个结论(1)小长方形的面积组距频率组距频率;(2)各小长方形的面积之和等于 1.4直方图与众数、中位数和平均数的关系(1)众数:是直方图中最高矩形的底边中点横坐标;(2)中位数:是直方图中平分所有矩形面积和,且垂直于横轴的直线与横轴交点的横坐标;(3)平均数:是每个小矩形的面积乘以小矩形底边中点的横坐标之和1(2019东三省三校一模)如图是某居民小区年龄在 2
3、0 岁到 45 岁的居民上网情况的频率分布直方图,现已知年龄在30,35),35,40),40,45的上网人数呈现递减的等差数列,且年龄在30,35)的频率为 0.3,则由此频率分布直方图估计该小区在 20 岁到 45 岁的居民上网年龄的()A平均数为 32.5 B众数为 32.25C中位数为953D在40,45的频率为 0.15答案 C解析 由题意可知20,25),25,30),30,35)的频率分别为 0.05,0.35,0.3.设35,40),40,45的频率分别为 a,b.因为已知年龄在30,35),35,40),40,45的上网人数呈现递减的等差数列,所以他们的频率也成递减的等差数列
4、,则有 ab0.3 且 2ab0.3,解得 a0.2,b0.1,故选项 D 不正确;居民上 网 年 龄 的 平 均 数 为 22.50.05 27.50.35 32.50.3 37.50.2 42.50.132.25,所以 A 不正确;根据众数和直方图的关系,可得上网年龄的众数为 27.5,故 B 不正确;由前面计算可知中位数在30,35)组中,设中位数为 x,则x3050.10.3,解得 x953,故选 C2一个总体中的 100 个个体的号码分别为 0,1,2,99,并依次将其分为 10 个小组,组号为 0,1,2,9.要用系统抽样方法抽取一个容量为 10的样本,规定如果在第 0 组随机抽取
5、的号码为 m,那么依次错位地得到后面各组的号码,即第 k 组(k1,2,9)中抽取的号码个位数字为 mk 或 mk10(如果 mk10),当 m5 时,第 8 组抽取的号码为_答案 83解析 因为 m5,k8,则 mk13,则第 8 组中抽取号码的个位数字为 mk103,所以第 8 组抽取的号码为 83.3(2019江苏高考)已知一组数据 6,7,8,8,9,10,则该组数据的方差是_解析 这组数据的平均数为 8,故方差为 s216(68)2(78)2(88)2(88)2(98)2(108)253.答案 531对于以统计图为载体的概率与统计问题,认真观察图表,从中提取有用信息和数据是解题关键特
6、别是利用频率直方图解题时,常把直方图的高误认为是频率而导致错误因此,应注意每个小矩形的面积为频率,所有面积和为 1.对于第 1 题这类,利用直方图考查众数、中位数和平均数的问题,关键在于相应的计算公式是否掌握,特别是中位数问题,找准中位数所在的区间是解题关键;2对于抽样方法的问题,要明确总体的基本特征符合哪种抽样特点对于系统抽样通常是等距抽样,但也有例外情况,如第 2 题给出的规则即为每组号码错后一位,如果还按照等距原则计算,就会出现错解 85.因此解决系统抽样的问题时,要认真审题,分析题目给出的抽取规则,按照规则进行抽样;3对于样本的数字特征的一系列问题(如第 3 题),解题关键在于计算公式
7、的准确使用和计算准确,应掌握简便运算的方法,减小计算量,提高准确率热点 2 统计案例1线性回归方程方程ybxa称为线性回归方程,利用最小二乘法估计公式斜率和截距分别为bi1nxi xyi yi1nxi x2i1nxiyin x yi1nx2in x2,a ybx,其中(x,y)是样本点的中心,且回归直线恒过该点2相关系数ri1nxi xyi yi1nxi x2i1nyi y2,当 r0 时,表明变量 x 与 y 正相关,r3.841时,则有 95%的把握说两个事件有关;当 K26.635 时,则有 99%的把握说两个事件有关1(2019衡水中学调研)已知变量 x,y 之间的线性回归方程为y0.
8、7x10.3,且变量 x,y 之间的一组相关数据如下表所示,则下列说法错误的是()x681012y6m32A变量 x,y 之间呈负相关关系 B可以预测,当 x20 时,y3.7Cm4D该回归直线必过点(9,4)答案 C解析 由题意得,由0.73.841,所以有 95%的把握认为选修文科与性别有关答案 95%1线性回归分析是对有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的线性回归方程才有实际意义;同时,根据回归方程预测仅是一个预测值,而不是真实发生的值2独立检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表在分析问题
9、时一定要注意不可对某个问题下确定性结论,否则就可能对统计计算的结果做出错误的解释1古典概型P(A)事件A所包含的基本事件数基本事件总数.2几何概型P(A)构成事件A的区域长度面积或体积试验的全部结果所构成的区域长度面积或体积.1(2019全国卷)两位男同学和两位女同学随机排成一列,则两位女同学相邻的概率是()A16B14C13D12答案 D解析 设两位男同学分别为 A,B,两位女同学分别为 a,b,则用“树形图”表示四位同学排成一列所有可能的结果如图所示由图知,共有 24 种等可能的结果,其中两位女同学相邻的结果(画“”的情况)共有 12 种,故所求概率为122412.故选 D2(2019西安
10、调研)若函数 f(x)ex,0 x1,ln xe,1xe,在区间0,e上随机取一个实数 x,则 f(x)的值不小于常数 e 的概率是()A1eB11eC e1eD 11e答案 B解析 当 0 x1 时,恒有 f(x)ex1的概率为()A13B12C23D34答案 B解析 由 sinx 3cosx1,得 sinx3 12,因为 x0,所以 sinx 3cosx1 的解集为0,2,由几何概型可知所求概率 P212,故选 B52021 年某省新高考将实行“312”模式,即语文、数学、外语必选,物理、历史二选一,政治、地理、化学、生物四选二,共有 12 种选课模式某同学已选了物理,记事件 A:“他选择
11、政治和地理”,事件 B:“他选择化学和地理”,则事件 A 与事件 B()A是互斥事件,不是对立事件B是对立事件,不是互斥事件C既是互斥事件,也是对立事件D既不是互斥事件也不是对立事件答案 A解析 事件 A 与事件 B 不能同时发生,是互斥事件,该同学还可以有其他选择,例如他还可以选择化学和政治,所以事件 A 与事件 B 不是对立事件故选 A6如图所示的茎叶图表示的是甲、乙两人在 5 次综合测评中的成绩,其中一个数字被污损,则甲的平均成绩超过乙的平均成绩的概率是()A25B 710C45D 910答案 C解析 设被污损的数字为 x,则 x甲15(8889909192)90,x乙15(838387
12、9990 x),若 x甲 x乙,则 x8.若 x甲 x乙,则 x 可以为 0,1,2,3,4,5,6,7,故 P 81045.7(2019兰州实战考试)采用系统抽样的方法从 1000 人中抽取 50 人做问卷调查,将他们随机编号 1,2,1000.适当分组后在第一组采用简单随机抽样的方法抽到的号码为 8.若抽到的 50 人中,编号落入区间1,400的人做问卷 A,编号落入区间401,750的人做问卷 B,其余的人做问卷 C,则抽到的人中做问卷 C 的人数为()A12B13 C14D15答案 A解析 根据系统抽样的特点可知,所有做问卷调查的人的编号构成首项为 8,公差 d100050 20 的等
13、差数列an,所以 an820(n1)20n12,令 75120n121000,解得76320 n2535,又 nN*,所以 39n50,则做问卷 C 的共有 12 人,故选 A8(2019兰州一模)已知某种商品的广告费支出 x(单位:万元)与销售额y(单位:万元)之间有如下对应数据:x24568y304050m70根据表中提供的全部数据,用最小二乘法得出 y 与 x 的线性回归方程为y6.5x17.5,则表中 m 的值为()A45B50 C55D60答案 D解析 由回归直线恒过(x,y),可得 x2456855,y304050m70538m5,即 38m56.5517.5,解得 m60,故选D
14、9法国学者贝特朗发现,在研究事件 A“在半径为 1 的圆内随机地取一条弦,其长度超过圆内接等边三角形的边长 3”的概念的过程中,基于对“随机地取一条弦”的含义的不同理解,事件 A 的概率 P(A)存在不同的答案,该问题被称为“贝特朗悖论”现给出一种解释:若固定弦的一个端点,另一个端点在圆周上随机选取,则 P(A)()A12B13C14D16答案 B解析 设固定弦的一个端点为 A,则另一个端点在圆周上且在 BC 劣弧上随机选取,即可满足题意,则 P(A)23213,故选 B10(2017全国卷)从分别写有 1,2,3,4,5 的 5 张卡片中随机抽取 1 张,放回后再随机抽取 1 张,则抽得的第
15、一张卡片上的数大于第二张卡片上的数的概率为()A 110B15C 310D25答案 D解析 从 5 张卡片中随机抽取 1 张,放回后再随机抽取 1 张的情况如图:基本事件总数为 25,第一张卡片上的数大于第二张卡片上的数的事件数为 10,所以所求概率 P102525.故选 D11已知正三棱锥 SABC 的底面边长为 4,高为 3,在正三棱锥内任取一点 P,使得 VPABC12VSABC 的概率是()A78B34C12D14答案 A解析 由题意知,当点 P 在三棱锥的中截面 ABC以下时,满足VPABC12VSABC,又 V 锥 SABC1214V 锥 SABC18V 锥 SABC事件“VPAB
16、C 5的概率是_答案 16解析 由题意得 e1b2a2 5,即 b2a.同时抛掷两颗骰子,得到的点数 a,b 满足 b2a 的情况有:当 a1 时,b3,4,5,6,共 4 种情况;当 a2 时,b5,6,共 2 种情况,所以满足题意的情况共有 6 种,又同时掷两颗骰子有 36 种情况,所求概率为 63616.13从 2,3,4,5,8,9 这 6 个数中一次取出两个数分别作为对数的底数和真数,则得到的对数是整数的概率为_答案 15解析 设取得的第一个数为对数的底数,第二个数为对数的真数,则从2,3,4,5,8,9 这六个数中一次取出两个数的基本事件有(2,3),(2,4),(2,5),(2,
17、8),(2,9),(3,4),(3,5),(3,8),(3,9),(4,5),(4,8),(4,9),(5,8),(5,9),(8,9),共15 个,其中得到的对数是整数的有(2,4),(2,8),(3,9),共 3 个,故所求事件概率为 31515.14按文献记载,百家姓成文于北宋初年,表 1 记录了百家姓开头的 24 大姓氏表 1赵 钱 孙李周吴 郑 王 冯 陈 褚 卫蒋 沈 韩杨朱秦 尤 许 何 吕 施 张表 2 记录了 2018 年中国人口最多的前 10 大姓氏表 21 李2 王3 张 4 刘5 陈6 杨7 赵8 黄 9 周 10 吴从百家姓开头的 24 大姓氏中随机选取 1 个姓氏,
18、则这个姓氏是 2018年中国人口最多的前 10 大姓氏的概率为_解析 2018 年中国人口最多的前 10 大姓氏也是百家姓的前 24 大姓氏的是赵、李、周、吴、王、陈、杨、张,共 8 个,故所求概率为 82413.答案 1315在平面区域xy40,x0,y0内随机取一点(a,b),则函数 f(x)ax24bx1 在区间1,)上是增函数的概率为_答案 13解析 不等式组表示的平面区域为如图所示的AOB 的内部及边界AB(不包括边界 OA,OB),则 SAOB12448.函数 f(x)ax24bx1 在区间1,)上是增函数,则应满足 a0,且 x4b2a1,即满足a0,a2b,可得对应的平面区域如图中阴影部分(包括边界 OC,BC,不包括边界 OB),由a2b,ab40,解得 a83,b43,即点 C 坐标为83,43,所以 SCOB1244383.根据几何概型的概率计算公式,可知所求的概率为83813.本课结束