1、第 2 讲 概率、统计与统计案例 感悟高考 明确考向(2010广东)某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了 100 名电视观众,相关的数据如下表所示:文艺节目新闻节目总计20至40岁401858大于40岁152742总计5545100(1)由表中数据直观分析,收看新闻节目的观众是否与年龄有关?(2)用分层抽样方法在收看新闻节目的观众中随机抽取5 名,大于 40 岁的观众应该抽取几名?(3)在上述抽取的 5 名观众中任取 2 名,求恰有 1 名观众的年龄为 20 至 40 岁的概率解(1)因为在 20 至 40 岁的 58 名观众中有 18 名观众收看新闻节目,而大于
2、 40 岁的 42 名观众中有 27 名观众收看新闻节目,所以,经直观分析,收看新闻节目的观众与年龄是有关的(2)从题中所给条件可以看出收看新闻节目的共 45 人,随机抽取 5 人,则抽样比为 54519,故大于 40 岁的观众应抽取 27193(人)(3)抽取的 5 名观众中大于 40 岁的有 3 人,在 20 至 40岁的有 2 人,记大于 40 岁的人为 a1,a2,a3,20 至 40 岁的人为 b1,b2,则从 5 人中抽取 2 人的基本事件有(a1,a2),(a1,a3),(a2,a3),(b1,b2),(a1,b1),(a1,b2),(a2,b1),(a2,b2),(a3,b1)
3、,(a3,b2)共 10 个,其中恰有 1 人为 20 至 40 岁的有 6 个,故所求概率为 61035.考题分析本题考查了独立性检验的基本思想和方法,考查了分层抽样和概率的计算考查考生综合应用知识解决问题的能力题目难度不大,但考查知识点多,综合性强易错提醒(1)不知道从什么角度去说明收看新闻节目的观众与年龄有关(2)分层抽样按比例抽取,有的考生比例关系不清(3)计算概率时,基本事件计算不准确主干知识梳理 1随机事件的概率(1)随机事件的概率范围:0P(A)1;必然事件的概率为 1;不可能事件的概率为 0.(2)古典概型的概率P(A)mnA中所含的基本事件数基本事件总数.(3)几何概型的概率
4、P(A)构成事件A的区域长度(面积或体积)试验的全部结果所构成的区域长度(面积或体积).2统计(1)抽样方法:简单随机抽样、系统抽样、分层抽样(2)利用样本频率分布估计总体分布频率分布表和频率分布直方图总体密度曲线茎叶图(3)用样本的数字特征估计总体的数字特征众数、中位数平均数 x x1x2xnn.方差与标准差方差 s21n(x1 x)2(x2 x)2(xn x)2标准差 s1n(x1 x)2(x2 x)2(xnx)2.3两个变量间的相关关系两个变量间的相关关系中,主要是能作出散点图,了解最小二乘法的思想;能根据给出的线性回归方程系数公式建立线性回归方程体会回归分析及独立性检验的基本思想热点分
5、类突破题型一 古典概型的概率问题例 1 4 张卡片上分别写有数字 1,2,3,4,从这 4 张卡片中随机抽取 2 张,则取出的 2 张卡片上的数字之和为奇数的概率为()A.13B.12 C.23 D.34思维启迪基本事件是从 4 张卡片中抽取 2 张,抽取方法总数是确定的,每种方法的出现是均等的属于古典概型解析 方法一 设 A 表示“两张卡片上的数字之和为奇数”,则基本事件的总数为 C24,事件 A 包含的基本事件数为 C12C12,故 P(A)C12C12C24 23.方法二 设 A 表示“两张卡片的数字之和为奇数”,则A 表示“两张卡片的数字之和为偶数”,事件 A 包含的基本事件数为 2,
6、则 P(A)2C2413,P(A)1P(A)23.答案 C探究提高(1)有关古典概型的概率问题,关键是正确求出基本事件总数和所求事件包含的基本事件总数,这常常用到排列、组合的有关知识(2)对于较复杂的题目要注意正确分类,分类时应不重不漏变式训练 1袋中有大小、形状相同的红球、黑球各一个,现依次有放回地随机摸取 3 次,每次摸取一个球(1)试问:一共有多少种不同的结果?请列出所有可能的结果;(2)若摸到红球时得 2 分,摸到黑球时得 1 分,求 3次摸球所得总分为 5 的概率解(1)一共有 8 种不同的结果,列举如下:(红,红,红)、(红,红,黑)、(红,黑,红)、(红,黑,黑),(黑,红,红)
7、、(黑,红,黑),(黑,黑,红),(黑,黑,黑)(2)记“3 次摸球所得总分为 5”为事件 A.事件 A 包含的基本事件为:(红,红,黑)、(红,黑,红)、(黑,红,红),事件 A 包含的基本事件数为 3.由(1)可知,基本事件总数为 8,所以事件 A 的概率为P(A)38.题型二 几何概型的概率问题例 2在平面直角坐标系 xOy 中,设 D 是横坐标与纵坐标的绝对值均不大于 2 的点构成的区域,E 是到原点的距离不大于 1 的点构成的区域,向 D 中随机投一点,则落入 E 中的概率为_思维启迪 本题是几何概型求概率问题,可以先计算出试验的全部结果构成的区域面积和所求事件构成的区域面积,然后根
8、据几何概型的概率公式求解解析 如图所示,区域 D 表示边长为 4 的正方形的内部(含边界),区域 E 表示单位圆及其内部,因此 P1244 16.答案 16探究提高(1)当试验的结果构成的区域为长度、面积、体积、弧长、夹角等时,应考虑使用几何概型求解;(2)利用几何概型求概率时,关键是试验的全部结果构成的区域和事件发生的区域的寻找,有时需要设出变量,在坐标系中表示所需要的区域变式训练 2在区间1,1上任取两数 s 和 t,则关于 x的方程 x2sxt0 的两根都是正数的概率为()A.148B.124C.112 D.14解析 1s11t1确定的区域面积为 4.x2sxt0 有两个正实数根,所以s
9、24t0s0t0,即s24ts0所确定的区域面积为0114s2ds 112.概率 P1124 148.A题型三 频率分布直方图或频率分布表例 3某班 50 名学生在一次百米测试中,成绩全部介于 13 秒与 19 秒之间,将测试结果按如下方式分成六组:第一组,成绩大于等于 13 秒且小于 14 秒;第二组,成绩大于等于 14 秒且小于 15秒;第六组,成绩大于等于 18 秒且小于等于 19 秒如图是按上述分组方法得到的频率分布直方图设成绩小于 17 秒的学生人数占全班总人数的百分比为 x,成绩大于等于 15 秒且小于 17秒的学生人数为 y,则从频率分布直方图中可分析出x 和 y 分别为()A0
10、.9,35 B0.9,45 C0.1,35 D0.1,45解析 P(17)1P(1719)1(0.0610.041)0.9,即 x0.9,y(0.340.36)15035(人)答案 A探究提高在统计中,为了考查一个总体的情况,通常是从总体中抽取一个样本,用样本的有关情况去估计总体的相应情况这种估计大体分为两类,一类是用样本频率分布估计总体分布,另一类是用样本的某种数字特征(例如平均数、方差等)去估计总体的相应数字特征变式训练 3(2010江苏)某棉纺厂为了解一批棉花的质量,从中随机抽测了 100 根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据均在区间5,40中,其频率分布直方
11、图如图所示,则在抽测的 100根中,有_根棉花纤维的长度小于 20 mm.解析 在频率分布直方图中小于 20 mm 的频率是00150.0150.0450.3,故小于 20 mm 的棉花纤维的根数是 0.310030.答案 30题型四 茎叶图、众数、中位数、平均数、标准差例 4(2009广东)随机抽取某中学甲、乙两班各 10 名同学,测量他们的身高(单位:cm),获得身高数据的茎叶图如图所示(1)根据茎叶图判断哪个班的平均身高较高;(2)计算甲班的样本方差;(3)现从乙班这 10 名同学中随机抽取两名身高不低于173 cm 的同学,求身高 176 cm 的同学被抽中的概率思维启迪 根据茎叶图读
12、出各数据,然后根据公式计算平均值和方差解(1)由茎叶图可知:甲班身高集中于 160179 之间,而乙班身高集中于 170180 之间,因此乙班平均身高高于甲班(2)x 15816216316816817017117917918210170.甲班的样本方差 s2 110(158170)2(162170)2(163170)2(168170)2(168170)2(170170)2(171170)2(179170)2(179170)2(182170)257.2.(3)设身高为 176 cm 的同学被抽中的事件为 A,从乙班10 名同学中抽中两名身高不低于 173 cm 的同学有:(181,173),(
13、181,176),(181,178),(181,179),(179,173),(179,176),(179,178),(178,173),(178,176),(176,173)共 10 个基本事件,而事件 A 含有 4 个基本事件:(181,176),(179,176),(178,176),(176,173),P(A)41025.探究提高(1)本题考查了茎叶图的识图问题和平均数的计算,其中从茎叶图中读出数据是关键,为此,首先要弄清“茎”和“叶”分别代表什么(2)要熟练掌握众数、中位数、平均数、方差、标准差的计算方法变式训练 4(2009安徽)某良种培育基地正在培育一种小麦新品种 A,将其与原有
14、的一个优良品种 B 进行对照试验,两种小麦各种植了 25 亩,所得亩产数据(单位:千克)如下:品种 A:357,359,367,368,375,388,392,399,400,405,412,414,415,421,423,423,427,430,430,434,443,445,445,451,454品种 B:363,371,374,383,385,386,391,392,394,394,395,397,397,400,401,401,403,406,407,410,412,415,416,422,430(1)完成茎叶图;(2)用茎叶图处理现在的数据,有什么优点?(3)通过观察茎叶图,对品种
15、A 与 B 的亩产量及其稳定性进行比较,写出统计结论解(1)茎叶图如图所示.(2)由于每个品种的数据都只有 25 个,样本不大,画茎叶图很方便此时茎叶图不仅清晰明了地展示了数据的分布情况,便于比较,没有任何信息损失,而且还可以随时记录新的数据(3)通过观察茎叶图可以看出:品种 A 的亩产平均数(或均值)比品种 B 高;品种 A 的亩产标准差(或方差)比品种 B 大,故品种 A 的亩产稳定性较差题型五 线性回归方程 例 5某农科所对冬季昼夜温差大小与某反季节大豆新品种发芽多少之间的关系进行分析研究,他们分别记录了 12 月 1 日至 12 月 5 日的每天昼夜温差与实验室每天每 100 颗种子中
16、的发芽数,得到如下资料:日期12月1日 12月2日 12月3日 12月4日 12月5日温差x()101113128发芽数y(颗)2325302616该农科所确定的研究方案是:先从这五组数据中选取 2组,用剩下的 3 组数据求线性回归方程,再对被选取的2 组数据进行检验(1)求选取的 2 组数据恰好是不相邻 2 天数据的概率;(2)若选取的是 12 月 1 日与 12 月 5 日的两组数据,请根据 12 月 2 日至 12 月 4 日的数据,求出 y 关于 x 的线性回归方程y b xa;(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过 2 颗,则认为得到的线性回归方程是可靠
17、的,试问(2)中所得的线性回归方程是否可靠?思维启迪(1)问题属古典概率,可先求两组数据不相邻的概率(2)求线性回归方程,再验证线性回归方程的可靠性解(1)设事件 A 表示“选取的 2 组数据恰好是不相邻 2天的数据”,则 A 表示“选取的数据恰好是相邻 2 天的数据”基本事件总数为 10,事件 A 包含的基本事件数为 4.P(A)41025,P(A)1P(A)35.(2)x 12,y 27,3i1xiyi977,3i1x2i434,b 3i1xiyi3 xy3i1x2i 3 x 2 9773122743431222.5,a y b x 272.5123,y 2.5x3.(3)由(2)知:当
18、x10 时,y22,误差不超过 2 颗;当 x8 时,y17,误差不超过 2 颗故所求得的线性回归方程是可靠的探究提高(1)正确理解计算b、a 的公式和准确的计算,是求线性回归方程的关键(2)在分析两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程估计和预测变量的值变式训练 5下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量 x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据x3456y2.5344.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出 y 关于x 的线性回归方程y b
19、xa;(3)已知该厂技改前 100 吨甲产品的生产能耗为 90 吨标准煤试根据(2)求出的线性回归方程预测生产 100吨甲产品的生产能耗比技改前降低多少吨标准煤?(参考数值:32.5435464.566.5)解(1)如下图所示:(2)由对照数据计算得,x 345644.5,y 2.5344.543.5,4i1xiyi32.5434564.566.5,4i1x2i 3242526286.所以由最小二乘法确定的系数为b 4i1xiyi4 x y4i1x2i 4 x 2 66.543.54.58644.520.7,a y b x 3.50.74.50.35.线性回归方程为y 0.7x0.35.(3)
20、根据回归方程的预测,现在生产 100 吨产品消耗的标准煤的数量大约为y 0.71000.3570.35,耗能降低了 9070.3519.65(吨标准煤)规律方法总结 1古典概型与几何概型古典概型特点有限性 等可能性计算公式P(A)A包含的基本事件个数m总的基本事件个数n 几何概型特点无限性 等可能性计算公式P(A)构成事件A的区域长度(面积或体积)试验的全部结果所构成的区域长度(面积或体积)2.用样本估计总体(1)在频率分布直方图中,各小长方形的面积表示相应的频率,各小长方形的面积的和为 1.(2)众数、中位数及平均数的异同众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量(
21、3)当总体的个体数较少时,可直接分析总体取值的频率分布规律而得到总体分布;当总体容量很大时,通常从总体中抽取一个样本,分析它的频率分布,以此估计总体分布总体期望的估计,计算样本平均值 x 1nni1xi.总体方差(标准差)的估计:方差1nni1(xi x)2,标准差 方差,方差(标准差)较小者较稳定.知能提升演练一、选择题1.学校为了调查学生在课外读物方面的支出情况,抽出了一个容量为 n 的样本,其频率分布直方图如图所示,其中支出在50,60)元的同学有 30 人,则n 的值为()A90B100C900D1 000解析 支出在50,60)元的概率为10.10.240.360.3,又支出在50,
22、60)元的同学共有 30 人n300.3100(人),故选 B.B2.某校对高三年级的学生进行体检,现将高三男生的体重(单位:kg)数据进行整理后分成五组,并绘制频率分布直方图(如图所示)根据一般标准,高三男生的体重超过 65 kg 属于偏胖,低于 55 kg 属于偏瘦,已知图中从左到右第一、第三、第四、第五小组的频率分别为 0.25,0.20,0.10,0.05,第二小组的频率数为 400,则该校高三年级的男生总数和体重正常的频率分别为()A1 000,0.50 B800,0.50C1 000,0.60 D800,0.60解析 本题考查频率分布直方图知识由已知可得第二组的频率为 1(0.25
23、0.20.10.05)0.4,由于其相应的频数为 400,故总体容量为4000.401 000,体重正常的频率即为第二小组和第三小组频率之和,即 0.400.200.60.答案 C3如图是某电视台综艺节目举办的挑战主持人大赛上,七位评委为某选手打出的分数的茎叶统计图,去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为()A.84,4.84 B84,1.6C85,4 D85,1.6解析 根据茎叶图可得这 7 个数据分别为:79,84,84,86,84,87,93,则去掉一个最高分和一个最低分后的平均分为 x 15(8438687)85,方差为 s215(8485)23(8685)2(87
24、85)21.6,故答案为 D.答案 D4设 b 和 c 表示先后抛掷一枚骰子得到的点数,则方程 x2bxc0 有实根的概率为()A.1736 B.1936C.2136 D.2536解析 基本事件总数为 6636,若使方程有实根,则b24c0,即 b2 c.当 c1 时,b2,3,4,5,6;当 c2 时,b3,4,5,6;当 c3 时,b4,5,6;当 c4 时,b4,5,6;当 c5 时,b5,6;当 c6 时,b5,6.所以目标事件个数为 54332219,因此方程 x2bxc0 有实根的概率为1936.故选 B.B5袋中有大小相同的 4 个红球和 6 个白球,随机从袋中取 1 个球,取后
25、不放回,那么恰好在第 5 次取完红球的概率是()A.1210B.2105 C.221 D.821解析“恰好在第 5 次取完红球”记为 A,P(A)C14C16A44A510 46432109876 2105,故选 B.B二、填空题6某校高三数学测试中,对 90 分以上(含 90 分)的成绩进行统计,其频率分布直方图如图所示若 130140分数段的人数为 90,则 90100 分数段的人数为_解析 根据频率分布直方图可知,130140 分数段的频率为 0.05,而 90100 分数段的频率为 0.45,故这一分数段的人数为 900.450.05810 人810 7(2009江苏)现有 5 根竹竿
26、,它们的长度(单位:m)分别为 2.5,2.6,2.7,2.8,2.9,若从中一次随机抽取 2 根竹竿,则它们的长度恰好相差 0.3 m 的概率为_解析 从 5 根竹竿中一次随机抽取 2 根竹竿共有 C2510 种抽取方法,而抽取的两根竹竿长度恰好相差 0.3 m的情况是 2.5 和 2.8,2.6 和 2.9 两种,概率 P 2100.2.0.2 8某汽车站每天均有 3 辆开往济南的分为上、中、下等级的客车,某天袁先生准备在该汽车站乘车前往济南办事,但他不知道客车的车况,也不知道发车顺序为了尽可能乘上上等车,他采取如下策略:先放过一辆,如果第二辆比第一辆好则上第二辆,否则上第三辆那么他乘上上
27、等车的概率为_.解析 共有 6 种发车顺序:上、中、下上、下、中中、上、下中、下、上下、中、上下、上、中(其中画横线的表示袁先生所乘的车),所以他乘坐上等车的概率为3612.12三、解答题9育新中学的高二一班男同学有 45 名,女同学有 15名,老师按照分层抽样的方法组建了一个 4 人的课外兴趣小组(1)求某同学被抽到的概率及课外兴趣小组中男、女同学的人数;(2)经过一个月的学习、讨论,这个兴趣小组决定选出两名同学做某项实验,方法是先从小组里选出 1名同学做实验,该同学做完后,再从小组内剩下的同学中选一名同学做实验,求选出的两名同学中恰有一名女同学的概率;(3)试验结束后,第一次做试验的同学得
28、到的试验数据为 68,70,71,72,74,第二次做试验的同学得到的试验数据为 69,70,70,72,74,请问哪位同学的实验更稳定?并说明理由解(1)Pnm 460 115,某同学被抽到的概率为 115.设有 x 名男同学,则4560 x4,x3,男、女同学的人数分别为 3,1.(2)把 3 名男同学和 1 名女同学记为 a1,a2,a3,b,则选取两名同学的基本事件有:(a1,a2),(a1,a3),(a1,b),(a2,a1),(a2,a3),(a2,b),(a3,a1),(a3,a2),(a3,b),(b,a1),(b,a2),(b,a3)共 12 种,其中有一名女同学的有 6 种
29、选出的两名同学中恰有一名女同学的概率为 P 61212.(3)x 16870717274571,x 26970707274571,s21(6871)2(7471)254,s22(6971)2(7471)253.2第二次做实验的同学的实验更稳定10.某学校的篮球队、羽毛球队、乒乓球队各有 10 名队员,某些队员不止参加了一支球队,具体情况如图所示,现从中随机抽取一名队员,求:(1)该队员只属于一支球队的概率;(2)该队员最多属于两支球队的概率(2)记“随机抽取一名队员,该队员最多属于两支球队”为事件 B.则 P(B)1P(B)1 220 910.故随机抽取一名队员,该队员最多属于两支球队的概率为 910.解 从图中可以看出,3 个球队共有 20 名队员(1)记“随机抽取一名队员,该队员只属于一支球队”为事件 A.所以 P(A)3542035.故随机抽取一名队员,只属于一支球队的概率为35.返回