1、第五章 统计与概率 章末复习 知识系统整合堵点自记: 规律方法收藏1抽样方法的选择和设计本章学习了比较典型和常用的抽样方法:简单随机抽样、分层抽样,它们的共同点:都是不放回抽样;在抽样过程中,每个个体被抽到的可能性相等,体现了抽样的客观性和公平性(1)抽样方法的要点简单随机抽样:是抽样中一个最基本的方法逐一不放回地抽取一次抽取所有样本和抽取样本检查后放回样本都不是简单随机抽样分层抽样:将总体分成若干层,在各层中按照该层个体数在总体中所占比例随机抽取一定的样本(2)抽样方法应用的注意点抽签法中,注意使用已有编号,号签形状、大小一致,搅拌均匀;随机数表法中,首先对个体所编号码位数要相同,当题目所给
2、位数不同时,以位数较多的为准,在位数较少的数前面添“0”,凑齐位数,其次是注意编号去重,即舍去抽中的相同编号分层抽样中,根据实际情况,可对每层所抽取的数目进行适当的细微调整如某中学高中学生有900名,为了考察他们的体重情况,打算抽取一个容量为45的样本已知高一有402名学生,高二有296名学生,高三有202名学生采用分层抽样,样本容量与总体容量的比为45900120,则应从这三个年级中抽取的学生数分别为20.1;14.8;10.1,而学生人数只能是整数,对以上结果进行适当调整,应从三个年级中分别抽取20名,15名,10名学生(3)抽样方法的适用原则看总体是否由差别明显的几个部分组成若是,则选用
3、分层抽样;否则,考虑用简单随机抽样看总体容量和样本容量的大小当总体容量较小时,采用抽签法;当总体容量较大、样本容量较小时,采用随机数表法(4)抽样方法的设计设计抽样方法时,最核心的问题就是要考虑如何使抽取的样本具有代表性,为此在设计抽样方法时,充分利用对总体情况的了解是非常重要的2用样本估计总体现实中的总体所包含的个体数往往是很多的,因此我们可通过获取样本数据,分析样本的数字特征和样本的分布,进而对总体作出估计(1)估计总体的数字特征通常我们用样本的平均数和方差(标准差)来近似代替总体的平均数和方差(标准差),呈现样本数据的集中趋势及波动大小,从而实现对总体的估计一般情况下,需要将平均数和标准
4、差结合,得到更多样本数据的信息,从而对总体作出较好的估计因为平均数容易掩盖一些极端情况,使我们对总体作出片面的判断,而标准差较好地避免了极端情况若两组数据的平均数差别很大,也可以仅比较平均数,估计总体的平均水平,从而作出判断(2)估计总体的分布样本的分布以图表的形式给出,常见的统计图表有频率分布表、频率分布直方图、茎叶图,三者的优缺点如下:表示样本分布的方法优点缺点频率分布表在数量表示上比较确切不够直观、形象,损失了样本的一些信息,分析数据分布的总体情况不够方便频率分布直方图能够很容易地表示大量数据,非常直观地表示数据分布的情况,使我们能够看到在频率分布表中看不清楚的数据模式从直方图本身不能得
5、出原始的数据内容,把数据表示成直方图后,原有的数据信息被抹掉了茎叶图一是所有的信息都可以从这个茎叶图中得到;二是茎叶图便于记录和表示,能够展示数据的分布情况样本数据较多或数据位数较多时,不方便表示数据频率分布直方图中相关计算的常用结论a图中小矩形的面积组距频率b所有小矩形的面积之和为1.需要注意的是:通过样本数据的统计图表和数字特征,我们能够估计总体的信息,而且样本容量越大,这种估计也就越精确当样本数据发生变化时,总体的这些信息不会变化3对随机事件的理解(1)随机事件是指一定条件下出现的某种结果,即随着条件的改变其结果也会不同,因此必须强调同一事件在相同的条件下进行研究(2)随机事件在一次试验
6、中是否发生是不确定的,但在大量重复试验中,随机事件的发生是有规律的4频率与概率的联系与区别随机事件的频率,是指事件发生的次数与试验总次数的比值它具有一定的稳定性,总在某个常数附近摆动,但随着试验次数的不断增加,摆动幅度越来越小,这时可把这个常数作为这个事件的概率概率可看作频率在理论上的期望值,它从数量上反映了随机事件发生的可能性的大小在大量重复试验的前提下,可以用频率来估计这个事件的概率5互斥事件与对立事件(1)互斥事件是不可能同时发生的两个事件;对立事件除要求这两个事件不能同时发生外,还要求二者必须有一个发生因此对立事件一定是互斥事件,但互斥事件不一定是对立事件,对立事件是互斥事件的特殊情况
7、(2)应用互斥事件的概率加法公式时,要注意首先确定诸事件彼此互斥,然后分别求出各事件发生的概率,再求和求复杂事件的概率通常有两种方法:一是将所求事件转化成彼此互斥的事件的和;二是先求其对立事件的概率,然后再应用公式P(A)1P()求解6古典概型对于古典概型概率的计算,关键是分清样本空间中样本点的总个数n与事件中包含的样本点个数m,有时需用列举法把样本空间中的样本点一一列举出来,再利用公式P(A)求出事件的概率这是一个形象、直观的好方法,但列举时必须做到不重复、不遗漏7事件相互独立的判断利用相互独立事件的定义(即P(AB)P(A)P(B)可以判定两个事件是否相互独立,这是用定量方法进行分析的定量
8、计算,可以较为准确、果断地判断两个事件是否相互独立因此我们必须熟练掌握这种方法,但需要注意的是互斥事件与相互独立事件之间有一定的关系,也就是若两个事件相互独立,则一定不能互斥(对立);反之,若两个事件互斥(对立),则不能相互独立 学科思想培优一、抽样方法的选取及应用随机抽样方法有简单随机抽样、分层抽样两种典例1(1)某校选修乒乓球课程的学生中,高一年级有30名,高二年级有40名,现用分层抽样的方法在这70名学生中抽取一个样本,已知在高一年级的学生中抽取了6名,则在高二年级的学生中应抽取的人数为()A6B8C10D12(2)问题:某小区有800户家庭,其中高收入家庭200户,中等收入家庭480户
9、,低收入家庭120户,为了了解有关家用轿车购买力的某个指标,要从中抽取一个容量为100的样本;从10名学生中抽取3人参加座谈会方法:a.简单随机抽样;b.分层抽样则问题与方法配对正确的是()Aa,bBb,bCa,aDb,a解析(1)分层抽样的原理是按照各部分所占的比例抽取样本设从高二年级抽取的学生数为n,则,解得n8.(2)问题中的总体是由差别明显的几部分组成的,故可采用分层抽样方法;问题中总体的个数较少,故可采用简单随机抽样故匹配正确的是D.答案(1)B(2)D二、用样本的数字特征估计总体的数字特征样本的数字特征可分为两大类,一类反映样本数据的集中趋势,包括样本平均数、众数、中位数;另一类反
10、映样本数据的波动大小,包括样本方差及标准差通常,我们用样本的数字特征估计总体的数字特征有关样本平均数及方差的计算和应用是高考考查的热点典例2甲、乙两人在相同的条件下各射靶10次,每次射靶成绩(单位:环)如图所示(1)填写下表:平均数中位数命中9环及以上甲7_1乙_3(2)请从四个不同的角度对这次测试进行分析:结合平均数和方差,分析偏离程度;结合平均数和中位数,分析谁的成绩好些;结合平均数和命中9环及以上的次数,看谁的成绩好些;结合折线图上两人射击命中环数及走势,分析谁更有潜力解(1)甲的射靶环数从小到大排列为5,6,6,7,7,7,7,8,8,9,其中位数为7.乙的射靶环数依次为2,4,6,8
11、,7,7,8,9,9,10,乙(24687789910)7.乙的射靶环数从小到大排列为2,4,6,7,7,8,8,9,9,10,其中位数是7.5.于是填充后的表格,如下所示:平均数中位数命中9环及以上甲771乙77.53(2)s(57)2(67)22(77)24(87)22(97)21.2,s(27)2(47)2(67)2(77)22(87)22(97)22(107)25.4.甲、乙的平均数相同,均为7,但sP(A2),所以甲应选择路径L1;P(B1)10.20.8,P(B2)10.10.9,因为P(B2)P(B1),所以乙应选择路径L2.七、古典概型古典概型是一种最基本的概型,也是学习其他概
12、率的基础在高考题中,经常出现此种概型的题目用古典概型计算概率时,一定要验证所构造的样本空间的样本点是否是等可能的,同时要弄清所求事件所包含的等可能出现的结果(样本点)的个数典例10某高速公路服务区临时停车场按时段收费,收费标准为:每辆汽车一次停车不超过1小时收费5元,超过1小时的部分每小时收费7元(不足1小时的部分按1小时计算)现有甲、乙两人在该服务区临时停车,两人停车都不超过4小时(1)若甲停车1小时以上且不超过2小时的概率为,停车付费多于12元的概率为,求甲停车付费恰为5元的概率;(2)若每人停车的时长在每个时段的可能性相同,求甲、乙两人停车付费之和为38元的概率解(1)设“甲停车付费恰为
13、5元”为事件A,则P(A)1.所以甲停车付费恰为5元的概率是.(2)甲停车付费a元,乙停车付费b元其中a,b5,12,19,26.则甲、乙两人的停车费用构成的样本空间的样本点为(5,5),(5,12),(5,19),(5,26),(12,5),(12,12),(12,19),(12,26),(19,5),(19,12),(19,19),(19,26),(26,5),(26,12),(26,19),(26,26),共16个,且这16个样本点发生的可能性是相等的其中,(12,26),(19,19),(26,12)这3个样本点符合题意故“甲、乙两人停车付费之和为38元”的概率为P.八、独立事件与互斥
14、事件综合问题的概率求复杂事件的概率一般可分为三步进行:列出题中涉及的各个事件,并用适当的符号表示它们;理清各事件之间的关系,列出关系式;根据事件之间的关系准确地运用概率公式进行计算典例11某项选拔共有四轮考核,每轮设有一个问题,能正确回答问题者进入下一轮考核,否则即被淘汰已知某选手能正确回答第一、二、三、四轮问题的概率分别为、,且各轮问题能否正确回答互不影响(1)求该选手进入第四轮才被淘汰的概率;(2)求该选手至多进入第三轮考核的概率解(1)记“该选手能正确回答第i轮的问题”的事件为Ai(i1,2,3,4),则P(A1),P(A2),P(A3),P(A4),该选手进入第四轮才被淘汰的概率P1P(A1A2A34)P(A1)P(A2)P(A3)P(4).(2)该选手至多进入第三轮考核的概率:P2P(1A12A1A23)P(1)P(A1)P(2)P(A1)P(A2)P(3).