1、5.1 统 计 5.1.1 数据的收集 第五章 统计与概率 学习目标 1.了解总体与样本、普查与抽样调查的概念.2.理解简单随机抽样的概念,会用抽签法和随机数表法从总体中抽取样本.3.理解分层抽样的概念,会用分层抽样从总体中抽取样本.重点:简单随机抽样、分层抽样的应用.难点:选择合适的方法从实际问题的总体中抽取样本.知识梳理 1.统计数据主要 来源 统计数据主要来自两种方式:直接获取、间接获取获取数据的方式 直接获取 间接获取 获取数据常用渠道 问卷调查、试验收集等 报纸杂志、广播电视媒体、互联网、统计报表等 获取数据注意事项 数据来源的广泛性、代表性、均衡性 正确理解所用数据,引用数据注明出
2、处 普查与抽样调查 一般地,对总体中每个个体都进行考察的方法称为普查(也称为全面调查),只抽取样本进行考察的方法称为抽样调查.总体、个体、样本、样本容量的概念 所考察问题涉及的对象全体是总体,总体中每个对象都是个体,抽取的部分对象组成总体的一个样本,一个样本中包含的个体数目是样本容量.2.简单随机抽样(也称为纯随机抽样)一般地,简单随机抽样就是从总体中不加任何分组、划类、排队等,完全随机地抽取个体.简单随机抽样是其他各种抽样方法的基础.当总体中的个体之间差异程度较小和总体中个体数目较少时,通常采用这种方法.常见的简单随机抽样方法有抽签法、随机数表法.3.用随机数表进行简单随机抽样的一般步骤为:
3、(1)对总体进行编号.(2)在随机数表中任意指定一个开始选取的位置.位置的确定可以闭着眼用手指随机 确定,也可用其他方式随机确定.(3)按照一定规则选取编号.例如,若编号是两位,规则可以是每次从左往右选取两个 数字,也可以是每次只选取每一组的前两个数字,还可以是每次只选取下面一行同一位置对应的两个数字,等等.规则一经确定,就不能更改.在选取过程中,遇到超过编号范围或已经选取了的数字,应该舍弃.(4)按照得到的编号找出对应的个体.4.随机数表法的优缺点 优点:简单易行,它很好地解决了抽签法中遇到的当总体个数较多时制签难、号签很难被搅拌均匀的问题.缺点:当总体个数很多,需要的样本容量较大时,不太方
4、便.5.抽签法与随机数表法的异同点 抽签法 随机数表法 不同点 抽签法比随机数表法简单;抽签法适用于总体中的个体数相对较少的情况 随机数表法要求编号的位数相同;随机数表法适用于总体中的个体数相对较多的情况 相同点 都是简单随机抽样,并且要求被抽取样本的总体的个数有限 6.分层抽样 一般地,如果相对于要考察的问题来说,总体可以分成有明显差别的、互不重叠的几部分时,每一部分可称为层,在各层中按层在总体中所占比例进行随机抽样的方法称为分层随机抽样(简称为分层抽样).通过分层抽样所得到的样本,一般更具有代表性,可以更准确地反映总体的特征,尤其是在层内个体相对同质而层间差异较大时更是如此.分层抽样在各层
5、中抽样时,还可根据各层的特点灵活地选用不同的随机抽样方法.分层抽样具有如下特点(1)适用于总体由差异明显的几部分组成的情况;(2)按比例确定每层抽取个体的个数;(3)在每一层进行抽样时,采用简单随机抽样的方法;(4)分层抽样能充分利用已掌握的信息,使样本具有良好的代表性;(5)分层抽样也是等机会抽样,每个个体被抽到的可能性都是总体容量N样本容量n,而且在每层抽样时,可以根据个体情况采用不同的抽样方法.对于分层抽样中的比值问题对于分层抽样中的比值问题,常利用以下关系式求解(1)样本容量n总体容量N 各层抽取的样本数该层的容量;(2)总体中各层容量之比对应层抽取的样本数之比。简单随机抽样和分层抽样
6、的比较 类别 共同点 各自特点 联系 适用范围 简单随机抽样 抽样过程中每个个体被抽到的可能性都相等;每次抽出个体后都不放回,即都是不放回抽样 从总体中逐个抽取 在各层抽样时采用简单随机抽样 总体个数较少 分层抽样 将总体分成几层,分层进行抽取 总体由差异明显的几部分组成 题型一 总体与样本 常考题型 例1.2019湖北重点高中协作体高二联考某公司有350名员工参加了今年的年度考核.为了了解这350名员工的考核成绩,公司决定从中抽取50名员工的考核成绩进行统计分析.在这个问题中,50名员工的考核成绩是()A.总体 B.样本容量 C.个体 D.样本【解析】因为本题是从350名员工的考核成绩中抽取
7、50名员工的考核成绩,所以50名员工的考核成绩是样本,故选D.【答案】D 训练题1.2019河南辉县一中高二月考某幼儿园为了了解全园310名小班学生的身高情况,从中抽取31名学生进行身高测量.下列说法正确的是()A.总体是310 B.310名学生中的每一名学生都是个体 C.样本是31名小班学生 D.样本容量是31【归纳总结】对统计的相关概念的理解(1)总体是某一数值指标的全体,而不是调查对象的全体.(2)个体是构成总体的元素,因此构成总体的每一个数值指标都为个体.(3)样本是总体的一部分,因此样本容量一定小于总体中的个体数.说明:从集合的角度来看,总体就是全集,而样本是其中的一个子集,统计的基
8、本思想就是用子集估计全集.题型二 普查与抽样调查 例2 2019广东深圳南山 区 校 级 测 试 下 列 任 务 中,适 合 采 用 普 查 方 式 的是 .了解一沓钞票中是否有假币;了解一批炮弹的杀伤半径;了解某天本校因病缺课的学生数;调查某电视剧在某市的收视率;调查乘坐飞机的旅客是否携带了违禁物品.【解析】了解一沓钞票中是否有假币,意义重大,应采用普查.具有破坏性,不适合采用普查.因病缺课的学生人数少,耗时短,应采用普查.人数较多,需要耗费大量的人力和较长的时间,因此不适宜用普查.意义重大,人数不是很多,适合采用普查.【答案】【归纳总结】抽样调查是通过调查被调查对象的一部分来收集数据,因而
9、抽样调查的结果与普查的结果可能有一些误差,但抽样调查投入少、操作方便,而且有时只能用抽样调查的方式去调查.【训练题2】2019湖北黄石校级月考下列调查适合用抽样调查的是 .了解某电视机厂生产的电视机的质量;语文老师要检查某个学生作文中的错别字;某部门要了解某湖的水质情况;调查某市高中生对健康知识的了解情况.题型三 简单随机抽样的判断及其应用【例3】2019湖南长沙一中检测下列抽样方法是简单随机抽样的是 (填序号).从无数个个体中抽取20个个体作为样本;从50台冰箱中一次性抽取5台冰箱进行质量检测;彩民选号,从装有36个大小、形状都相同的号签的盒子中无放回地抽出6个号签;某车间工人加工一种零件1
10、00个,为了解这100个零件的直径,从中有放回地抽取5个进行测量.【解析】不是简单随机抽样,因为总体的个数是无限的,不是有限的;不是简单随机抽样,在这次抽取中,没有逐个抽取,而是一次性抽取;是简单随机抽样,因为满足“总体个数有限、逐个抽取、无放回抽样、等可能抽样”这四个特点;不是简单随机抽样,在这次抽取中,不是无放回抽取.【答案】归纳总结 简单随机抽样的特点及判断方法(1)总体个数有限:简单随机抽样要求被抽取样本的总体个数有限,这样便于通过样本对总体进行分析.(2)逐个抽取:简单随机抽样是从总体中逐个进行抽取,这样便于实际操作.(3)无放回抽样:简单随机抽样是一种无放回抽样,这样便于样本的获取
11、和一些相关的计算.(4)等可能抽样:每次从总体中抽取一个个体时各个个体被抽取的可能性相等,而且在整个抽样过程中,各个个体被抽取的可能性相等,从而保证了这种抽样方法的公平性.训练题32019河南正阳二中高二检测从52名学生中选取5名学生参加数学竞赛,若采用简单随机抽样抽取,则每人入选的可能性()A.都相等,且为 152 B.都相等,且为 110 C.都相等,且为 552 D.都不相等【方法技巧】简单随机抽样是等可能抽样,即在抽样过程中,每个个体被抽到的可能性相等,这也体现了抽样方法的客观性和公平性.若样本容量为n,总体的个体数为N,则每个个体被抽到的概率都是,这是进行一些数据计算的依据.题型四
12、随机数表法及其应用例4 2019黑龙江哈尔滨三中高二期末总体由编号为01,02,03,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第3列开始由左到右依次选取两个数字,则选出来的第5个个体的编号为()78 16 65 72 08 02 63 14 07 02 43 69 97 28 01 98 32 04 92 34 49 35 82 00 36 23 48 69 69 38 74 81 A.08 B.07 C.02 D.01【解析】【解析】从随机数表第1行的第3列开始由左到右依次选取两个数字中小于20的编号,依次为16,08,02,14,07,则第5
13、个个体的编号为07.故选B.【答案】B训练题4.2019广东中山一中等七校联合体高三联考假设要考察某公司生产的流感疫苗的剂量是否达标,现从500支疫苗中抽取50支进行检验,利用随机数表法抽取样本时,先将500支疫苗按000,001,499进行编号,如果从随机数表第7行第8列的数字开始向右读,请写出第8支疫苗的编号 .(下面摘取了随机数表第7行至第9行)84 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 76 63 01 63 78 59 16 95 56 67 19 98 10 50 71 75 12
14、86 73 58 07 44 39 52 38 79 33 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 54【规律方法】利用随机数表法抽取个体时,关键有三点:(1)编号位数一致;(2)确定以表中的哪个数(哪行哪列)作为起点,以哪个方向作为读数的方向,读数的方法;(3)读数时注意结合编号特点进行读取,如编号为两位,则两位、两位地读取,编号为三位,则三位、三位地读取.题型五 分层抽样及其应用 例5.(1)2019云南昆明黄冈实验学校高二期末从某地区中小学生中抽取部分学生,进行肺活量调查.经了解,该地区小学
15、、初中、高中三个学段学生的肺活量有较大差异,而同一学段男女生的肺活量差异不大.在下面的抽样方法中,最合理的抽样方法是()A.抽签法 B.按性别分层抽样 C.按学段分层抽样 D.随机数表法(2)为了保证分层抽样时,每个个体等可能地被抽取,必须要求()A.每层的个体数必须一样多 B.每层抽取的个体数相等 C.每层抽取的个体可以不一样多,但必须满足niinNN(i1,2,k),其中k是层数,n是样本容量,Ni是第i层所包含的个体数,N是总体容量 D.只要抽取的样本容量一定,每层抽取的个体数没有限制【解析】(1)小学、初中、高中三个学段学生的肺活量有较大差异,而性别肺活量差异不大,故应按学段进行分层抽
16、样.【答案】C(2)【答案】C【归纳总结】在分层抽样过程中,为了保证每个个体被抽到的可能性是相同的,这就要求各层抽取的个体数与该层包含的个体数之比等于样本容量与总体容量之比,即niNinN,利用此关系式很容易解决分层抽样过程中的计算问题.训练题5.2019黑龙江齐齐哈尔四校联盟高二联考某地区共有10万户居民,该地区城市住户与农村住户之比为46,根据分层抽样方法,调查了该地区1 000户居民电脑拥有情况,调查结果如下表所示,那么可以估计该地区农村住户中无电脑的总户数约为()A.1.5万户 B.4.5万户 C.1.76万户 D.0.27万户 城市 农村 有电脑 360户 450户 无电脑 40户 150户 小结 1.统计学中的样本一般都是通过抽样调查得出的。2.抽样调查简称为抽查,抽查分为简单随机抽样和分层抽样。简单随机抽样又分为抽签法和随机数表法。3.简单随机抽样和分层抽样都具有公平性,对于每个个体被抽取的可能性都是相等的。4.对于抽取的样本数较少时常用抽签法,样本数较大时常用随机数表法,总体中各部分有明显差异时,常用分层抽样,分层抽样所得各部分的比例与总体中各层的比例是相等的。