1、考纲链接第一章集合与常用逻辑用语第十一章统 计1.随机抽样(1)理解随机抽样的必要性和重要性(2)会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法2用样本估计总体(1)了解分布的意义和作用,能根据频率分布表画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点(2)理解样本数据标准差的意义和作用,会计算数据标准差(3)能从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释(4)会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想(5)会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题3变量的相关性
2、(1)会做两个有关联变量的数据的散点图,并利用散点图认识变量间的相关关系(2)了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程(线性回归方程系数公式不要求记忆)4了解回归分析的思想、方法及其简单应用 5了解独立性检验的思想、方法及其初步应用11.1 随机抽样1简单随机抽样(1)简单随机抽样:一般地,设一个总体含有 N 个个体,从中逐个_地抽取n 个个体作为样本(nN),如果每次抽取时总体内的各个个体被抽到的机会_,就把这种抽样方法叫做简单随机抽样(2)最常用的简单随机抽样方法有两种:_法和_法抽签法(抓阄法):一般地,抽签法就是把总体中的 N 个个体_,把号码写在号签上,
3、将号签放在一个容器中,搅拌均匀后,每次从中抽取_个号签,连续抽取_次,就得到一个容量为 n 的样本随机数法:随机数法就是利用_、随机数骰子或计算机产生的随机数进行抽样简单随机抽样有操作简便易行的优点,在总体个数不多的情况下是行之有效的2系统抽样(1)一般地,假设要从容量为 N 的总体中抽取容量为 n 的样本,我们可以按下列步骤进行系统抽样:先将总体的 N 个个体_有时可直接利用个体自身所带的号码,如学号、准考证号、门牌号等;确定分段间隔 k,对编号进行分段当Nn(n 是样本容量)是整数时,取 kNn,如果遇到Nn不是整数的情况,可以先从总体中随机地剔除几个个体,使得总体中剩余的个体数能被样本容
4、量整除;在第 1 段用_抽样方法确定第一个个体编号 l(lk);按照一定的规则抽取样本通常是将 l 加上_得到第 2 个个体编号_,再_得到第 3 个个体编号_,依次进行下去,直到获取整个样本(2)当总体中元素个数较少时,常采用_,当总体中元素个数较多时,常采用_3分层抽样(1)分层抽样的概念:一般地,在抽样时,将总体分成_的层,然后按照一定的_,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样(2)当总体是由_的几个部分组成时,往往选用分层抽样的方法(3)分层抽样时,每个个体被抽到的机会是_的自查自纠1(1)不放回 都相等(2)抽签 随机数 编号
5、1 n 随机数表2(1)编号 简单随机间隔 k(lk)加 k(l2k)(2)简单随机抽样 系统抽样3(1)互不交叉 比例(2)差异明显(3)均等 1.(2019江门一模)甲、乙、丙、丁四所学校分别有 150,120,180,150 名高二学生参加某次数学调研测试.为了解学生的能力水平,需从这 600 名学生中抽取一个容量为 100 的样本作卷面分析,记这项调查为;在丙校有 10 名数学培优生,需要从中抽取 4 名学生进行失分分析,记这项调查为.完成这两项调查宜采用的抽样方法依次是()A.分层抽样法、系统抽样法B.分层抽样法、简单随机抽样法C.系统抽样法、分层抽样法D.简单随机抽样法、分层抽样法
6、解:对于,四所学校学生有差异,故宜使用分层抽样,在同一所学校,且人数较少,宜使用简单随机抽样 故选 B.2.(2019 春日照期末)某班由 50 个编号为 01,02,03,50 的学生组成,现在要选取 8 名学生参加合唱团,选取方法是从随机数表(见下表)的第 1行的第 11 列开始由左到右依次选取两个数字,则该样本中选出的第 8 名同学的编号为()A.20 B.25 C.26 D.34解:从随机数表的第 1 行的第 11 列开始由左到右依次选取两个数字,选出来的8名学生的编号分别为:17,37,(93 舍去)23,(78 舍去)30,35,20,(96舍去)(23 舍去)(84 舍去)26,
7、34.所以样本选出来的第 8 名同学的编号为 34.故选 D.3.(2019河南二模)某学校为落实学生掌握社会主义核心价值观的情况,用系统抽样的方法从全校 2 400 名学生中抽取30 人进行调查.现将 2 400 名学生随机地从 12 400 编号,按编号顺序平均分成 30 组(180 号,81160 号,2 3212 400 号),若第 3 组与第 4 组抽出的号码之和为 432,则第 6组抽到的号码是()A.416B.432C.448D.464解:样本间隔为 2 4003080,设首个号码为 x,则第三、第四个号码分别为 x160,x240,则 x160 x2402x400432,解得
8、x16.则第 6 组抽到的号码为 1680540016416.故选 A.4.(2018全国卷)某公司有大量客户,且不同年龄段客户对其服务的评价有较大差异.为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合适的抽样方法是.解:由于对不同年龄段客户进行抽样调查,故采用分层抽样最合适故填分层抽样5.(2019 春南京期末)为调查某髙校学生对“一带一路”政策的了解情况,现采用分层抽样的方法抽取一个容量为 500的样本,其中大一年级抽取 200 人,大二年级抽取 100 人.若其他年级共有学生 2 000 人,则该校学生总人数是.解:依题意,其他年级共
9、抽取 500200100200(人),而其他年级共有学生 2 000 人,所以抽样比为 2002 000 110,所以该校学生总人数是 500 1105 000.故填 5 000.类型一 简单随机抽样例 1 高一(3)班有学生 60 人,为了解学生对网购的看法,现要从中抽取一个容量为 10 的样本,问此样本若采用简单随机抽样,将如何获得?试设计抽样方案.解:方法一(抽签法)编号,将这 60 名学生编号为 1,2,60;制签,将这 60 个号码分别写在 60 张大小、形状相同的纸片上;搅拌,将这 60 张纸片放到一个不透明的盒子里搅拌均匀;抽签入样,抽出一张记下上面的号码(不放回),然后再搅拌均
10、匀,接着抽取第 2 张,记下号码重复这个过程直到取到 10 个号码为止 这样,与这 10个号码对应的 10 名学生就构成了一个简单的随机样本 方法二(随机数表法)将 60 名学生编号,可以编为 00,01,02,59;选定随机数表中的起始数,任选一方向作为读数方向,如指定从随机数表中的第 2 行第 2 个数 7 开始;从选定的起始数 7 开始向右每次读取两位,凡不在 0059 中的数或已读过的数,都跳过不作记录,直至取得 10 个不同号码 于是得到抽取的样本号码是 42,46,24,28,11,45,04,25,33,23,这样,与这 10 个号码对应的 10 名学生就构成了一个简单的随机样本
11、评析 考虑到总体中个体数较少,利用抽签法或随机数表法很容易获取样本,但须按这两种抽样方法的操作步骤进行.注意掌握随机数表的使用方法.应用随机数表法的三个关键点:一是确定以表中的哪个数(哪行哪列)为起点,以哪个方向为读数的方向;二是读数时注意结合编号特点进行读取,若编号为两位数字,则两位两位地读取,若编号是三位数字,则三位三位地读取;三是注意筛选,超出编号范围的不取,重复的不取.变式 1 某颁奖典礼准备邀请 20 名艺人参与演出,其中从 30 名舞蹈艺人中随机挑选 10 人,从 18 名歌唱艺人中随机挑选 6 人,从 10 名相声艺人中随机挑选 4 人.试用抽签法确定选中的艺人,并确定他们的表演
12、顺序.解:第一步,先确定艺人:将 30 名舞蹈艺人从 0130 编号,然后用相同的纸条做成 30 个号签,分别写上这些编号,再放入一个不透明小盒中摇匀,从中抽出 10 个号签,则相应编号的艺人参加演出运用相同的办法分别从 10 名相声艺人中抽取 4 人,从18 名歌唱艺人中抽取 6 人 第二步,确定演出顺序:确定了演出人员后,再用相同的纸条做成 20 个号签,上面写上 120 这 20 个数字,代表演出的顺序,放在暗盒中搅匀后让每个艺人抽一张,每人抽到的号签上的数字就是这位艺人的演出顺序,再汇总即可类型二 系统抽样例 2 某批产品共有 1 564 件,产品按出厂顺序编号,号码从 1 到 1 5
13、64,检测员要从中抽取 15 件产品作检测,请给出一个系统抽样方案.解:先从 1 564 件产品中,随机找到 4 件产品,将其剔除(可用随机数法)将余下的 1 560 件产品编号:1,2,3,1 560.确定分段间隔 k1 56015 104,将总体均分为 15 组,每组含 104 个个体 从第一组即 1 号到 104 号中随机抽取一个号 s.将编号为 s,104s,208s,1 456s 的 15 个个体选出,即得到一个容量为 15 的样本 评析 总体容量和样本容量都较大时,选用系统抽样比较合适;系统抽样的号码成等差数列,公差为每组的容量;总体中的每个个体都必须等可能的入样,若总体容量不能被
14、样本容量整除,可以先从总体中随机的剔除几个个体,然后再分段.变式 2(1)(2019全国卷)某学校为了解 1 000 名新生的身体素质,将这些学生编号为 1,2,1 000,从这些新生中用系统抽样方法等距抽取 100 名学生进行体质测验.若 46 号学生被抽到,则下面 4 名学生中被抽到的是()A.8 号学生B.200 号学生C.616 号学生D.815 号学生解法一:设第 n 号被抽到,由组距为 10 且 46 号被抽到知n4610 为整数,仅 C 符合要求 解法二:由已知将 1 000 名学生分成 100 组,每组10 名学生,用系统抽样,46 号学生被抽到,所以第一组抽到 6 号,且每组
15、抽到的学生号构成等差数列an,公差 d10,所以 an1610n(nN),若 8610n,解得 n15,不合题意;若 200610n,解得 n19.4,不合题意;若 616610n,则 n61,符合题意;若815610n,则 n80.9,不合题意故选 C.(2)(2019 春通州区期末)某校为了解高二年级学生对教师教学的意见,打算从高二年级 500 名学生中用系统抽样的方法抽取 50 名进行调查,记 500 名学生的编号依次为 1,2,500,若抽取的第一个号码为 6,则抽取的最大号码为;从 217300 号这 84 人中抽取的样本数量为.解:从高二年级 500 名学生中用系统抽样的方法抽取
16、50 名进行调查,记 500 名学生的编号依次为 1,2,500,则抽样间隔 f50050 10,抽取的第一个号码为 6,则抽取的最大号码为 61049496.令 217610(n1)300,得 22.1n30.4,故抽取了 8人故填 496;8.类型三 分层抽样例 3 某企业共有 5 个分布在不同区域的工厂,职工 3万人,其中职工比例为 32523.现从 3 万人中抽取一个 300 人的样本,分析员工的生产效率.已知生产效率与不同的地理位置的生活习俗及文化传统有关,问应采取什么样的方法?并写出具体过程.解:应采取分层抽样的方法过程如下:将 3 万人分为五层,其中一个工厂为一层 按照样本容量的
17、比例随机抽取各工厂应抽取的样本:300 31560(人);300 21540(人);300 515100(人);300 21540(人);300 31560(人)因此各工厂应抽取的人数分别为 60 人,40 人,100 人,40 人,60 人 将 300 人组到一起即得到一个样本评析 分层抽样的实质为按比例抽取,当总体由差异明显的几部分组成时,多用分层抽样.应认识到,在各层抽取样本时,又可能会用到简单随机抽样,系统抽样,甚至分层抽样来抽取样本.解决分层抽样的关键:先确定抽样比,然后把各层个体数乘抽样比,即得各层要抽样的个体数,常用公式:抽样比样本容量总体容量各层样本容量各层总量;层 1 的容量
18、:层 2 的容量:层 3 的容量样本中层 1 的容量:样本中层 2 的容量:样本中层 3 的容量.变式 3(1)(2018南宁市第二中学高三 6 月考试)如图,某学校共有教师 120 人,现用分层抽样的方法从中选出一个 30 人的样本,则其中被选出的青年女教师的人数为()A.12B.6C.4D.3解:青年教师的人数为 12030%36 人,所以青年女教师为 12 人,故青年女教师被选出的人数为 12 301203.故选 D.(2)(四川 2018 届高三春季诊断)我国古代数学名著九章算术有一抽样问题:“今有北乡若干人,西乡七千四百八十八人,南乡六千九百一十二人,凡三乡,发役三百人,而北乡需遣一
19、百零八人,问北乡人数几何?”依分层抽样的方法,则北乡共有_人.解:设北乡有 x 人,则108x 3001087 4886 912,解得x8 100.故填 8 100.1.简单随机抽样是系统抽样和分层抽样的基础,是一种等概率的抽样,它的特点是:它要求总体个数较少;它是从总体中逐个抽取的;它是一种不放回抽样.2.系统抽样又称等距抽样,号码序列一旦确定,样本即确定好了.但要注意,如果编号的个体特征随编号的变化呈现一定的周期性,那么样本的代表性是不可靠的,甚至会导致明显的偏向.3.分层抽样一般在总体是由差异明显的几个部分组成时使用.4.抽样方法经常交叉使用,比如系统抽样中均匀分段后的第一段,可采用简单随机抽样;分层抽样中,若每层中个体数量仍很大时,则可辅之以系统抽样等.类别共同点各自特点相互联系适用范围简单随机抽样抽样过程中每个个体被抽取的概率相等从 总 体 中逐个抽样总 体 中的 个 体数较少系统抽样将 总 体 均分 成 几 部分,按事先确 定 的 规则 在 各 部分抽取在 起 始部 分 抽样 时 采用 简 单随 机 抽样总 体 中的 个 体数较多分层抽样将 总 体 分成几层,分层 进 行 抽取分 层 抽样 时 采用 简 单随 机 抽样 或 系统抽样总 体 由差 异 明显 的 几部 分 组成5.三种抽样方法的比较