1、高考资源网() 您身边的高考专家2016艺体生文化课-百日突围系列抽样方法【背一背基础知识】1. 简单随机抽样:一般地,从元素个数为N的总体中逐个不放回地抽取容量为n的样本,如果每一次抽取时总体中的各个个体有相同的可能性被抽到,这种抽样方法叫做简单随机抽样最常用的简单随机抽样的方法:抽签法和随机数法简单随机抽样适用范围是:总体中的个体性质相似,无明显层次;总体容量较小,尤其是样本容量较小。2.系统抽样:假设要从容量为N的总体中抽取容量为n的样本,第一步,先将总体的N个个体编号;第二步,确定分隔间距,对编号进行分段,当(n是样本容量)是整数时,取k;当(n是样本容量)不是整数时,先用简单随机抽样
2、剔除-个个体,取k;第三步,在第1段用简单随机抽样确定第一个个体编号l (lk);第四步,按照一定的规则抽取样本,通常是将l加上间隔k得到第2个个体编号,再加k得到第3个个体编号,依次进行下去,直到获取整个样本系统抽样的适用范围是:元素个数很多且均衡的总体;各个个体被抽到的机会均等。3.分层抽样:当总体由有明显差别的几部分组成时,为了使抽取的样本更好地反映总体的情况,常采用分层抽样,将总体中各个个体按某种特征分成若干个互不交叉的几部分,每一部分叫做层,在各层中按层在总体中所占比例进行简单随机抽样或系统抽样,这种抽样方法叫做分层抽样分层抽样的应用范围是:总体由差异明显的几部分组成的情况;分层后,
3、在每一层抽样时可采用简单随机抽样或系统抽样【讲一讲提高技能】1必备技能:在系统抽样的过程中,要注意分段间隔,需要抽取几个个体,样本就需要分成几个组,则分段间隔即为 (为样本容量),首先确定在第一组中抽取的个体的号码数,再从后面的每组中按规则抽取每个个体解决此类题目的关键是深刻理解各种抽样方法的特点和适用范围但无论哪种抽样方法,每一个个体被抽到的概率都是相等的,都等于样本容量和总体容量的比值2典型例题:例1. 某校高一年级有900名学生,其中女生400名,按男女比例用分层抽样的方法,从该年级学生中抽取一个容量为45的样本,则应抽取的男生人数为_【答案】【解析】由题意得抽样比例为,故应抽取的男生人
4、数为【考点】分层抽样【名师点睛】本题考查抽样方法,要搞清楚三种抽样方法的区别和联系,其中分层抽样是按比例抽样;系统抽样是等距离抽样,属于基础题例2. 某校老年、中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有人,则该样本的老年教师人数为( )A B C D类别人数老年教师中年教师青年教师合计【答案】C【考点定位】分层抽样.【名师点晴】本题主要考查的是分层抽样,属于容易题解题时一定要清楚“”是指抽取前的人数还是指抽取后的人数,否则容易出现错误解本题需要掌握的知识点是分层抽样,即抽取比例【练一练提升能力】1为了了解名学生的学习情况,采用系统抽样的方法,从
5、中抽取容量为的样本,则分段的间隔为( ) A B C D【答案】C【解析】由题意知,分段间隔为,故选C2.从3001名学生中选取50名组成参观团,现采用下面的方法选取:先用简单随机抽样从3001人中剔除1人,剩下的3000人再按系统抽样的方法进行,则每个人被选到的机会()A不全相等 B。均不相等 C。无法确定 D。都相等3. 甲、乙两套设备生产的同类产品共4800件,采用分层抽样的方法从中抽取一个容量为80 的样本进行检测若样本中有50件产品由甲设备生产,则乙设备生产的产品总数为_件【答案】1800【解析】依题意,设在甲生产的设备中抽件,则在乙生产的设备中抽件,所以,解得,故乙设备生产的产品总
6、数为1800件频率分布直方图与茎叶图【背一背基础知识】1. 频率分布直方图:在频率分布直方图中,纵轴表示,数据落在各小组内的频率用各长长方形的面积表示,各小长方形的面积总和等于1连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率分布折线图就会越来越接近于一条光滑的曲线,统计中称之为总体密度曲线,它能够更加精细的反映出总体的分布规律2频率分布直方图的步骤如下:()求极差;()确定组距和组数;()将数据分组;()列频率分布表;()画频率分布直方图频率分布直方图能很容易地表示大量数据,非常直观地表明分布的形状3茎叶图:茎是指中
7、间的一列数,叶是从茎的旁边生长出来的数茎叶图表示数据有两个突出的优点:其一是统计图上没有原始数据的损失,所有信息都可以从这个茎叶图中得到,其二是在比赛时随时记录,方便记录与表示4当样本数据较少时,用茎叶图表示数据的效果较好,它不但可以保留原始信息,而且可以随时记录,给记录和表示都带来方便【讲一讲提高技能】1必备技能:(1)在频率分布直方图中估计中位数和平均数的方法中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等平均数:在频率分布直方图中,平均数等于图中每个小矩形面积乘以小矩形底边中点的横坐标之和(2)平均数反映了数据取值的平均水平,标准差、方差描述了一组数据波动的大小标准差、
8、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定2典型例题:例1在一次马拉松比赛中,35名运动员的成绩(单位:分钟)如图I所示;若将运动员按成绩由好到差编为135号,再用系统抽样方法从中抽取7人,则其中成绩在区间139,151上的运动员人数为( )A、3 B、4 C、5 D、6【答案】B【考点定位】茎叶图【名师点睛】系统抽样是指当总体中个数较多时,将总体分成均衡的几部分,然后按照预先定出的规则,从每一部分抽取1个个体,得到所需要的样本的抽样方法,其实质为等距抽样. 茎叶图的优点是保留了原始数据,便于记录及表示,能反映数据在各段上的分布情况缺点为不能直接反映总
9、体的分布情况. 由数据集中情况可以估计平均数大小,再根据其分散程度可以估测方差大小例2某学校组织学生参加英语测试,成绩的频率分布直方图如图,数据的分组一次为若低于60分的人数是15人,则该班的学生人数是(A) (B) (C) (D)【分析】首先根据频率分布直方图计算出从20到60的频率,即能计算出总从数【解析】从20到60 的频率为: ,故总人数为人,选B.【练一练提升能力】1.为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为12,13),13,14),14,15),15,16),16,17,将其按从左到右的顺序分别编号为理一组,理二组,理
10、五组,右图是根据试验数据制成的频率分布直方图,已知理一组与理二组共有20人,理三组中没有疗效的有6人,则理三组中有疗效的人数为( )A.6 B.8 C.12 D.18【答案】2.某学校随机抽取个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示.以组距为将数据分组成,时,所作的频率分布直方图是( )【答案】A3. 为比较甲、乙两地某月14时的气温状况,随机选取该月中的5天,将这5天中14时的气温数据(单位:)制成如图所示的茎叶图.考虑以下结论:甲地该月14时的平均气温低于乙地该月14时的平均气温;甲地该月14时的平均气温高于乙地该月14时的平均气温;甲地该月14时的平均气温的标准差小
11、于乙地该月14时的气温的标准差;甲地该月14时的平均气温的标准差大于乙地该月14时的气温的标准差.其中根据茎叶图能得到的统计结论的标号为( )(A) (B) (C) (D) 【答案】【解析】甲地数据为:;乙地数据为:;所以,即正确的有,故选.【考点定位】1.茎叶图;2.平均数、方差、标准差.【名师点睛】本题考查茎叶图的概念以及平均数、方差、标准差的概念及其计算,解答本题的关键,是记清公式,细心计算.本题属于基础题,较全面地考查了统计的基础知识.变量间的相关关系与独立性检验【背一背基础知识】1两个变量间的相关关系:有关概念:相关关系与函数关系不同函数关系中的两个变量间是一种确定性关系相关关系是一
12、种非确定性关系,即相关关系是非随机变量与随机变量之间的关系如果一个变量的值由小变大时另一个变量的值由小变大,这种相关称为正相关;如果一个变量的值由小变大时另一个变量的值由大变小,这种相关称为负相关;如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系回归方程: 是两个具有线性相关关系的变量的一组数据的回归方程,其中是待定参数 的计算公式.2独立性检验:22列联表B合计An11n12n1n21n22n2总计n1n2n构造一个随机变量,利用随机变量2来判断“两个分类变量有关系”的方法称为独立性检验:若,则有95%把握认为A与B有关;若,则有99%把握认为A与B有关;
13、其中是判断是否有关系的临界值,应判断为没有充分证据显示A与B有关,而不能作为小于95%的量化值来判断【讲一讲基本技能】1.必备技能:求回归直线,使“离差平方和为最小”的方法叫做最小二乘法,用最小二乘法求得回归方程是两个具有线性相关关系的变量的一组数据的回归方程,其中是待定参数从与的计算公式与 可以看出:()回归直线必过点;()与符号相同。回归【分析】是对具有相关关系的两个变量进行统计分析的一种常用方法,主要判断特定量之间是否有相关关系,如果有就找出它们之间贴近的数学表达式。比如线性回归分析就是分析求出的回归直线是否有意义,而判断的依据就是|r|的大小:|r|1,并且|r|越接近1,线性相关程度
14、越强;|r|越接近0,线性相关程度越弱。从散点图来看,只有在散点图大致呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义。线性相关检验的步骤如下: ()作统计假设:x与Y不具有线性相关关系;()根据小概率0.05与n2在附表中查出r的一个临界值;()根据样本相关系数计算公式求出r的值;()作统计推断,如果|r|,表明有95%的把握认为x与Y之间具有线性相关关系; 如果|r|,我们没有理由拒绝原来的假设。这时寻找回归直线方程是毫无意义的。注意:线性回归分析以散点图为基础,具有很强的直观性,有散点图作比较时,拟合效果的好坏可由直观性直接判断,没有散点图时,只须套用公式求r,
15、再作判断即可独立性检验没有直观性,必须依靠作判断2.典型例题例1. 已知变量和满足关系,变量与正相关. 下列结论中正确的是( ) A与负相关,与负相关 B与正相关,与正相关 C与正相关,与负相关 D与负相关,与正相关【答案】.【考点定位】本题考查正相关、负相关,涉及线性回归方程的内容.【名师点睛】将正相关、负相关、线性回归方程等联系起来,充分体现了方程思想在线性回归方程中的应用,能较好的考查学生运用基础知识的能力.其易错点有二:其一,未能准确理解正相关与负相关的定义;其二,不能准确的将正相关与负相关问题进行转化为直线斜率大于和小于0的问题. 例2. 根据如下样本数据:345678402505得
16、到的回归方程为,则( )A , B , C , D ,分析:根据已知样本数判断线性回归方程中的与的符号【答案】A【解析】依题意,画散点图知,两个变量负相关,所以,选A例3.已知之间的几组数据如下表:123456021334假设根据上表数据所得线性回归直线方程为中的前两组数据和求得的直线方程为则以下结论正确的是( )A B C D【解析】散点图如右,显然后四个点都不在直线的左上方,所以回归直线斜率应该更小,纵截距更大,故选C.【练一练提升能力】1. 高三年级位学生参加期末考试,某班位学生的语文成绩,数学成绩与总成绩在全年级中的排名情况如下图所示,甲、乙、丙为该班三位学生从这次考试成绩看,在甲、乙
17、两人中,其语文成绩名次比其总成绩名次靠前的学生是 ;在语文和数学两个科目中,丙同学的成绩名次更靠前的科目是 【答案】乙;数学【解析】由图可知,甲的语文成绩排名比总成绩排名靠后;而乙的语文成绩排名比总成绩排名靠前,故填乙.由图可知,比丙的数学成绩排名还靠后的人比较多;而总成绩的排名中比丙排名靠后的人数比较少,所以丙的数学成绩的排名更靠前,故填数学.【考点定位】散点图.【名师点晴】本题主要考查的是散点图,属于容易题解题时一定要抓住重要字眼“语文”和“更”,否则很容易出现错误解此类图象题一定要观察仔细,分析透彻,提取必要的信息3. 已知变量与正相关,且由观测数据算得样本平均数,则由该观测的数据算得的
18、线性回归方程可能是( ) 【答案】A4.“十一”期间,邢台市通过随机询问100名性别不同的居民是否能做到光盘行动,得到如下的列联表,参照附表,得到的正确的结论是( )A在犯错误的概率不超过1%的前提下,认为“该市居民能否做到光盘与性别有关”B在犯错误的概率不超过1%的前提下,认为“该市居民能否做到光盘与性别无关” C有90%以上的把握认为“该市居民能否做到光盘与性别有关”D有90%以上的把握认为“该市居民能否做到光盘与性别无关” 0.100.050.025K2.7063.8415.024(一) 选择题(12*5=60分)1对一个容量为的总体抽取容量为的样本,当选取简单随机抽样、系统抽样和分层抽
19、样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为,则( ) 【答案】D2重庆市2013年各月的平均气温(C)数据的茎叶图如下0891258200338312则这组数据中的中位数是( )(A) 19 (B) 20 (C ) 21.5 (D )23【答案】B【解析】由茎叶图可知总共12个数据,处在正中间的两个数是第六和第七个数,它们都是20,由中位数的定义可知:其中位数就是20,故选B.【考点定位】茎叶图与中位数.【名师点睛】本题考查复数的概念和运算,采用分母实数化和利用共轭复数的概念进行化解求解.本题属于基础题,注意运算的准确性.3某中学有高中生3500人,初中生1500人,为了解学生
20、的学习情况,用分层抽样的方法从该校学生中抽取一个容量为的样本,已知从高中生中抽取70人,则为( ) 【答案】A【解析】故选A4.设样本数据的均值和方差分别为1和4,若(为非零常数, ),则的均值和方差分别为( )(A) (B) (C) (D)【答案】【解析】5.某学校有男、女学生各500名.为了解男女学生在学习兴趣与业余爱好方面是否存在显著差异,拟从全体学生中抽取100名学生进行调查,则宜采用的抽样方法是( )A抽签法 B随机数法 C系统抽样法 D分层抽样法 6某公司位员工的月工资(单位:元)为,其均值和方差分别为和,若从下月起每位员工的月工资增加元,则这位员工下月工资的均值和方差分别为(A)
21、 , (B), (C), (D),【答案】7.在一组样本数据(x1,y1),(x2,y2),(xn,yn)(n2,x1,x2,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,n)都在直线y=x+1上,则这组样本数据的样本相关系数为 (A)1 (B)0 (C) (D)1【答案】D【解析】根据样子相关系数的定义可知,当所有样本点都在直线上时,相关系数为1,选D.8.采用系统抽样方法从人中抽取人做问卷调查,为此将他们随机编号为,,分组后在第一组采用简单随机抽样的方法抽到的号码为.抽到的人中,编号落入区间的人做问卷,编号落入区间的人做问卷,其余的人做问卷.则抽到的人中,做问卷的人数为
22、 ( ) A. B. C. D.9.下图是两组各名同学体重(单位:)数据的茎叶图设,两组数据的平均数依次为和,标准差依次为和,那么( )(注:标准差,其中为的平均数)A, B, C, D,10. 某学校为了了解三年级、六年级、九年级这三个年级之间的学生视力是否存在显著差异,拟从这三个年级中按人数比例抽取部分学生进行调查,则最合理的抽样方法是( )(A)抽签法 (B)系统抽样法 (C)分层抽样法 (D)随机数法【答案】C【解析】按照各种抽样方法的适用范围可知,应使用分层抽样.选C【考点定位】本题考查几种抽样方法的概念、适用范围的判断,考查应用数学方法解决实际问题的能力.【名师点睛】样本抽样是现实
23、生活中常见的事件,一般地,抽签法和随机数表法适用于样本总体较少的抽样,系统抽样法适用于要将样本总体均衡地分为n个部分,从每一部分中按规则抽取一个个体;分层抽样法则是当总体明显的分为几个层次时,在每一个层次中按照相同的比例抽取抽取样本.本题条件适合于分层抽样的条件,故应选用分层抽样法.属于简单题.11.学校为了解学生在课外读物方面的支出情况,抽取了个同学进行调查,结果显示这些同学的支出都在10,50)(单位:元),其中支出在(单位:元)的同学有67人,其频率分布直方图如右图所示,则的值为( )A100 B120 C130 D390【答案】A12.给出下列五个命题:某班级一共有52名学生,现将该班
24、学生随机编号,用系统抽样的方法抽取一个容易为4的样本,已知7号,33号,46号同学在样本中,那么样本另一位同学的编号为23;一组数据1、2、3、4、5的平均数、众数、中位数相同;一组数据a、0、1、2、3,若该组数据的平均值为1,则样本标准差为2;根据具有线性相关关系的两个变量 的统计数据所得的回归直线方程为y=ax+b中,b=2,则a=1;如图是根据抽样检测后得出的产品样本净重(单位:克)数据绘制的频率分布直方图,已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克,并且小于104克的产品的个数是90.【答案】B【解析】由系统抽样的原知抽样的间隔为524=13,故抽取的样
25、本的编号分别为7,7+13,7+132, 7+133,即7号、20号、33号、46号,是假命题; (二) 填空题(4*5=20分)13已知样本数据,的均值,则样本数据,的均值为 【答案】【考点定位】均值的性质【名师点晴】本题主要考查的是均值的性质,属于容易题解本题需要掌握的知识点是均值和方差的性质,即数据,的均值为,方差为,则(1)数据,的均值为,方差为;(2)数据,的均值为,方差为;(3)数据,的均值为,方差为14某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查已知该校一年级、二年级、三年级、四年级的本科生人
26、数之比为4:5:5:6,则应从一年级本科生中抽取_名学生【答案】60【解析】应从一年级抽取名15.某国际会议在北京召开,为了搞好对外宣传工作,会务组选聘了16名男记者和14名女记者担任对外翻译工作,调查发现,男、女记者中分别有10人和6人会俄语(1)根据以上数据完成以下22列联表:会俄语不会俄语总计男女总计30并回答能否在犯错的概率不超过0.10的前提下认为性别与会俄语有关? .参考公式:K2,其中nabcd参考数据:P(K2k0)0.400.250.100.010k00.7081.3232.7066.635(2)会俄语的6名女记者中有4人曾在俄罗斯工作过,若从会俄语的6名女记者中随机抽取2人
27、做同声翻译,则抽出的2人都在俄罗斯工作过的概率是16. 某电子商务公司对10000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间内,其频率分布直方图如图所示. ()直方图中的_; ()在这些购物者中,消费金额在区间内的购物者的人数为_. 【答案】()3;()6000.【考点定位】本题考查频率分布直方图,属基础题.【名师点睛】以实际问题为背景,重点考查频率分布直方图,灵活运用频率直方图的规律解决实际问题,能较好的考查学生基本知识的识记能力和灵活运用能力. 高考资源网版权所有,侵权必究!(上海,甘肃,内蒙,新疆,陕西,山东,湖北,河北)八地区试卷投稿QQ 2355394501