1、不能正确区分总体、样本、样本容量为了了解2019年参加市运动会的240名运动员的身高情况,从中抽取40名运动员进行测量下列说法正确的是A总体是240名运动员B个体是每一名运动员C40名运动员的身高是一个个体D样本容量是40【错解】选择A、B、C中的一个. 【错因分析】对于选项A、B,对总体、个体、样本的概念把握不准,误将考察的对象当作运动员;对于选项C,把个体和样本混淆致误【试题解析】选D根据统计的相关概念并结合题意可得,此题的总体、个体、样本这三个概念的考察对象都是运动员的身高,而不是运动员,并且一个个体是指一名运动员的身高,选项A,B表达的对象都是运动员,选项C未将个体和样本理解透彻在这个
2、问题中,总体是240名运动员的身高,个体是每名运动员的身高,样本是40名运动员的身高,样本容量是40.因此选D【参考答案】D1明确相关概念对总体、个体、样本、样本容量的概念要熟练把握,要明确总体与样本的包含关系及样本与样本容量的区别,如本例选项C,是对概念把握不准2注意考察对象解决考查总体、个体、样本、样本容量的概念问题时,关键是明确考察对象,根据相关的概念可知总体、个体与样本的考察对象是相同的,如本例中选项A,B表达的对象都是运动员的身高而不是运动员1某公司有350名员工参加了今年的年度考核.为了了解这350名员工的考核成绩,公司决定从中抽取50名员工的考核成绩进行统计分析.在这个问题中,5
3、0名员工的考核成绩是A总体 B样本容量 C个体 D样本【答案】D【解析】因为本题是从350名员工的考核成绩中抽取50名员工的考核成绩,所以50名员工的考核成绩是样本,故选D.对随机抽样的概念理解不透彻 对于下列抽样方法:运动员从8个跑道中随机抽取1个跑道;从20个零件中一次性拿出3个来检验质量;某班50名学生,指定其中成绩优异的2名学生参加一次学科竞赛;为了保证食品安全,从某厂提供的一批月饼中,拿出一个检查后放回,再拿一个检查,反复5次,拿了5个月饼进行检查.其中,属于简单随机抽样的是_.(把正确的序号都填上)【错解】【错因分析】对简单随机抽样的概念理解不透彻.【试题解析】对于,一次性拿出3个
4、来检验质量,违背简单随机抽样特征中的“逐个”抽取;对于,指定其中成绩优异的2名学生,不满足等可能抽样的要求;对于,不满足不放回抽样的要求.故填.【参考答案】1简单随机抽样是不放回抽样,抽样过程中,每个个体被抽到的机会(概率)相等.2应用简单随机抽样应注意的问题:(1)一个抽样试验能否用抽签法,关键看两点:一是抽签是否方便;二是号签是否易搅匀一般地,当总体容量和样本容量都较小时可用抽签法(2)在使用随机数表时,如遇到三位数或四位数时,可从选择的随机数表中的某行某列的数字计起,每三个或四个作为一个单位,自左向右选取,有超过总体号码或出现重复号码的数字舍去(3)简单随机抽样需满足:被抽取的样本总体的
5、个体数有限;逐个抽取;是不放回抽取;是等可能抽取2已知下列抽取样本的方式:从无限多个个体中抽取100个个体作为样本;盒子里共有80个零件,从中选出5个零件进行质量检验,在抽样操作时,从中任意拿出1个零件进行质量检验后再把它放回盒子里;从20件玩具中一次性抽取3件进行质量检验;某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛其中,不是简单随机抽样的个数是A1 B2 C3 D4【答案】D【解析】不是简单随机抽样,原因是简单随机抽样中总体的个数是有限的,而题中是无限的;不是简单随机抽样,原因是简单随机抽样是不放回地抽取,而题中是放回地;不是简单随机抽样,原因是简单随机抽样是逐个抽取,而题
6、中是一次性抽取;不是简单随机抽样,原因是个子最高的5名同学是56名同学中特定的,不存在随机性,不是等可能抽样故选择D【名师点睛】简单随机抽样的特征要判断所给的抽样方法是否是简单随机抽样,关键是看它们是否符合简单随机抽样的定义,即简单随机抽样的四个特点:有限性、逐一性、不放回性、等可能性有限性:简单随机抽样要求被抽取的样本的总体个数是有限的,便于通过样本对总体进行分析逐一性:简单随机抽样是从总体中逐个地进行抽取,便于实践中操作不放回性:简单随机抽样是一种不放回抽样,便于进行有关的分析和计算等可能性:简单随机抽样中各个个体被抽到的机会都相等,从而保证了抽样方法的公平性简单随机抽样在抽样过程中每一个
7、个体被抽取的机会都相等(随机抽样的等可能性).若样本容量为n,总体的个体数为N,则用简单随机抽样时,每一个个体被抽到的可能性都是,体现了这种抽样方法的客观性和公平性. 对系统抽样的特点理解不到位 从2003名学生中抽取一个容量为40的样本,应如何抽取?【错解】将2003名学生按0001到2003编上号;将号码随机分成40份,每一份再用抽签法随机抽取一名学生,即得到了一个容量为40的样本.【错因分析】由于2003不能被40整除,误以为只能用简单随机抽样进行抽取,对两种抽样方法的特点理解不到位.【试题解析】先将2003名学生按0001到2003编上号,利用随机数表法从中剔除3名学生,再对剩余的20
8、00名学生重新从0001到2000编号,按编号顺序分成40组,每组50人,先在第一组中用抽签法抽出某一号,如0006,依次在其他组抽取0056,0106,1956,这样就得到了一个容量为40的样本.【参考答案】见试题解析1当总体容量较大,总体可以分为均匀的几个部分时,用系统抽样较为合理,但当总体容量除以样本容量不是整数时,要先在总体中剔除部分个体.2系统抽样的操作步骤:第一步编号:先将总体的N个个体编号;第二步分段:确定分段间隔k,对编号进行分段,当(n是样本容量)是整数时,取k=;第三步确定首个个体:在第1段用简单随机抽样确定第一个个体编号l(lk);第四步获取样本:按照一定的规则抽取样本,
9、通常是将l加上间隔k得到第2个个体编号,再加k得到第3个个体编号,依次进行下去,直到获取整个样本系统抽样是等距抽样,用系统抽样法抽取样本,当不为整数时,取,即先从总体中用简单随机抽样的方法剔除(Nnk)个个体,且剔除多余的个体不影响抽样的公平性3某初级中学领导采用系统抽样方法,从该校初一年级全体800名学生中抽50名学生做牙齿健康检查,现将800名学生从1到800进行编号,求得间隔数,即每16人抽取一个人在116中随机抽取一个数,如果抽到的是7,则从3348这16个数中应取的数是A40B39C38D37【答案】B【解析】由题意,用系统抽样的方法,在116中随机抽取一个数,抽到的是7,分组间隔为
10、,所以从3348中抽取的数字为.故选B.对个体的入样可能性与抽样间隔理解不透中央电视台动画城节目为了对本周的热心观众给予奖励,要从2014名小观众中抽取50名幸运小观众先用简单随机抽样从2014人中剔除14人,剩下的2000人再按系统抽样方法抽取50人,则在2014人中,每个人被抽取的可能性A均不相等B不全相等C都相等,且为D都相等,且为【错解】选A或D.【错因分析】对于选项A,误认为剔除14人,被抽取到的机会就不相等了,错选A;对于选项D,认为被抽取的机会相等,但利用了剔除后的数据计算,错选D【试题解析】选C因为在系统抽样中,若所给的总体个数不能被样本容量整除,则应先剔除几个个体,本题先剔除
11、14人,然后再分组,在剔除过程中,每个个体被剔除的机会相等所以,每个个体被抽到的机会都相等,均为.【参考答案】C1明确系统抽样的操作要领系统抽样操作要领是先将个体数较多的总体分成均衡的若干部分,然后按照预先指定的规则,从每一部分中抽取一个个体,得到所需样本系统抽样是等距离抽样,每个个体被抽到的机会是相等的,如本题中2000人要分为50段2对系统抽样合理分段在系统抽样过程中,为将整个编号分段,要确定分段间隔,当在系统抽样过程中比值不是整数时,要从总体中剔除一些个体(用简单随机抽样),但每一个个体入样的机会仍然相等如本题中剔除14人后,每个人被抽取的可能性不变4采用系统抽样的方法,从个体数为1 0
12、03的总体中抽取一个容量为50的样本,则在抽样过程中,被剔除的个体数为_,抽样间隔为_.【答案】3,20 【解析】因为1 003除以50等于20,且余数为3,所以应剔除的个体数为3,抽样间隔为20.故填3,20.忽略分层抽样的特点某单位有老年人28人,中年人54人,青年人81人,为了调查他们的身体情况,需从中抽取一个容量为36的样本,则适合的抽样方法是A简单随机抽样B系统抽样 C直接运用分层抽样D先从老年人中剔除1人,再用分层抽样【错解】因为总体由差异明显的三部分组成,所以考虑用分层抽样.因为总人数为28+54+81=163,样本容量为36,由于按抽样,无法得到整数解,因此考虑先剔除1人,将抽
13、样比变为.若从老年人中随机地剔除1人,则老年人应抽取27=6(人),中年人应抽取54=12(人),青年人应抽取81=18(人),从而组成容量为36的样本.故选D【错因分析】如果用简单随机抽样先从老年人中剔除1人的话,老年人被抽到的概率显然比其他人群小了,这不符合随机抽样的特征每个个体入样的几率相等.注意题干明确地说“先从老年人中剔除1人”,这和以前做的从总体中随机剔除1人是不一样的.【试题解析】直接运用分层抽样,老年人、中年人和青年人中应抽取的人数分别为286,5412,8118,故选C【方法点睛】分层抽样的一个很重要的特点是每个个体被抽到的概率是一样的.当按照比例计算出的值不是整数时,一般是
14、采用四舍五入的方法取值,若四舍五入后得到的样本容量与要求的不尽相同,则可根据问题的实际意义适当处理,使之相同,这只是细节性问题,并未改变分层抽样的本质.【参考答案】C.1分层抽样的前提和遵循的两条原则(1)前提:分层抽样使用的前提是总体可以分层,层与层之间有明显区别,而层内个体间差异较小,每层中所抽取的个体数可按各层个体数在总体的个体数中所占比例抽取(2)遵循的两条原则:将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则;分层抽样为保证每个个体等可能入样,需遵循在各层中进行简单随机抽样,每层样本数量与每层个体数量的比等于抽样比2与分层抽样有关问题的常见类
15、型及解题策略:(1)求某一层的样本数或总体个数可依据题意求出抽样比,再由某层总体个数(或样本数)确定该层的样本(或总体)数(2)求各层的样本数可依据题意,求出各层的抽样比,再求出各层样本数进行分层抽样时应注意以下几点:(1)分层抽样中分多少层、如何分层要视具体情况而定,总的原则是层内样本的差异要小,两层之间的样本差异要大,且互不重叠(2)为了保证每个个体等可能入样,所有层中每个个体被抽到的可能性相同(3)在每层抽样时,应采用简单随机抽样或系统抽样的方法进行抽样5某校有高一学生n名,其中男生数与女生数之比为,为了解学生的视力情况,现要求按分层抽样的方法抽取一个样本容量为的样本,若样本中男生比女生
16、多12人,则A990B1320C1430D1560【答案】B【解析】依题意可得,解得,故选B.【名师点睛】本题考查分层抽样的相关计算,解题时要利用分层抽样的特点列式求解,考查计算能力,属于基础题. 在分层抽样中,确定抽样比k是抽样的关键.一般地,抽样比k=nN(N为总体容量,n为样本容量),再按抽样比k在各层中抽取个体,就能确保抽样的公平性.在每层抽样时,应采用简单随机抽样或系统抽样的方法进行.误将频率分布直方图的纵坐标当作频率中小学生的视力状况受到社会的关注.某市有关部门从全市6万名高一学生中随机抽取400名学生,对他们的视力状况进行一次调查统计,将所得到的有关数据绘制成频率分布直方图,如图
17、所示,从左至右五个小组的频率之比为5712106,则该市6万名高一学生中视力在3.95,4.25)范围内的学生约有多少人?【错解】由图可知,第五小组的频率为0.5,所以第一小组的频率为0.5.所以该市6万名高一学生中视力在3.95,4.25)范围内的学生约有60000=25000(人).【错因分析】表面上看本题的回答似乎正确无误,其实答案是错误的,其错因在于没有看懂所提供的频率分布直方图中的数据的含义,误将该频率分布直方图中的纵坐标(频率与组距的比)看成了频率,从而导致问题的解答出错.【试题解析】由图可知,第五小组的频率为0.50.3=0.15,所以第一小组的频率为0.15=0.125.所以该
18、市6万名高一学生中视力在3.95,4.25)范围内的学生约有600000.125=7500(人).【参考答案】7500.在数据的频率分布直方图中,纵坐标表示的是频率与组距的比, 每个小长方形的面积组距频率,将频率与组距的比错认成频率是初学者经常犯的错误之一,解题过程中要引起足够的重视.1画频率分布直方图的步骤(1)求极差(即一组数据中最大值与最小值的差);(2)决定组距与组数;(3)将数据分组;(4)列频率分布表;(5)画频率分布直方图(以横轴表示样本分组,纵轴表示频率与组距的比值).2频率分布直方图的性质(1)落在各小组内的频率用各小长方形的面积表示,且各小长方形的面积的和等于1.(2)频率
19、分布直方图与众数、中位数与平均数的关系最高的小长方形中的某个(些)点的横坐标即是众数;中位数左边和右边的小长方形的面积和是相等的;平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和绘制频率分布直方图的注意事项:(1)计算极差,需要找出这组数的最大值和最小值,当数据很多时,可选一个数当参照(2)将一批数据分组,目的是要描述数据分布规律,要根据数据多少来确定分组数目,一般来说,数据越多,分组越多(3)将数据分组,决定分点时,一般使分点比数据多一位小数,并且把第一组的起点稍微减小一点(4)列频率分布表时,可通过逐一判断各个数据落在哪个小组内,以“
20、正”字确定各个小组内数据的个数(5)画频率分布直方图时,纵坐标表示频率与组距的比值,一定不能标成频率6某校200名学生的数学期中考试成绩频率分布直方图如图所示,其中成绩分组区间是.(1)求图中m的值;(2)根据频率分布直方图,估计这200名学生的平均分(同一组中的数据用该组区间的中间值作代表)和中位数(四舍五入取整数);(3)若这200名学生的数学成绩中,某些分数段的人数x与英语成绩相应分数段的人数y之比如下表所示,求英语成绩在的人数.分数段70,80)80,90)90,100)100,110)110,120)x:y1:22:16:51:21:1【答案】(1);(2)平均分为,中位数为;(3)
21、140人.【解析】(1)由,解得. (2)频率分布直方图中每一个小矩形的面积乘以底边中点的横坐标之和即为平均数,即估计平均数为. 设中位数为,则,解得. (3)由频率分布直方图可求出这200名学生的数学成绩在,的分别有60人,40人,10人,按照表中给的比例,则英语成绩在,的分别有50人,80人,10人, 所以英语成绩在的有140人.【名师点睛】本题主要考查频率分布直方图的性质,考查频率分布直方图中平均数和中位数的计算,意在考查学生对这些知识的理解掌握水平,属于基础题.频率分布直方图是用样本估计总体的一种重要方法,是高考命题的一个热点,多以选择题或填空题的形式呈现,试题难度不大,多为容易题或中
22、档题,且主要有以下几个命题角度:(1)已知频率分布直方图中的部分数据,求其他数据可根据频率分布直方图中的数据求出样本与总体的关系,利用频率和等于1就可求出其他数据(2)已知频率分布直方图,求某种范围内的数据可利用图形及某范围结合求解(3)与概率有关的综合问题,可先求出频率,再利用古典概型等知识求解.对茎叶图的画法规则认识不够 某市对上下班情况作了抽样调查,上下班时间各抽测了12辆机动车的车速如下(单位:km/h):上班时间:30,33,18,27,32,40,26,28,21,28,35,20;下班时间:27,19,32,29,36,29,30,22,25,16,17,30.用茎叶图表示以上数
23、据.【错解】机动车行驶速度的茎叶图如图所示.【错因分析】茎叶图对于重复出现的数据要重复记录.【试题解析】机动车行驶速度的茎叶图如图.【方法点睛】画茎叶图需要注意,将每个数据分为茎和叶两部分,将表示茎的数字按照大小顺序由上到下排列,在写每行叶子的时候,重复出现的数字应该按原次数写入叶子部位,不能只按一次写入.【参考答案】见试题解析.1茎叶图将所有两位数的十位数字作为茎,个位数字作为叶,茎相同者共用一个茎,茎按从小到大的顺序从上向下列出,共茎的叶可以按从大到小(或从小到大)的顺序同行列出(也可以没有大小顺序)2绘制茎叶图的关键是分清茎和叶一般地说,当数据是两位数时,十位上的数字为“茎”,个位上的数
24、字为“叶”;如果是小数,通常把整数部分作为“茎”,小数部分作为“叶”解题时要根据数据的特点合理地选择茎和叶3应用茎叶图对两组数据进行比较时,要从数据分布的对称性、中位数、稳定性等几方面来比较4茎叶图只适用于样本数据较少的情况在样本数据较少时,用茎叶图表示数据的效果较好它不但可以保留所有信息,而且可以随时记录,这对数据的记录和表示都能带来方便但是当样本数据较多时,茎叶图就显得不太方便,因为每一个数据都要在图中占据一个空间,如果数据很多,枝叶就会很长7某中学要从高一年级甲、乙两个班级中选择一个班参加市电视台组织的“环保知识竞赛”.该校对甲、乙两班的参赛选手(每班7人)进行了一次环境知识测试,他们取
25、得的成绩(满分100分)的茎叶图如图所示,其中甲班学生的平均分是85分,乙班学生成绩的中位数是85.(1)求的值;(2)根据茎叶图,求甲、乙两班同学成绩的方差的大小,并从统计学角度分析,该校应选择甲班还是乙班参赛.【答案】(1);(2)应该选择乙班参赛.【解析】(1)因为甲班学生的平均分是85,所以,解得.因为乙班学生成绩的中位数是85,所以.(2)由(1)可知,所以.由茎叶图可得,所以,所以.故该校应该选择乙班参赛.【名师点睛】本题考查了根据茎叶图求平均数,根据平均数、中位数求原始数据,考查了计算方差,并利用方差做出统计判断的问题.忽略方差的统计意义 甲、乙两种冬小麦实验品种连续5年的平均单
26、位面积产量如下(单位:t /km2):品种第1年第2年第3年第4年第5年甲9.89.910.11010.2乙9.410.310.89.79.8若某村要从中引进一种冬小麦大量种植,给出你的建议.【错解】由题意得x-甲=15(9.8+9.9+10.1+10+10.2)=10,x-乙=15(9.4+10.3+10.8+9.7+9.8)=10,甲、乙两种冬小麦的平均产量都等于10,所以引进两种冬小麦的任意一种都可以.【错因分析】上述错误在于只对两种冬小麦的平均产量做了比较,而忽略了对冬小麦产量稳定性的讨论.【试题解析】由题意得x-甲=15(9.8+9.9+10.1+10+10.2)=10,x-乙=15
27、(9.4+10.3+10.8+9.7+9.8)=10,s甲2=15(9.8-10)2+(9.9-10)2+(10.1-10)2+(10-10)2+(10.2-10)2=0.02,s乙2=15(9.4-10)2+(10.3-10)2+(10.8-10)2+(9.7-10)2+(9.8-10)2=0.244,甲、乙两种冬小麦的平均产量都等于10,且s甲2s乙2,所以产量比较稳定的为甲种冬小麦,推荐引进甲种冬小麦大量种植.【方法点睛】平均数反映的是样本个体的平均水平,方差和标准差则反映了样本的波动、离散程度.对于形如“谁发挥更好、谁更稳定、谁更优秀”之类的题目,除比较数据的平均值外,还应该比较方差或
28、标准差的大小,以作出更为公正、合理的判断.【参考答案】推荐引进甲种冬小麦大量种植.用样本估计总体时,样本的平均数、标准差只是总体的平均数、标准差的近似.实际应用中,当所得数据的平均数不相等时,需先分析平均水平,再计算标准差(方差)分析稳定情况.1平均数与方差都是重要的数字特征,是对总体的一种简明的描述.2众数、中位数与平均数都是描述一组数据集中趋势的量,平均数是最重要的量.平均数反映的是样本个体的平均水平,众数和中位数则反映样本中个体的“重心”.3数据的离散程度可以通过极差、方差或标准差来描述,极差反映了一组数据变化的最大幅度,它对一组数据中的极端值极为敏感.一般情况下,极差大,则数据波动性大
29、;极差小,则数据波动性小.极差只需考虑两个极端值,便于计算,但没有考虑中间的数据,可靠性较差.方差和标准差反映了数据波动程度的大小标准差、方差越大,数据的离散程度越大,越波动;标准差、方差越小,数据的离散程度越小,越稳定8甲、乙两种水稻试验品种连续5年的平均单位面积产量如下(单位:t/hm2),试根据这组数据估计哪一种水稻品种的产量比较稳定.品种第1年第2年第3年第4年第5年甲9.89.910.11010.2乙9.410.310.89.79.8【答案】甲种水稻的产量比较稳定【解析】甲品种的样本平均数为10,样本方差为(9.810)2(9.910)2(10.110)2(1010)2(10.210
30、)250.02.乙品种的样本平均数也为10,样本方差为(9.410)2(10.310)2(10.810)2(9.710)2)(9.810)250.244.因为0.2440.02,所以,由这组数据可以认为甲种水稻的产量比较稳定运用数字特征作评价时考虑不周一次数学知识竞赛中,两组学生成绩如下:分数5060708090100人数甲组251013146乙组441621212经计算,已知两个组的平均分都是80分,请根据所学过的统计知识,进一步判断这次竞赛中哪个组更优秀,并说明理由.【错解】由于乙组90分以上的人数比甲组90分以上的人数多,所以乙组更优秀.【错因分析】对一组数据进行分析的时候,应从平均数、
31、众数、中位数、方差、极差等多个角度进行判断.【试题解析】(1)甲组成绩的众数为90分,乙组成绩的众数为70分,从成绩的众数这一角度看,甲组成绩好些.(2)s甲2=12+5+10+13+14+62(50-80)2+5(60-80)2+10(70-80)2+13(80-80)2+14(90-80)2+6(100-80)2=172.同理s乙2=256.因为s甲2s乙2,所以甲组的成绩比乙组的成绩稳定.(3)甲、乙两组成绩的中位数、平均数都是80分,其中甲组成绩在80分以上(含80分)的有33人,乙组成绩在80分以上(含80分)的有26人,从这一角度看,甲组成绩总体较好.(4)从成绩统计表看,甲组成绩
32、大于或等于90分的有20人,乙组成绩大于或等于90分的有24人,所以乙组成绩在高分段的人数多.同时,乙组满分比甲组多6人,从这一角度看,乙组成绩较好.【参考答案】见解析.1平均数受个别极端数据(比其他数据大很多或小很多的数据)的影响较大,因此若在数据中存在少量极端数据时,平均数对总体估计的可靠性较差,往往用众数或中位数去估计总体.有时也采用剔除最大值与最小值后所得的平均数去估计总体.2运用数字特征进行评价时,要全面考虑各数字特征的优缺点,从不同层面或两两综合进行评价,才能得到较为可靠的估计.9全国大学生机器人大赛是由共青团中央,全国学联,深圳市人民政府联合主办的赛事,是中国最具影响力的机器人项
33、目,是全球独创的机器人竞技平台.全国大学生机器人大赛比拼的是参赛选手们的能力,坚持和态度,展现的是个人实力以及整个团队的力量.2015赛季共吸引全国240余支机器人战队踊跃报名,这些参赛战队来自全国六大赛区,150余所高等院校,其中不乏北京大学,清华大学,上海交大,中国科大,西安交大等众多国内顶尖高校,经过严格筛选,最终由111支机器人战队参与到2015年全国大学生机器人大赛的激烈角逐之中,某大学共有“机器人”兴趣团队1000个,大一、大二、大三、大四分别有100,200,300,400个,为挑选优秀团队,现用分层抽样的方法,从以上团队中抽取20个团队.(1)应从大三抽取多少个团队?(2)将2
34、0个团队分为甲、乙两组,每组10个团队,进行理论和实践操作考试(共150分),甲、乙两组的分数如下:甲:125,141,140,137,122,114,119,139,121,142乙:127,116,144,127,144,116,140,140,116,140从甲、乙两组中选一组强化训练,备战机器人大赛.从统计学数据看,若选择甲组,理由是什么?若选择乙组,理由是什么?【答案】(1)6个团队;(2)见解析.【解析】(1)由题知,大三团队个数占总团队数的3001000=310, 则用分层抽样的方法,应从大三中抽取20310=6个团队. (2)甲组数据的平均数x甲=130,乙组数据的平均数x乙=
35、131, 甲组数据的方差s甲2=104.2,乙组数据的方差s乙2=128.8, 选甲队理由:甲、乙两队平均数相差不大,且s甲20时,两个变量呈正相关关系,含义为:x每增加一个单位,y平均增加个单位数;当0时,表明两个变量正相关;当r0时,表明两个变量负相关;|r|越接近于1,表明两个变量的线性相关性越强;|r|越接近于0,表明两个变量的线性相关性越弱.6非线性回归分析对某些特殊的非线性关系,可以通过变量转换,把非线性回归问题转化成线性回归问题,然后用线性回归的方法进行研究在大量的实际问题中,所研究的两个变量不一定都呈线性相关关系,当两变量y与x不具有线性相关关系时,要借助散点图,与已学过的函数
36、(如指数函数、对数函数、幂函数等)的图象相比较,找到合适的函数模型,利用变量代换转化为线性函数关系,从而使问题得以解决求非线性回归方程的步骤:确定变量,作出散点图根据散点图,选择恰当的拟合函数变量置换,通过变量置换把非线性回归问题转化为线性回归问题,并求出线性回归方程分析拟合效果:通过计算相关指数或画残差图来判断拟合效果根据相应的变换,写出非线性回归方程7刻画回归效果的方式方式方法计算公式刻画效果越接近于1,表示回归的效果越好残差图称为相应于点的残差,残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,其中这样的带状区域的宽度越窄,说明模型拟合精确度越高.残差平方和残差平方和越小,模
37、型的拟合效果越好四、独立性检验1独立性检验利用随机变量(也可表示为)(其中为样本容量)来判断“两个变量有关系”的方法称为独立性检验2独立性检验的一般步骤(1)根据样本数据列出列联表;(2)计算随机变量的观测值k,查下表确定临界值k0:(3)如果,就推断“X与Y有关系”,这种推断犯错误的概率不超过;否则,就认为在犯错误的概率不超过的前提下不能推断“X与Y有关系”(1)通常认为时,样本数据就没有充分的证据显示“X与Y有关系”(2)独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表,在分析问题时一定要注意这点,不可对某个问题下确定性结论,否
38、则就可能对统计计算的结果作出错误的解释(3)独立性检验是对两个变量有关系的可信程度的判断,而不是对其是否有关系的判断1【2019年高考全国卷文数】某学校为了解1 000名新生的身体素质,将这些学生编号为1,2,1 000,从这些新生中用系统抽样方法等距抽取100名学生进行体质测验若46号学生被抽到,则下面4名学生中被抽到的是A8号学生B200号学生C616号学生D815号学生【答案】C【解析】由已知将1000名学生分成100个组,每组10名学生,用系统抽样,46号学生被抽到,所以第一组抽到6号,且每组抽到的学生号构成等差数列,公差,所以,若,解得,不合题意;若,解得,不合题意;若,则,符合题意
39、;若,则,不合题意故选C2【2019年高考全国卷文数】西游记三国演义水浒传和红楼梦是中国古典文学瑰宝,并称为中国古典小说四大名著某中学为了解本校学生阅读四大名著的情况,随机调查了100位学生,其中阅读过西游记或红楼梦的学生共有90位,阅读过红楼梦的学生共有80位,阅读过西游记且阅读过红楼梦的学生共有60位,则该校阅读过西游记的学生人数与该校学生总数比值的估计值为A0.5B0.6C0.7 D0.8【答案】C【解析】由题意得,阅读过西游记的学生人数为90-80+60=70,则其与该校学生人数之比为70100=0.7故选C【名师点睛】本题考查抽样数据的统计,渗透了数据处理和数学运算素养采取去重法,利
40、用转化与化归思想解题3目前,国内很多评价机构经过反复调研论证,研制出“增值评价”方式.下面实例是某市对“增值评价”的简单应用,该市教育评价部门对本市所高中按照分层抽样的方式抽出所(其中,“重点高中”所分别记为,“普通高中”所分别记为),进行跟踪统计分析,将所高中新生进行了统一的入学测试.高考后,该市教育评价部门将入学测试成绩与高考成绩的各校平均总分绘制成了雷达图.点表示学校入学测试平均总分大约分,点表示学校高考平均总分大约分,则下列叙述不正确的是A各校入学统一测试的成绩都在分以上B高考平均总分超过分的学校有所C学校成绩出现负增幅现象D“普通高中”学生成绩上升比较明显【答案】B【解析】A. 各校
41、人学统一测试的成绩都在分以上,根据图象知,正确.B. 高考平均总分超过分的学校有所,根据图象知,只有ABC三所,错误.C. 学校成绩出现负增幅现象,根据图象,高考成绩低于入学测试,正确.D. “普通高中”学生成绩上升比较明显,根据图象,“普通高中”高考成绩都大于入学测试,正确.故选B.【名师点睛】本题考查了雷达图的知识,意在考查学生的应用能力和解决问题的能力.4某公司在甲、乙、丙、丁四个地区分别有150,120,180,150个销售点公司为了调查产品销售情况,需从这600个销售点中抽取一个容量为100的样本记这项调查为;在丙地区有20个大型销售点,要从中抽取7个调查其销售收入和售后服务等情况,
42、记这项调查为,则完成,这两项调查宜采用的抽样方法依次是A分层抽样法,系统抽样法B分层抽样法,简单随机抽样法C系统抽样法,分层抽样法D简单随机抽样法,分层抽样法【答案】B【解析】依据题意,第项调查中,总体中的个体差异较大,应采用分层抽样法;第项调查总体中个体较少,应采用简单随机抽样法故选:B5某单位为了落实“绿水青山就是金山银山”理念,制定节能减排的目标,先调查了用电量 (单位:千瓦时)与气温 (单位: )之间的关系,随机选取了4天的用电量与当天气温,并制作了以下对照表:(单位:)171410(单位:千瓦时)24343864由表中数据得线性回归方程: ,则由此估计:当某天气温为12时,当天用电量
43、约为A56千瓦时B36千瓦时C34千瓦时D38千瓦时【答案】B【解析】由题意可得,由于回归直线过样本的中心点,则,得,回归直线方程为,当时,(千瓦时),故选B.【名师点睛】本题考查回归直线方程的应用,解题的关键在于利用回归直线过样本中心点这一结论,考查计算能力,属于中等题.6总体由编号为00,01,02,48,49的50个个体组成,利用下面的随机数表选取6个个体,选取方法是从随机数表第6行的第9列和第10列数字开始从左到右依次选取两个数字,则选出的第3个个体的编号为附:第6行至第9行的随机数表263579003370916016203882775749503211491973064916767
44、78733997467322748619871644148708628888519162074770111163024042979799196835125A3B16C38D20【答案】D【解析】按随机数表法,从随机数表第6行的第9列和第10列数字开始从左到右依次选取两个数字,则编号依次为33,16,20,38,49,32,则选出的第3个个体的编号为20, 故选:D 7针对时下的“抖音热”,某校团委对“学生性别和喜欢抖音是否有关”作了一次调查,其中被调查的女生人数是男生人数的,男生喜欢抖音的人数占男生人数的,女生喜欢抖音的人数占女生人数,若有的把握认为是否喜欢抖音和性别有关,则男生至少有参考公式
45、:0.100.050.0250.0100.0050.0012.7063.8415.0246.6357.87910.828A12人B18人C24人D30人【答案】B【解析】设男生人数为,女生人数为,喜欢抖音不喜欢抖音总计男生女生总计男女人数为整数,故选B.8某市疾病控制中心对某校高二学生进行了某项健康调查,调查的方法是采取分层抽样的方法抽取样本.我校高二学生共有2000人,抽取了一个200人的样本,其中男生103人,请问该校共有女生A970人B1030人C997人D206人【答案】A【解析】因为样本容量为200,其中女生人数为200-103=97,且分层抽样的抽取比例为2002000=110,所
46、以该校的女生总人数为97110=970.故选A9如图是某赛季甲、乙两名篮球运动员每场比赛得分的茎叶图,则甲、乙两人这几场比赛得分的中位数之和是A51B58C61D62【答案】D【解析】由茎叶图可知,甲的这几场比赛得分的中位数为27,乙的这几场比赛得分的中位数为35,所以甲、乙两人这几场比赛得分的中位数之和是27+35=62.10已知某样本的容量为50,平均数为70,方差为75现发现在收集这些数据时,其中的两个数据记录有误,一个错将80记录为60,另一个错将70记录为90在对错误的数据进行更正后,重新求得样本的平均数为,方差为,则ABCD【答案】A【解析】由题意,可得,设收集的48个准确数据分别
47、记为,则,所以故选A【名师点睛】本题主要考查了数据的平均数和方差的计算公式的应用,其中解答中熟记数据的平均数和方差的公式,合理准确计算是解答的关键,着重考查了推理与运算能力,是基础题11采用系统抽样方法从1000人中抽取50人做问卷调查,为此将他们随机编号为1,2,1000,适当分组后在第一组采用简单随机抽样的方法抽到的号码为8.抽到的50人中,编号落入区间1,400的人做问卷A,编号落入区间401,750的人做问卷B,其余的人做问卷C,则抽到的人中,做问卷C的人数为A12B13C14D15【答案】A【解析】100050=20,故由题意可得抽到的号码构成以8为首项,20为公差的等差数列,且此等
48、差数列的通项公式为an=8+(n-1)20=20n-12.由75120n-121000,解得38.15n50.6.由n为正整数可得39n50,且nN*,故做问卷C的人数为12.12在某次高中学科竞赛中,4000名考生的参赛成绩统计如图所示,60分以下视为不及格,若同一组中数据用该组区间中点作代表,则下列说法中有误的是A成绩在分的考生人数最多B不及格的考生人数为1000人C考生竞赛成绩的平均分约70.5分D考生竞赛成绩的中位数为75分【答案】D【解析】由频率分布直方图可得,成绩在的频率最高,因此考生人数最多,故A正确;由频率分布直方图可得,成绩在的频率为,因此,不及格的人数为,故B正确;由频率分
49、布直方图可得:平均分等于,故C正确;因为成绩在的频率为,由的频率为,所以中位数为,故D错误故选D13某厂家为了解销售轿车台数与广告宣传费之间的关系,得到如表所示的统计数据表:根据数据表可得回归直线方程y=bx+a,其中b=2.4,a=y-bx,据此模型预测广告费用为9万元时,销售轿车台数为广告费用x(万元)23456销售轿车y(台数)3461012A17B18C19D20【答案】C【解析】x=2+3+4+5+65=4,y=3+4+6+10+125=7,由回归直线过样本的中心点4,7,可得a=7-2.44=-2.6,回归直线方程为y=2.4x-2.6,据此模型预测广告费用为9万元时,销售轿车台数
50、为y=2.49-2.6=19.故选C14【2019年高考江苏卷】已知一组数据6,7,8,8,9,10,则该组数据的方差是_【答案】【解析】由题意,该组数据的平均数为,所以该组数据的方差是15某公司有大量客户,且不同龄段客户对其服务的评价有较大差异为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合适的抽样方法是_【答案】分层抽样.【解析】由于从不同龄段客户中抽取,故采用分层抽样.故答案为:分层抽样.16采用系统抽样的方法从800名学生中抽取50名学生进行视力检査.为此,将他们随机编号为1,2,3,800,若在116号中随机抽到的号码数为7,则从
51、3348这16个号码数中应抽取的号码为_.【答案】39【解析】3348应在第3组中,故应抽取的号码为216+7=39.17已知x1,x2,x6的标准差为10,则10x1-1,10x2-1,10x6-1的标准差是_.【答案】100【解析】根据标准差的定义可得10x1-1,10x2-1,10x6-1的标准差是100.18九章算术第三章“衰分”中有如下问题:“今有甲持钱五百六十,乙持钱三百五十,丙持钱一百八十,凡三人俱出关,关税百钱,欲以钱数多少衰出之,问各几何?”其意为:“仅有甲带了560钱,乙带了350钱,丙带了180钱,三人一起出关,共需要交关税100钱,依照钱的多少按比例出钱”,则丙应出_钱
52、(所得结果四舍五入,保留整数).【答案】17【解析】设丙应出x钱,由题意可得100560+350+180=x180,求解可得x=100180109017钱.19心理学家分析发现视觉和空间想象能力与性别有关,某数学兴趣小组为了验证这个结论,从所在学校中按分层抽样的方法抽取50名同学(男30,女20),给所有同学几何题和代数题各一题,让各位同学自由选择一道题进行解答选题情况如下表:(单位:人)几何题代数题总计男同学22830女同学81220总计302050根据以上数据,推断视觉和空间想象能力与性别有关系,则这种推断犯错误的概率不超过_附表:【答案】【解析】由公式 ,在犯错的概率不超过0.025的前
53、提下认为视觉和空间想象能力与性别有关,故答案为:【名师点睛】本题考查独立性检验的应用,考查22列联表,考查学生处理数据和运算求解的能力,属于基础题20【2019年高考全国卷文数】某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:满意不满意男顾客4010女顾客3020(1)分别估计男、女顾客对该商场服务满意的概率;(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异?附:P(K2k)0.0500.0100.001k3.8416.63510.828【答案】(1)男、女顾客对该商场服务满意的概率的估计值分别为,;(2)
54、有95%的把握认为男、女顾客对该商场服务的评价有差异【解析】(1)由调查数据,男顾客中对该商场服务满意的比率为,因此男顾客对该商场服务满意的概率的估计值为女顾客中对该商场服务满意的比率为,因此女顾客对该商场服务满意的概率的估计值为(2)由题可得由于,故有95%的把握认为男、女顾客对该商场服务的评价有差异21某校从参加高二年级期末考试的学生中随机抽取了名学生,已知这名学生的物理成绩均不低于60分(满分为100分)现将这名学生的物理成绩分为四组:,得到的频率分布直方图如图所示,其中物理成绩在内的有28名学生,将物理成绩在内定义为“优秀”,在内定义为“良好”男生女生合计优秀良好20合计60(1)求实
55、数的值及样本容量;(2)根据物理成绩是否优秀,利用分层抽样的方法从这名学生中抽取10名,再从这10名学生中随机抽取3名,求这3名学生的物理成绩至少有2名是优秀的概率;(3)请将列联表补充完整,并判断是否有的把握认为物理成绩是否优秀与性别有关?参考公式及数据:(其中). 0.1500.1000.0500.0250.0100.0050.001 2.0722.7063.8415.0246.6357.87910.828【答案】(1)100;(2);(3)见解析【解析】(1)由题可得,解得,又物理成绩在内的有名学生,所以,解得 (2)由题可得,这名学生中物理成绩良好的有名,所以抽取的名学生中物理成绩良好
56、的有名,物理成绩优秀的有名,故从这10名学生中随机抽取3名,这3名学生的物理成绩至少有2名是优秀的概率为 (3)补充完整的列联表如下表所示:男生女生合计优秀204060良好202040合计4060100则的观测值, 所以没有的把握认为物理成绩是否优秀与性别有关.【名师点睛】本题考查了频率分布直方图、分层抽样及独立性检验的应用,考查了学生的计算能力,属于中档题.22 为了调查学生星期天晚上学习时间的利用问题,某校从高二年级1000名学生(其中走读生450名,住宿生550名)中,采用分层抽样的方法抽取n名学生进行问卷调查根据问卷取得了这n名同学星期天晚上学习时间(单位:分钟)的数据,按照以下区间分
57、为八组:0,30),30,60),60,90),90,120),120,150),150,180),180,210),210,240),得到频率分布直方图如图已知抽取的学生中星期天晚上学习时间少于60分钟的人数为5人(1)求n的值并补全频率分布直方图;(2)如果把“学生晚上学习时间达到两小时”作为是否充分利用时间的标准,对抽取的n名学生,完成下列22列联表:利用时间充分利用时间不充分总计走读生住宿生10总计据此资料,是否认为学生“利用时间是否充分”与走读、住宿有关?(3)若在第组、第组共抽出2人调查影响有效利用时间的原因,求抽出的2人中第组、第组各有1人的概率参考数据:P()0.150.100
58、.050.0250.0100.0050.0012.0722.7063.8415.0246.6357.87910.828(参考公式:)【答案】(1)n100,图略;(2)没有理由认为学生“利用时间是否充分”与走读、住宿有关;(3).【解析】(1)设第i组的频率为Pi(i1,2,8),由图可知,学习时间少于60分钟的频率为,由题意得,n100.又,第组的高度为,频率分布直方图如图(2)由频率分布直方图可知,在抽取的100人中,“住宿生”有55人,“走读生”有45人,利用时间不充分的有(人),从而22列联表如下:利用时间充分利用时间不充分总计走读生301545住宿生451055总计7525100将2
59、2列联表中的数据代入公式计算,得.3.0303.841,没有理由认为学生“利用时间是否充分”与走读、住宿有关;(3)由(1)得n100,即第组人数为2,第组人数为3,记第组的2人为A,B,记第组的3人为a,b,c.抽出2人有:(A,B),(A,a),(A,b),(A,c),(B,a),(B,b),(B,c),(a,b),(a,c),(b,c),共10种,其中第组、第组各有1人有:(A,a),(A,b),(A,c),(B,a),(B,b),(B,c),共6种,故抽出2人中第组、第组各有1人的概率为.23某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对
60、于前一年第一季度产值增长率y的频数分布表的分组企业数22453147(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表)(精确到0.01)附:【答案】(1)产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%;(2)这类企业产值增长率的平均数与标准差的估计值分别为30%,17%【解析】(1)根据产值增长率频数分布表得,所调查的100个企业中产值增长率不低于40%的企业频率为产值负增长的企业频率为用样本频率分布估计总体分布得这类企业中产值增长率不低于40%的企业
61、比例为21%,产值负增长的企业比例为2%(2),所以,这类企业产值增长率的平均数与标准差的估计值分别为30%,17%24为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液每只小鼠给服的溶液体积相同、摩尔浓度相同经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数
62、据用该组区间的中点值为代表)【答案】(1),;(2)甲、乙离子残留百分比的平均值的估计值分别为,【解析】(1)由已知得,故(2)甲离子残留百分比的平均值的估计值为乙离子残留百分比的平均值的估计值为25某学校为担任班主任的教师办理手机语音月卡套餐,为了解通话时长,采用随机抽样的方法,得到该校100位班主任每人的月平均通话时长(单位:分钟)的数据,其频率分布直方图如图所示,将频率视为概率(1)求图中的值;(2)估计该校担任班主任的教师月平均通话时长的中位数;(3)在,这两组中采用分层抽样的方法抽取6人,再从这6人中随机抽取2人,求抽取的2人恰在同一组的概率【答案】(1);(2)390分钟;(3)【
63、分析】(1)根据频率分布直方图中所有矩形的面积和为1,列出方程,即可求解;(2)设该校担任班主任的教师月平均通话时长的中位数为,根据频率分布直方图的中位数的计算方法,即可求解(3)根据分层抽样,可得在内抽取人,分别记为,在内抽取2人,记为,利用古典概型及其概率的计算公式,即可求解【解析】(1)依题意,根据频率分布直方图的性质,可得:,解得(2)设该校担任班主任的教师月平均通话时长的中位数为因为前2组的频率之和为,前3组的频率之和为,所以,由,得所以该校担任班主任的教师月平均通话时长的中位数为390分钟(3)由题意,可得在内抽取人,分别记为,在内抽取2人,记为,则6人中抽取2人的取法有:,共15
64、种等可能的取法其中抽取的2人恰在同一组的有,共7种取法,所以从这6人中随机抽取的2人恰在同一组的概率【名师点睛】本题主要考查了频率分布直方图的应用以及古典概型及其概率的计算,其中解答中熟记频率分布直方图的相关性质,合理利用古典概型及其概率的计算公式,准确计算是解答的关键,着重考查了分析问题和解答问题的能力,属于基础题26“阿曼德比萨”是一个制作和外卖意大利比萨的餐饮连锁店,其主要客户群是在校大学生,为研究各店铺的销售额与店铺附近大学生人数的关系,随机抽取10个分店作为样本,得到数据如下:店铺编号附近大学生人数x/万人季度销售额y/万元10.25.820.610.530.88.840.811.8
65、51.211.761.613.77215.78216.992.214.9102.620.2(1)画出散点图,并判断x与y是否具有相关关系?(2)求回归直线方程,根据回归方程预测一个附近大学生人数为1万人的店铺的季度销售额;(3)若店铺的季度销售额低于10万元则亏损,试求附近大学生人数至少约多少人时才适合建店.【解析】(1)散点图如图所示:由散点图可以看出:这些点分布在一条直线的附近,因此这两个变量具有相关关系.(2)根据数据可知:x=110(0.2+0.6+2.6)=1.4,y=110(5.8+10.5+20.2)=13,i=110xi2-10x2=5.68,i=110xiyi-10xy=28.4,故b=28.45.68=5,=13-51.4=6.因此回归直线方程是y=5x+6.当x=1时,y=51+6=11,即附近大学生人数为1万人的店铺的季度销售额约为11万元.(3)回归直线方程是y=5x+6.令y10,解得x0.8.故当附近大学生人数至少约8000人时才适合建店.