ImageVerifierCode 换一换
格式:DOC , 页数:33 ,大小:929.50KB ,
资源ID:178112      下载积分:8 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝扫码支付
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.ketangku.com/wenku/file-178112-down.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(2018年高考新课标数学(理)一轮考点突破练习:第十一章 统计 WORD版含答案.doc)为本站会员(高****)主动上传,免费在线备课命题出卷组卷网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知免费在线备课命题出卷组卷网(发送邮件至service@ketangku.com或直接QQ联系客服),我们立即给予删除!

2018年高考新课标数学(理)一轮考点突破练习:第十一章 统计 WORD版含答案.doc

1、第十一章 统 计 1.随机抽样(1)理解随机抽样的必要性和重要性(2)会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法 2用样本估计总体(1)了解分布的意义和作用,能根据频率分布表画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点(2)理解样本数据标准差的意义和作用,会计算数据标准差(3)能从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释(4)会用样本的频率分布估计总体分布,会用样本的基 本数字特征估计总体的基本数字特征,理解用样本估计总体的思想(5)会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题 3变量的相关性(1)会作两个有关联变

2、量的数据的散点图,并利用散点图认识变量间的相关关系(2)了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程(线性回归方程系数公式不要求记忆)4了解回归分析的思想、方法及其简单应用 5了解独立性检验的思想、方法及其初步应用 111 随机抽样 1简单随机抽样(1)简单随机抽样:一般地,设一个总体含有 N个个体,从中逐个_地抽取 n 个个体作为样本(nN),如果每次抽取时总体内的各个个体被抽到的机会_,就把这种抽样方法叫做简单随机抽样(2)最常 用的简单随 机抽样 方法有两种:_法和_法 抽签法(抓阄法):一般地,抽签法就是把总体中的 N 个个体_,把号码写在号签上,将号签放在一

3、个容器中,搅拌均匀后,每次从中抽取_个号签,连续抽取_次,就得到一个容量为 n 的样本 随机数法:随机数法就是利用_、随机数骰子或计算机产生的随机数进行抽样 简单随机抽样有操作简便易行的优点,在总体个数不多的情况下是行之有效的 2系统抽样(1)一般地,假设要从容量为 N 的总体中抽取容量为 n 的样本,我们可以按下列步骤进行系统抽样:先将总体的 N 个个体_有时可直接利用个体自身所带的号码,如学号、准考证号、门牌号等;确定分段间隔 k,对编号进行分段当Nn(n是样本容量)是整数时,取 kNn,如果遇到Nn不是整数的情况,可以先从总体中随机地剔除几个个体,使得总体中剩余的个体数能被样本容量整除;

4、在第 1 段用_抽样方法确定第一个个体编号 l(lk);按照一定的规则抽取样本通常是将 l 加上_ 得 到 第 2 个 个 体 编 号 _,再_得到第 3 个个体编号_,依次进行下去,直到获取整个样本(2)当 总 体 中 元 素 个 数 较 少 时,常 采 用_,当总体中元素个数较多时,常采用_ 3分层抽样(1)分层抽样的概念:一般地,在抽样时,将总体分成_的层,然后按照一定的_,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样(2)当总体是由_的几个部分组成时,往往选用分层抽样的方法(3)分层抽样时,每个个体被抽到的机会是_的 自查自纠:1(1)不

5、放回 都相等(2)抽签 随机数 编号 1 n 随机数表 2(1)编号 简单随机 间隔 k(lk)加 k(l2k)(2)简单随机抽样 系统抽样 3(1)互不交叉 比例(2)差异明显(3)均等 (2015四川)某学校为了解三年级、六年级、九年级这三个年级之间的学生视力是否存在显著差异,拟从这三个年级中按人数比例抽取部分学生进行调查,则最合理的抽样方法是()A抽签法 B系统抽样法 C分层抽样法 D随机数法 解:按人数比例抽取,则用分层抽样最合理故选 C.从匀速传递的新产品生产流水线上,质检员每 10 分钟从中抽取一件新产品进行某项指标检测,这样的抽样是()A系统抽样 B分层抽样 C简单随机抽样 D随

6、机数法 解:根据定义易判断这样的抽样为系统抽样故选 A.(2015泉州校级期末)采用系统抽样的方法从 2 005 个个体中抽取一个容量为 50 的样本,则抽样间隔和随机剔除的个体数分别为()A40,5 B50,5 C5,40 D5,50 解:因为 2 0055040 余 5,所以用系统抽样法从 2 005 个个体中抽取一个容量为 50 的样本,抽样间隔是 40,且应随机剔除的个体数为 5.故选A.(2014天津)某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300 的样本进行调查已知该校一年级、二年级、三年级、四年级的本科生人数

7、之比为 4556,则应从一年级本科生中抽取_名学生 解:应 从 一 年 级 本 科 生 中 抽 取3004455660 名学生故填 60.某单位 200 名职工的年龄分布情况如图所示,现要从中抽取 40 名职工作样本,用系统抽样法,将全体职工随机按 1200 编号,并按编号顺序平均分为 40 组(15 号为第 1 组,610 号为第 2 组,196200 号为第 40 组)若第 5 组抽出的号码为 22,则第 8 组抽出的号码应是_若用分层抽样方法,则 40 岁以下年龄段应抽取_人 解:由分组可知,抽号的间隔为 5,又因为第 5组抽出的号码为 22,所以第 6 组抽出的号码为 27,第 7 组

8、抽出的号码为 32,第 8 组抽出的号码为 37;易知 40 岁以下年龄段的职工数为 2000.5100,所以 40 岁以下年龄段应抽取的人数为 4020010020.故填 37;20.类型一 简单随机抽样 某大学为了支援我国西部教育事业,决定从应届毕业生报名的18名志愿者中选取6名组成志愿小组请用抽签法和随机数表法设计抽样方案 解:(抽签法)第一步:将 18 名志愿者编号,编号为 1,2,3,18;第二步:将 18 个号码分别写在 18 张外形完全相同的纸条上,并揉成团,制成号签;第三步:将 18 个号签放入一个不透明的盒子里,充分搅匀;第四步:从盒子中逐个抽取 6 个号签,并记录上面的编号

9、;第五步:所得号码对应的志愿者就是志愿小组的成员(随机数表法)第一步:将 18 名志愿者编号,编号为 01,02,03,18;第二步:在随机数表中任选一数作为开始,按任意方向读数,比如从第 8 行第 29 列的数 7 开始,向右读;第三步:从数 7 开始,向右读,每次取两位,凡不在 0118 中的数或已读过的数,都跳过去不作记录,依次可得到 12,07,15,13,02,09;第四步:找出以上号码对应的志愿者,即是志愿小组的成员 点拨:考虑到总体中个体数较少,利用抽签法或随机数表法很容易获取样本,但须按这两种抽样方法的操作步骤进行注意掌握随机数表的使用方法 某车间工人已加工一种轴 100 件,

10、为了解这种轴的直径,要从中抽出 10 件在同一条件下测量轴的直径(要求为(200.5)mm)如何采用简单随机抽样方法抽取上述样本?解:因为 100 件轴的直径的全体是总体,将其中的 100 个个体编号 00,01,02,99.利用随机数表来抽取样本的 10 个号码,在随机数表中任选一数作为开始,任选一方向作为读数方向,比如选第 20 行第 3 列的数开始,往右读数,得到 10 个号码如下:16,93,32,43,50,27,89,87,19,20.将上述号码的轴在同一条件下测量直径 类型二 系统抽样 从某厂生产的 10 002 辆汽车中随机抽取 100 辆测试某项性能,请合理选择抽样方法进行抽

11、样,并写出抽样过程 解:因为总体容量和样本容量都较大,可用系统抽样 抽样步骤如下:第一步,将 10 002 辆汽车用随机方式编号;第二步,从总体中剔除 2 辆(剔除法可用随机数表法),将剩下的 10 000 辆汽车重新编号(分别为00001,00002,10000),并分成 100 段;第三步,在第一段 00001,00002,00100这 100 个编号中用简单随机抽样方法抽出一个作为起始号码(如 00006);第四步,把起始号码依次加上间隔 100,可获得样本 点拨:总体容量和样本容量都较大时,选用系统抽样比较合适;系统抽样的号码成等差数列,公差为每组的容量 (2015宜昌一模)某市为了创

12、建国家级文明城市,采用系统抽样的方法从 960 人中抽取 32 人做问卷调查,为此将这 960 人随机编号为 1,2,960,分组后在第一组中采用简单随机抽样的方法抽到的号码为 9.若抽到的 32 人中,编号落入区间的人做问卷 A,编号落入区间的人做问卷 B,其余的人做问卷 C,则抽到的人中,做问卷 B 的人数为_ 解:由题意知,将 960 人平均分成 32 组,每组30 人,第 k(kN*)组抽到的号码为(k1)309.令 451(k 1)30 9 750(kN*),解 得16k25,则满足 16k25 的正整数 k 有 10 个,故做问卷 B 的人数为 10.故填 10.类型三 分层抽样

13、某企业共有 5 个分布在不同区域的工厂,职工 3 万人,其中职工比例为 32523.现从 3 万人中抽取一个 300 人的样本,分析员工的生产效率已知生产效率与不同的地理位置的生活习俗及文化传统有关,问应采取什么样的方法?并写出具体过程 解:应采取分层抽样的方法过程如下:(1)将 3 万人分为五层,其中一个工厂为一层(2)按照样本容量的比例随机抽取各工厂应抽取的样本:300 31560(人);300 21540(人);300 515100(人);300 21540(人);300 31560(人)因此各工厂应抽取的人数分别为 60 人,40 人,100 人,40 人,60 人(3)将 300 人

14、组到一起即得到一个样本 点拨:分层抽样的实质为按比例抽取,当总体由差异明显的几部分组成时,多用分层抽样应认识到,在各层抽取样本时,又可能会用到简单随机抽样,系统抽样,甚至分层抽样来抽取样本 (2016天津期末)某公司有 1 000 名员工,其中,高层管理人员占 5%,中层管理人员占15%,一般员工占 80%,为了解公司的某种情况,现用分层抽样的方法抽取 120 人进行调查,则一般员工应抽取_人 解:应抽取一般员工 12080%96 人故填96.1简单随机抽样是系统抽样和分层抽样的基础,是一种等概率的抽样,它的特点是:(1)它要求总体个数较少;(2)它是从总体中逐个抽取的;(3)它是一种不放回抽

15、样 2系统抽样又称等距抽样,号码序列一旦确定,样本即确定好了但要注意,如果编号的个体特征随编号的变化呈现一定的周期性,那么样本的代表性是不可靠的,甚至会导致明显的偏向 3分层抽样一般在总体是由差异明显的几个部分组成时使用 4抽样方法经常交叉使用,比如系统抽样中均匀分段后的第一段,可采用简单随机抽样;分层抽样中,若每层中个体数量仍很大时,则可辅之以系统抽样等 5三种抽样方法的比较 类别 共同点 各自特点 相互联系 适用范围 简单随机抽样 抽样过程中每个个体被抽取的概率相等 从 总 体 中逐个抽样 总 体 中的 个 体数较少 系统 抽样 将 总 体 均分 成 几 部分,按事先确 定 的 规则 在

16、各 部分抽取 在 起 始部 分 抽样 时 采用 简 单随 机 抽样 总 体 中的 个 体数较多 分层 抽样 将 总 体 分成几层,分层 进 行 抽取 分 层 抽样 时 采用 简 单随 机 抽样 或 系统抽样 总 体 由差 异 明显 的 几部 分 组成 1下列抽样中不是系统抽样的是()A从标有 115 号的 15 个球中,任选 3 个作样本,按从小号到大号排序,随机选起点 i0,以后i05,i010(超过 15 则从 1 再数起)号入样 B工厂生产的产品,用传送带将产品送入包装车间前,检验人员从传送带上每隔 5 分钟抽一件产品进行检验 C搞某一市场调查,规定在商场门口随机抽一个人进行询问,直到调

17、查到事先规定的调查人数为止 D电影院调查观众的某一指标,通知每排(每排人数相同)座位号为 14 的观众留下来谈 解:选项 C 为简单随机抽样,其余选项为系统抽样故选 C.2(2014广东)为了解 1 000 名学生的学习情况,采用系统抽样的方法,从中抽取容量为 40 的样本,则分段的间隔为()A50 B40 C25 D20 解:由1 00040 25,可得分段的间隔为 25.故选C.3(2016豫南九校模拟)某网络零售平台对购物情况做了一项调查,收回的有效问卷共 500 000份,其中购买下列四种商品的人数统计为:服饰鞋帽 198 000 人,家居用品 94 000 人,化妆品 116 000

18、人,家用电器 92 000 人为了解消费者对商品的满意度,该平台用分层抽样的方法从中选出部分问卷进行调查,已知在购买“化妆品”这一类中抽取了116 份,则在购买“家居用品”这一类中抽取的问卷份数为()A92 B94 C116 D118 解:在购买“化妆品”这一类中抽取了 116 份,设在购买“家居用品”这一类中应抽取的问卷份数为 x,则116116 000 x94 000,解得 x94.故选 B.4对一个容量为N的总体抽取容量为n的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为 p1,p2,p3,则()Ap1p2p3 Bp2p3p1 Cp1

19、p30.85,而前 5 组的频率之和为 0.040.080.150.200.260.730.85,所以 2.5x3.由 0.3(x2.5)0.850.73,解得 x2.9.所以,估计月用水量标准为 2.9 吨时,85%的居民每月的用水量不超过标准 点拨:本题主要考查频率分布直方图、频率、频数的计算公式等基础知识,考查学生的分析问题和解决问题的能力在频率分布直方图中,每个小矩形的面积就是相应的频率或概率,所有小矩形的面积之和为 1,这是解题的关键,也是识图的基础 某企业为了解下属某部门对本企业职工的服务情况,随机访问 50 名职工,根据这 50名职工对该部门的评分,绘制频率分布直方图(如图所示)

20、,其中样本数据分组区间为 (1)求频率分布直方图中 a 的值;(2)估计该企业的职工对该部门的评分不低于80 的概率;(3)从评分在,将其按从左到右的顺序分别编号为第一组,第二组,第五组下图是根据试验数据制成的频率分布直方图已知第一组与第二组共有 20 人,第三组中没有疗效的有 6 人,则第三组中有疗效的人数为()A6 B8 C12 D18 解:由题意,第一组和第二组的频率之和为0.240.160.4,故样本容量为 200.450,又第三组的频率为 0.36,故第三组的人数为 500.3618,故该组中有疗效的人数为 18612.故选 C.5某科研所共有职工 20 人,其年龄统计表如下:年龄

21、38 39 40 41 42 人数 5 3 2 由于电脑故障,有两个数字在表格中不能显示出来,则下列说法正确的是()A年龄数据的中位数是 40,众数是 38 B年龄数据的中位数和众数一定相等 C年龄数据的平均数 x(39,40)D年龄数据的平均数一定大于中位数 解:根据表中数据,得 120(5381039341242)x 120(5381040341242),解得 39.35 x 39.85,所以 x(39,40)故选 C.6(2015山东)为比较甲、乙两地某月 14 时的气温状况,随机选取该月中的 5 天,将这 5 天中14 时的气温数据(单位:)制成如图所示的茎叶图考虑以下结论:甲地该月

22、14 时的平均气温低于乙地该月 14时的平均气温;甲地该月 14 时的平均气温高于乙地该月 14时的平均气温;甲地该月 14 时的气温的标准差小于乙地该月 14 时的气温的标准差;甲地该月 14 时的气温的标准差大于乙地该月 14 时的气温的标准差 其中根据茎叶图能得到的统计结论的编号为()A B C D 解:由茎叶图可以看出,甲的平均数较小,且数据分散,乙的平均数较大,且数据集中,因此甲的标准差应大于乙的标准差,故正确的结论是.故选 B.7(2015湖北)某电子商务公司对 10 000 名网络购物者 2014 年度的消费情况进行统计,发现消费金额(单位:万元)都在区间内,其频率分布直方图如图

23、所示 (1)直方图中的 a_;(2)在这些购物者中,消费金额在区间内的购物者的人数为_ 解:(1)由频率分布直方图及频率和等于 1 可得0.20.1 0.8 0.1 1.50.1 20.1 2.50.1a0.11,解得 a3.(2)消费金额在区间内的频率为 0.20.10.80.120.130.10.6,所以消费金额在区间内的购物者的人数为 0.610 0006 000.故填 3;6 000.8抽样统计甲、乙两位射击运动员的 5 次训练成绩(单位:环),结果如下:运动第 1第 2第 3第 4第 5员 次 次 次 次 次 甲 8.7 9.1 9.0 8.9 9.3 乙 8.9 9.0 9.1 8

24、.8 9.2 则成绩较为稳定(方差较小)的那位运动员成绩的方差为_ 解:x 甲8.79.19.08.99.359.0,x 乙8.99.09.18.89.259.0,s2甲150.04,s2乙 150.02,s2乙s2甲,所以成绩较为稳定的运动员乙成绩的方差为 0.02.故填0.02.9(2014广东)某车间 20 名工人年龄数据如下表:年龄(岁)工人数(人)19 1 28 3 29 3 30 5 31 4 32 3 40 1 合计 20(1)求这 20 名工人年龄的众数与极差;(2)以十位数为茎,个位数为叶,作出这 20 名工人年龄的茎叶图;(3)求这 20 名工人年龄的方差 解:(1)由题可

25、知,这 20 名工人年龄的众数是30,极差是 401921.(2)这 20 名工人年龄的茎叶图如图所示:(3)这 20 名工人年龄的平均数为 x 120(1932832953043133240)30,所以这 20 名工人年龄的方差为 s2 120i120(xi x)2 1126227125021022025220 12.6.10(2016北京)A,B,C 三个班共有 100 名学生,为调查他们的体育锻炼情况,通过分层抽样获得了部分学生一周的锻炼时间,数据如下表(单位:小时):A 班 6 6.5 7 7.5 8 B 班 6 7 8 9 10 11 12 C 班 3 4.5 6 7.5 9 10.

26、5 12 13.5(1)试估计 C 班的学生人数;(2)从 A 班和 C 班抽出的学生中,各随机选取一人,A 班选出的人记为甲,C 班选出的人记为乙假设所有学生的锻炼时间相互独立,求该周甲的锻炼时间比乙的锻炼时间长的概率;(3)再从 A,B,C 三个班中各随机抽取一名学生,他们该周的锻炼时间分别是 7,9,8.25(单位:小时)这 3 个新数据与表格中的数据构成的新样本的平均数记为 1,表格中数据的平均数记为 0,试判断 0和 1的大小(结论不要求证明)解:(1)C 班学生人数约为 1008578100 82040(人)(2)设事件 Ai为“甲是现有样本中 A 班的第 i个人”,i1,2,5.

27、事件Cj为“乙是现有样本中C班的第j个人”,j1,2,8.由题意可知 P(Ai)15,i1,2,5;P(Cj)18,j1,2,8.P(AiCj)P(Ai)P(Cj)1518 140,i1,2,5,j1,2,8.设事件 E 为“该周甲的锻炼时间比乙的锻炼时间长”,由题意知,EA1C1A1C2A2C1A2C2A2C3A3C1A3C2A3C3A4C1A4C2A4C3A5C1A5C2 A5C3A5C4.因此 P(E)P(A1C1)P(A1C2)P(A2C1)P(A2C2)P(A2C3)P(A3C1)P(A3C2)P(A3C3)P(A4C1)P(A4C2)P(A4C3)P(A5C1)P(A5C2)P(A

28、5C3)P(A5C4)15 14038.(3)16.635,因此在犯错误的概率不超过 0.01 的前提下认为“40 岁以上的人患胃病与否和生活规律有关”点拨:在利用 22 列联表计算 K2的值之前,应先假设两个分类变量是无关的,最后再利用 K2的值的大小对二者关系进行含概率的判断 (2014江西)某人研究中学生的性别与成绩、视力、智商、阅读量这 4 个变量的关系,随机抽查 52 名中学生,得到统计数据如表 1 至表 4,则与性别有关联的可能性最大的变量是()表 1 成绩 性别 不及格 及格 总计 男 6 14 20 女 10 22 32 总计 16 36 52 表 2 视力 性别 好 差 总计

29、 男 4 16 20 女 12 20 32 总计 16 36 52 表 3 智商 性别 偏高 正常 总计 男 8 12 20 女 8 24 32 总计 16 36 52 表 4 阅读量 性别 丰富 不丰富 总计 男 14 6 20 女 2 30 32 总计 16 36 52 A.成绩 B视力 C智商 D阅读量 解:K2152(6221410)216363220 528216363220,K2252(4201612)216363220 52112216363220,K2352(824128)2163632205296216363220,K2452(143062)21636322052408216

30、363220,则有 K24K22K23K21,所以阅读量与性别关联的可能性最大故选 D.1线性回归分析的方法、步骤(1)画出两个变量的散点图;(2)求相关系数 r,并确定两个变量的相关程度的高低;(3)用最小二乘法求回归直线方程ybxa,.,)()(1221121xbyaxnxyxnyxxxyyxxbniiniiiniiniii(4)利用回归直线方程进行预报 注:对于非线性(可线性化)的回归分析,一般是利用条件及我们熟识的函数模型,将题目中的非线性关系转化为线性关系进行分析,最后还原利用相关指数 R212121()()niiiniiyyyy刻画回归效果时,R2越大,意味着残差平方和21()ni

31、iiyy越小,模型的拟合效果越好 2独立性检验的一般步骤(1)假设两个分类变量 x 与 y 没有关系;(2)计算出 K2的观测值,其中 K2n(adbc)2(ab)(cd)(ac)(bd);(3)把 K2的值与临界值比较,作出合理的判断 3独立性检验的注意事项(1)在列联表中注意事件的对应及相关值的确定,不可混淆(2)在实际问题中,独立性检验的结论仅是一种数学关系表述,得到的结论有一定的概率出错(3)对判断结果进行描述时,注意对象的选取要准确无误,应是对假设结论进行的含概率的判断,而非其他 1一位母亲记录了儿子 39 岁的身高,由此建立的身高 y(单位:cm)与年龄 x(单位:岁)的回归方程为

32、 y 7.19x73.93.用这个方程预测这个孩子 10 岁时的身高,则正确的叙述是()A身高一定是 145.83 cm B身高在 145.83 cm 以上 C身高在 145.83 cm 以下 D身高在 145.83 cm 左右 解:回归模型的预报值是一种估计值,故选 D.2(2015福建月考)甲、乙、丙、丁四位同学各自对 A,B 两变量的线性相关性做试验,并由回归分析法分别求得相关指数 R2 与残差平方和 m 如下表:甲 乙 丙 丁 R2 0.85 0.78 0.69 0.82 m 103 106 124 115 则哪位同学的试验结果体现 A,B 两变量更强的线性相关性()A甲 B乙 C丙

33、D丁 解:因为相关指数 R2越大,残差平方和 m 越小,拟合效果越好故选 A.3设()x1,y1,()x2,y2,()xn,yn 是变量 x 和 y 的 n 个样本点,直线 l 是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论中正确的是()Ax 和 y 的相关系数为直线 l 的斜率 Bx 和 y 的相关系数在 0 到 1 之间 C当 n 为偶数时,分布在 l 两侧的样本点的个数一定相同 D直线 l 过点(x,y)解:依据最小二乘法的有关概念:样本点的中心,相关系数,线性回归方程的意义等进行判断,如下表:选项 具体分析 结论 A 相关系数用来衡量两个变量之间的相关程度,直线的斜率

34、表示直线的倾斜程度;它们的计算公式也不相同 不正确 B 相关系数的值有正有负,还可以是 0;当相关系数在 0 到 1 之间时,两个变量为正相关,在1 到 0 之间时,两个变量为负相关 不正确 C l 两侧的样本点的个数分布与 n 是奇是偶无关,也不一定是平均分布 不正确 D 由于a y b x,即 y b x a,因此 回 归 直 线 l 一 定 过 样 本 点 中 心()x,y 正确 故选 D.4在对两个分类变量 A 与 B 进行的独立性检验中,当 K23.841 时,我们认为 A 与 B()A有 95%的把握有关 B有 99%的把握有关 C没有理由说它们有关 D不确定 解:因为 K23.8

35、41,所以有 95%的把握认为 A,B 有关故选 A.5如果女大学生身高 x(cm)与体重 y(kg)的关系满足线性回归模型 y0.85x88e,其中|e|4,如果已知某女大学生身高 160 cm,则体重预计不会低于()A44 kg B46 kg C50 kg D54 kg 解:由|e|y0.85x88 4,得 0.85x92y0.85x84,当 x160 时,44y52.故选 A.6某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价x(元)8 8.2 8.4 8.6 8.8 9 销量y(件)90 84 83 80 75 68 由表中数据,求得线性回

36、归方程为y20 xa.若在这些样本点中任取一点,则它在回归直线左下方的概率为()A.12 B.13 C.14 D.15 解:易得 x 8.5,y 80,故a y b x 80(20)8.5250,y20 x250,写成y20 x2500,令 f(x,y)y20 x250,由 f(0,0)0 且点(0,0)在回归直线的左下方可知,满足f(x,y)0 的数据点均在回归直线的左下方,逐一验证可知使 f(x,y)0 的是(8.2,84)和(9,68)两组数据点故所求概率为 P2613.故选 B.7(2015山东淄博模拟改编)某种产品的宣传费支出 x 与销售额 y(单位:万元)之间有如下对应数据:x 2

37、 4 5 6 8 y 30 40 60 50 70 则 y 关于 x 的回归直线方程是_ 附:b 121()()()niiiniixxyyxx1221niiiniix ynxyxnx,aybx.解:计算得 x 255 5,y 2505 50,521iix145,51iiix y1 380.于是可得 b 122155niiiniix yxyxx1 38055501455526.5,aybx506.5517.5,因此,所求回归直线方程是 y 6.5x17.5.故填 y 6.5x17.5.8若一组观测值(x1,y1),(x2,y2),(xn,yn)之间满足 yibxiaei(i1,2,n),若ei恒

38、为 0,则 R2为_ 解:此时回归方程为 y bxa,故 y iyi,所以 R212121()()niiiniiyyyy=1.故填 1.9.对于数据:x 1 2 3 4 y 2 3 4 5 两 位 同 学 分 别 给 出 了拟合 直 线 y=x+1 和y=0.9x+1.2,试利用“最小二乘法”理论解释两条直线的拟合效果.解:对于拟合直线 y=x+1:412)(iiiyy=0.对于拟合直线 y=0.9x+1.2:412)(iiiyy=(-0.1)2+02+0.12+0.22=0.060,因而拟合直线 y=x+1 的拟合效果更好.事实上,拟合直线 y=x1 应是针对这组数据的所有拟合直线中最优的

39、10(2015河北模拟)某高校为调查学生喜欢“应用统计”课程是否与性别有关,随机抽取了选修该课程的 55 名学生,得到数据如下表:喜欢“应用 统计”课程 不喜欢“应用 统计”课程 总计 男生 20 5 25 女生 10 20 30 总计 30 25 55(1)判断是否有 99.5%的把握认为喜欢“应用统计”课程与性别有关?(2)用分层抽样的方法从喜欢“应用统计”课程的学生中抽取 6 名学生做进一步调查,将这 6 名学生作为一个样本,从中任选 2 人,求恰有 1 个男生和 1 个女生的概率 下面的临界值表供参考:P(K2k)0.15 0.10 0.05 0.025 0.010 0.005 0.0

40、01 k 2.072 2.706 3.841 5.024 6.635 7.879 10.828(参考公式:K2n(adbc)2(ab)(cd)(ac)(bd),其中 nabcd)解:(1)因为 K255(2020105)23025253011.9787.879,所以有 99.5%的把握认为喜欢“应用统计”课程与性别有关(2)设所抽样本中有 m 个男生,则 630 m20,得 m4,样本中有 4 个男生,2 个女生从中任选 2人有 C2615 种情形,其中恰有 1 个男生和 1 个女生的有 C14C128 种情形,所求概率 P 815.11(2016衡水模拟)2016 年 1 月 6 日北京时间

41、上午 11 时 30 分,朝鲜中央电视台宣布“成功进行了氢弹试验”,再次震动世界,此事件也引起了我国公民热议,其中丹东市(丹东市和朝鲜隔江)某QQ聊天群有300名网友,乌鲁木齐市某微信群有200名网友,为了解不同地区我国公民对“氢弹试验”事件的关注程度,现采用分层抽样的方法,从中抽取了 100 名网友,先分别统计了他们在某时段发表的信息条数,再将两地网友发表的信息条数分成 5组:,分别加以统计,得到如图所示的频率分布直方图 (1)求丹东市网友的平均留言条数(保留整数);(2)为了进一步开展调查,从样本中留言条数不足 50 条的网友中随机抽取 2 人,求至少抽到一名乌鲁木齐市网友的概率;(3)规

42、定“留言条数”不少于 70 条为“强烈关注”请你根据已知条件完成下列 22 的列联表:强烈关注 非强烈关注 合计 丹东市 乌鲁木齐市 合计 判断是否有 90%的把握认为“强烈关注”与网友所在的地区有关?附:临界值表及参考公式:K2 n(adbc)2(ab)(cd)(ac)(bd),nabcd.P(K2k0)0.15 0.10 0.05 0.025 0.010 0.005 0.001 k0 2.072 2.706 3.841 5.024 6.635 7.879 解:(1)450.0110 550.02510 650.0410750.0210850.0051063.564.所以丹东市网友的平均留言

43、条数是 64 条(2)留言条数不足 50 条的网友中,丹东市网友有 0.01101003003002006(人),乌鲁木齐市网友有 0.005101002003002002(人),从中随机抽取 2 人共有 C2828 种可能结果,其中至少有一名乌鲁木齐市网友的结果共有 C12C16 C2212113 种情况,所以至少抽到一名乌鲁木齐市网友的概率为 P1328.(3)列联表如下:强烈关注 非强烈关注 合计 丹东市 15 45 60 乌鲁木齐市 15 25 40 合计 30 70 100 K2 的观测值 k100(15251545)26040307025141.79.因为 1.79300 100

44、150 200 300 空气质量 优 良 轻度污染 中度污染 重度污染 严重污染 天数 6 14 18 27 20 15(1)若本次抽取的样本数据有 30 天是在供暖季,其中有 8 天为严重污染根据提供的统计数据,完成下面的 22 列联表,并判断是否有 95%的把握认为“该城市本年的空气严重污染与供暖有关”?非严重污染 严重污染 总计 供暖季 非供暖季 总计 100(2)已知某企业本年内每天的经济损失 y(单位:元)与 空 气 质 量 指 数 x 的 关 系 式 为 y 0,0 x100,400,100300.试估计该企业本年内一个月(按 30 天计算)的经济损失的数学期望 附:K2n(adb

45、c)2(ab)(cd)(ac)(bd),nabcd.P(K2k0)0.100 0.050 0.025 0.010 0.001 k0 2.706 3.841 5.024 6.635 10.828 解:(1)根据题设中的数据得到如下 22列联表:非严重污染 严重污染 总计 供暖季 22 8 30 非供暖季 63 7 70 总计 85 15 100 将 22 列联表中的数据代入公式计算,得 K2的观测值 k100(227638)2851530704.575.因为 4.5753.841,所以有 95%的把握认为“该城市本年的空气严重污染与供暖有关”(2)任选一天,设该天的经济损失为 X 元,则 P(X

46、0)P(0 x100)2010015,P(X400)P(100300)15100 320,所以 E(X)01540013202 000 320560.故该企业本年内一个月的经济损失的数学期望为 30E(X)16 800(元)一、选择题:本大题共 12 小题,每小题 5 分,共 60 分在每小题给出的四个选项中,只有一项是符合题目要求的 1现要完成下列 3 项抽样调查:从 10 盒酸奶中抽取 3 盒进行食品卫生检查 科技报告厅有 32 排,每排有 40 个座位,有一次报告会恰好坐满了听众,报告会结束后,为了听取意见,需要请 32 名听众进行座谈 东方中学共有 160 名教职工,其中一般教师120

47、 名,行政人员 16 名,后勤人员 24 名为了解教职工对学校在校务公开方面的意见,拟抽取一个容量为 20 的样本 较为合理的抽样方法是()A简单随机抽样;系统抽样;分层抽样 B简单随机抽样;分层抽样;系统抽样 C系统抽样;简单随机抽样;分层抽样 D分层抽样;系统抽样;简单随机抽样 解:由各抽样方法的适用范围可知较为合理的抽样方法是:用简单随机抽样,用系统抽样,用分层抽样故选 A.2某校老年、中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有 320 人,则该样本中的老年教师人数为()类别 人数 老年教师 900 中年教师 1 800 青年教师 1 6

48、00 合计 4 300 A.90 B100 C180 D300 解:设样本中的老年教师人数为 x,则 3201 600 x900,解得 x180.故选 C.3某市 2016 年各月的平均气温()数据的茎叶图如下:则这组数据的中位数是()A19 B20 C21.5 D23 解:根据茎叶图易求得这组数据的中位数是 20.故选 B.4在检验某产品直径尺寸的过程中,将尺寸数据分成若干组,内,将该班所有同学的考试分数分为七个组:,绘制出频率分布直方图如图所示,已知分数低于 112 分的有 18 人,则分数不低于 120 分的人数为()A10 B12 C20 D40 解:分数低于 112 分的人对应的频率

49、/组距为0.09,分数不低于 120 分的人对应的频率/组距为0.05,故其人数为 180.090.0510(人)故选 A.7为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了 500 位老人,结果如表:性别 是否需要志愿者 男 女 需要 40 30 不需要 160 270 附:K2n(adbc)2(ab)(cd)(ac)(bd)P(K2k0)0.050 0.010 0.001 k0 3.841 6.635 10.828 则()A在犯错误的概率不超过 0.1%的前提下,认为“需要志愿者提供帮助与性别有关”B在犯错误的概率不超过 0.1%的前提下,认为“需要志愿者提供帮助

50、与性别无关”C有 99%以上的把握认为“需要志愿者提供帮助与性别有关”D有 99%以上的把握认为“需要志愿者提供帮助与性别无关”解:由于 K2500(4027016030)2200300704309.9676.635,所以有 99%的把握认为该地区的老年人是否需要帮助与性别有关故选 C.8(2016离石区一模)为了确定加工零件所花费的时间,进行了 5 次试验,得到 5 组数据(x1,y1),(x2,y2),(x3,y3),(x4,y4),(x5,y5),根据收集到的数据可知 x20,由最小二乘法求得回归直线方程 y0.6x48,则 y1y2y3y4y5()A60 B120 C150 D300

51、解:将 x20 代入回归直线方程得 y0.6 204860.所以 y1y2y3y4y55y300.故选 D.9(2013湖北)四名同学根据各自的样本数据研究变量 x,y 之间的相关关系,并求得回归直线方程,分别得到以下四个结论:y 与 x 负相关且y2.347x6.423;y 与 x 负相关且y3.476x5.648;y 与 x 正相关且y5.437x8.493;y 与 x 正相关且y4.326x4.578.其中一定不正确的结论的序号是()A B C D 解:当 y 与 x 正相关时,应满足斜率大于 0;当 y 与 x 负相关时,应满足斜率小于 0,故一定不正确故选 D.10在某次测量中得到的

52、 A 样本数据如下:82,84,84,86,86,86,88,88,88,88.若 B 样本数据恰好是 A 样本数据每个都加 2 后所得数据,则 A,B 两样本的下列数字特征对应相同的是()A众数 B平均数 C中位数 D标准差 解:样本数据每个都加 2 后所得数据的波动情况并没有发生改变,所以标准差不变故选 D.11甲、乙两人在一次射击比赛中各射靶 5 次,两人成绩的条形统计图如图所示,则下列说法正确的是()A甲的成绩的平均数小于乙的成绩的平均数 B甲的成绩的中位数等于乙的成绩的中位数 C甲的成绩的方差小于乙的成绩的方差 D甲的成绩的极差小于乙的成绩的极差 解:由题意可知,甲的成绩为 4,5,

53、6,7,8,乙的成绩为 5,5,5,6,9.所以甲、乙的成绩的平均数均为 6,A 错;甲、乙的成绩的中位数分别为 6,5,B 错;甲、乙的成绩的方差分别为 s2115 2,s2215125,C 正确;甲、乙的成绩的极差均为 4,D 错故选 C.12已知 x 与 y 之间的几组数据如下表:x 1 2 3 4 5 6 y 0 2 1 3 3 4 假设根据上表数据所得线性回归直线方程为ybxa.若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为 ybxa,则以下结论正确的是()A.bb,aa B.bb,aa C.ba D.b b ,aa 解:由题意得 n6,x 123456672,

54、y 0213346136,bniiniiixnxyxnyx12215845.591672257,a y b x 136 577213.直线 ybxa过两点(1,0)和(2,2),b20212,把点(1,0)代入 y2xa得 a2.通过比较可得ba.故选 C.二、填空题:本大题共 4 小题,每小题 5 分,共 20 分 13(2016桂林期末)为了判断高中三年级学生是否选修文科与性别的关系,现随机抽取 50 名学生,得到如下 22 列联表:理科 文科 男 13 10 女 7 20 已 知P(K2 3.841)0.05,P(K2 5.024)0.025.根据表中数据,得K250(1320107)2

55、232720304.844.则认为选修文科与性别有关系出错的可能性为_ 解:因为根据表中数据得到 K24.8443.841,所以认为选修文科与性别有关系出错的可能性为5%.故填 5%.14甲、乙两套设备生产的同类型产品共 4 800件,采用分层抽样的方法从中抽取一个容量为 80的样本进行质量检测若样本中有 50 件产品由甲设备生产,则乙设备生产的产品总数为_件 解:分层抽样中各层的抽样比相同样本中甲设备生产的有 50 件,则乙设备生产的有 30 件在4 800 件产品中,甲、乙设备生产的产品总数比为53,所以乙设备生产的产品总数为 4 80038 1 800 件故填 1 800.15已知某单位

56、有 40 名职工,现要从中抽取 5名职工,将全体职工随机按 140 编号,并按编号顺序平均分成 5 组按系统抽样方法在各组内抽取一个号码 (1)若第 1 组抽出的号码为 2,则所有被抽出的职工号码为_;(2)分别统计这 5 名职工的体重(单位:kg),获得体重数据的茎叶图如图所示,则该样本方差为_ 解:(1)由分组可知,抽号的间隔为 8,又第 1组抽出的号码为 2,所以所有被抽出的职工号码为2,10,18,26,34.(2)由茎叶图知 5 名职工体重的平均数 x5962707381569,则该样本的方差 s2 1562.故填 2,10,18,26,34;62.16(2015江苏模拟)某中学为了

57、解学生数学课程的学习情况,在 3 000 名学生中随机抽取 200名,并统计这 200 名学生的某次数学考试成绩,得到了样本的频率分布直方图(如图)根据频率分布直方图推测,这 3 000 名学生在该次数学考试中成绩小于 60 分的学生人数是_ 解:由频率分布直方图知,随机抽取的 200 名学生中成绩小于 60 分的学生人数是(0.0020.0060.012)1020040,设这 3 000 名学生中该次数学成绩小于 60 分的学生人数为 x,则40 x 2003 000,解得 x600.故填 600.三、解答题:解答应写出文字说明、证明过程或演算步骤 17(10 分)从参加环保知识竞赛的学生中

58、抽出60 名,将其成绩(均为整数)整理后画出的频率分布直方图如图,观察图形,回答下列问题:(1)79.5,89.5)这一组的频数、频率分别是多少?(2)估计这次环保知识竞赛的及格率(60 分及以上为及格)解:(1)频率为:0.025100.25,频数:600.2515.(2)因为 0.015100.025100.03100.005100.75,所以估计这次环保知识竞赛的及格率为 0.75.18(12 分)(2016江西校级月考)为了促进人口的均衡发展,我国从 2016 年 1 月 1 日起,全国统一实施全面放开两孩政策为了解适龄国民对放开生育二胎政策的态度,某部门选取 70 后和 80 后年龄

59、段的人作为调查对象,进行了问卷调查,其中,持“支持生二胎”“不支持生二胎”和“保留意见”态度的人数如表所示:支持 保留意见 不支持 80 后 780 420 200 70 后 120 180 300(1)在所有参与调查的人中,用分层抽样的方法抽取 n 个人,其中持“支持”态度的共 36 人,求 n的值;(2)在持“不支持”态度的人中,仍用分层抽样的方法抽取 5 人,并将其看成一个总体,从这 5 人中任意选取 2 人,求至少有 1 个 80 后的概率 解:(1)所有参与调查的人数为 7801204201802003002 000,由分层抽样知 n 369002 00080.(2)由分层抽样知抽取

60、的 5 人中有 2 个 80 后,3个 70 后从这 5 人中任取 2 人有 C2510 种情形,其中至少有 1 个 80 后的有 C12C13C227 种,故所求概率为 P 710.19(12 分)从某居民区随机抽取 10 个家庭,获得第 i 个家庭的月收入 xi(单位:千元)与月储蓄yi(单位:千元)的数据资料,算得 101iix=80,101iiy=20,101iii yx=184,1012iix 720.(1)求家庭的月储蓄 y 对月收入 x 的线性回归方程 ybxa;(2)判断变量 x 与 y 之间是正相关还是负相关;(3)若该居民区某家庭月收入为 7 千元,预测该家庭的月储蓄 附:

61、线性回归方程 ybxa 中,bniiniiixnxyxnyx1221,a y b x,其中 x,y 为样本平均值,线性回归方程也可写为ybxa.解:(1)由题意知 n10,x 1ni1nxi80108,y 1n i1ny i 2010 2,又 niix12 2xn 720 1082=80,niii yx1yxn=184108224,由此得 b24800.3,aybx20.380.4,故所求回归方程为 y0.3x0.4.(2)由于变量 y 的值随 x 的值增加而增加(b0.30),故 x 与 y 之间是正相关(3)将 x7 代入回归方程可以预测该家庭的月储蓄为 y0.370.41.7(千元)20

62、(12 分)(2016成都校级模拟)记者对某城市的工薪阶层关于“义务献血”态度进行了调查,随机抽取了 60 人,作出了他们的月收入的频率分布直方图(如图),同时得到了他们的月收入情况与“义务献血”赞成人数统计表(如表):月收入(百元)赞成 人数 15,25)8 25,35)7 35,45)10 45,55)6 55,65)2 65,75)2(1)试根据频率分布直方图估计这 60 人的月收入的中位数和平均数;(2)若从月收入(单位:百元)在65,75)的被调查者中随机选取 2 人进行追踪调查,求被选取的 2人都不赞成的概率 解:(1)设中位数为 x,由直方图知:100.015100.015(x3

63、5)0.0250.5,解得 x43(百元);平均数为(200.015 300.01540 0.025500.02600.015700.01)1043.5(百元)(2)月收入(单位:百元)在65,75)的人数为60100.016(人),由表格知赞成的人数为 2人,则不赞成的人数为 4 人,从这 6 人中任选 2 人有 C2615 种选法,被选取的 2 人都不赞成有 C246种选法,故所求概率为 P 61525.21(12 分)(2016银川校级一模)某校高二文科一班主任为了解同学们对某时政要闻的关注情况,在该班进行了一次调查,发现在全班 50 名同学中,对此事关注的同学有 30 名,该班在本学期

64、期末考试中政治成绩(满分 100 分)的茎叶图如图所示 (1)求“对此事不关注者”的政治期末考试成绩的中位数与平均数;(2)若成绩不低于 60 分记为“及格”,从“对此事不关注者”中随机抽取 1 人,该同学及格的概率为 P1,从“对此事关注者”中随机抽取 1 人,该同学及格的概率为 P2,求 P2P1的值;(3)若成绩不低于 80 分记为“优秀”,请以是否优秀为分类变量 补充下面的 22 列联表:政治成绩优秀 政治成绩不优秀 合计 对此事关注者(单位:人)对此事不关注者(单位:人)合计 是否有 90%以上的把握认为“对此事是否关注”与政治期末成绩是否优秀有关系?参考数据:P(K2k0)0.15

65、 0.10 0.05 0.025 0.010 0.005 0.001 k0 2.072 2.706 3.841 5.042 6.635 7.879 10.828 参考公式:K2n(adbc)2(ab)(cd)(ac)(bd),其中 nabcd.解:(1)“对此事不关注者”的 20 名同学,成绩从低到高依次为:42,46,50,52,53,56,61,61,63,64,66,66,72,72,76,82,82,86,90,94,中位数为6466265,平均数为 120(4246505253566161636466667272768282869094)66.7.(2)由条件可得 P120620 7

66、10,P230530 56,所以 P2P156 710 215.(3)补充的 22 列联表如下:政治成绩优秀 政治成绩不优秀 合计 对此事关注者(单位:人)12 18 30 对此事不关注者(单位:人)5 15 20 合计 17 33 50 由22列联表可得K250(1215185)2302017332251871.203 25.024,所以能根据已知判断有 97.5%的把握认为视觉和空间能力与性别有关(2)设甲、乙解答一道几何题的时间分别为 x,y 分 钟,则 基 本 事 件 满 足 的 区 域 为 不 等 式 组5x7,6y8表示的平面区域(如图所示)设事件 A 为“乙比甲先解答完此道题”,则满足的区域为 xy(图中阴影部分所示)所以由几何概型 P(A)121122 18,即乙比甲先解答完的概率为18.(3)在选择做几何题的 8 名女生中任意抽取 2人,抽取方法有 C2828 种,其中甲、乙两人没有一个人被抽到有 C2615 种;恰有一人被抽到有 C12C1612 种;两人都被抽到有 C221 种,所以 X 可能的取值为 0,1,2,且 P(X0)1528,P(X1)122837,P(X2)128.X 的分布列为 X 0 1 2 P 1528 37 128 所以 E(X)015281372 128 12.

Copyright@ 2020-2024 m.ketangku.com网站版权所有

黑ICP备2024021605号-1