1、考点十九 统计与统计案例一、选择题 1对四组数据进行统计,获得如图所示的散点图,关于其相关系数的比较,正确的是()Ar2r40r3r1Br4r20r1r3 Cr4r20r3r1Dr2r40r1r3 答案 A 解析 易知题中图(1)和图(3)是正相关,图(2)与图(4)是负相关,且图(1)与图(2)中的样本点集中分布在一条直线附近,则 r2r40r3r1.2(2019全国卷)演讲比赛共有 9 位评委分别给出某选手的原始评分,评定该选手的成绩时,从 9 个原始评分中去掉 1 个最高分、1 个最低分,得到 7 个有效评分.7 个有效评分与 9 个原始评分相比,不变的数字特征是()A中位数B平均数C方
2、差D极差 答案 A 解析 中位数是将 9 个数据从小到大或从大到小排列后,处于中间位置的数据,因而去掉 1 个最高分和 1 个最低分,不变的是中位数,平均数、方差、极差均受影响故选 A.3(2019南阳市一中第九次目标考试)为考察 A,B 两种药物预防某疾病的效果,进行动物实验,分别得到如下等高条形图根据图中信息,在下列各项中,说法最佳的一项是()A药物 B 的预防效果优于药物 A 的预防效果 B药物 A 的预防效果优于药物 B 的预防效果 C药物 A,B 对该疾病均有显著的预防效果 D药物 A,B 对该疾病均没有预防效果 答案 B 解析 由题图可得服用药物 A 的患病人数少于服用药物 B 的
3、患病人数,而服用药物 A 的未患病人数多于服用药物 B 的未患病人数,所以药物 A 的预防效果优于药物 B 的预防效果故选 B.4(2019沈阳市东北育才学校高三一模)甲、乙两名同学 6 次考试的成绩统计如图,甲、乙两名同学成绩的平均数分别为 x甲、x乙,标准差分别为 甲,乙,则()A.x甲 x乙,甲 乙B.x甲 乙 C.x甲 x乙,甲 x乙,甲 乙 答案 C 解析 甲、乙两名同学 6 次考试的成绩统计如图,甲、乙两名同学成绩的平均数分别为 x甲,x乙,标准差分别为 甲,乙,由折线图得 x甲 x乙,甲 乙故选 C.5(2019湖南张家界三模)已知变量 x,y 之间的线性回归方程为 y0.7x1
4、0.3,且变量 x,y 之间的一组相关数据如表所示,则下列说法错误的是()x681012 y6m32 A变量 x,y 之间呈现负相关关系 B可以预测,当 x20 时,y3.7 Cm4 D由表格数据可知,该回归直线必过点(9,4)答案 C 解析 由题意得,由0.76.635 可知,我们有 99%以上的把握认为“爱好该项运动与性别有关”7(2019湖南师大附中月考七)下列说法错误的是()A在回归模型中,预报变量 y 的值不能由解释变量 x 唯一确定 B若变量 x,y 满足关系 y0.1x1,且变量 y 与 z 正相关,则 x 与 z 也正相关 C在残差图中,残差点分布的带状区域的宽度越狭窄,其模型
5、拟合的精度越高 D以模型 ycekx 去拟合一组数据时,为了求出回归方程,设 zln y,将其变换后得到线性方程 z0.3x4,则 ce4,k0.3 答案 B 解析 对于 A,y 除了受自变量 x 的影响之外还受其他因素的影响,故 A 正确;对于 B,变量 x,y 满足关系 y0.1x1,则变量 x 与 y 负相关,又变量 y 与 z正相关,则 x 与 z 负相关,故 B 错误;对于 C,由残差图的意义可知正确;对于 D,ycekx,两边取对数,可得 ln yln(cekx)ln cln ekxln ckx,令 zln y,可得 zln ckx,z0.3x4,ln c4,k0.3,ce4.即
6、D 正确,故选 B.8(2019福建泉州第二次质检)已知某样本的容量为 50,平均数为 70,方差为 75.现发现在收集这些数据时,其中的两个数据记录有误,一个错将 80 记录为60,另一个错将 70 记录为 90.在对错误的数据进行更正后,重新求得样本的平均数为 x,方差为 s2,则()A.x70,s275 C.x70,s275 D.x75 答案 A 解析 x7050806070905070,设收集的 48 个准确数据分别记为 x1,x2,x48,则 75 150(x170)2(x270)2(x4870)2(6070)2(9070)2 150(x170)2(x270)2(x4870)2500
7、,s2 150(x170)2(x270)2(x4870)2(8070)2(7070)2 150(x170)2(x270)2(x4870)21003.841,所以在犯错误的概率不超过0.05 的前提下能认为“获奖与女生、男生有关”14(2019聊城市高三一模)某小学为了了解四年级学生的家庭作业用时情况,从本校四年级随机抽取了一批学生进行调查,并绘制了学生作业用时的频率分布直方图,如图所示(1)估算这批学生的作业平均用时情况;(2)作业用时不能完全反映学生学业负担情况,这与学生自身的学习习惯有很大关系,如果用时四十分钟之内评价为优异,一个小时以上为一般,其他评价为良好现从优异和良好的学生里面用分层
8、抽样的方法抽取 300 人,其中女生有 90人(优异 20 人)请完成列联表,并根据列联表分析能否在犯错误的概率不超过 0.05的前提下认为学习习惯与性别有关系?男生女生合计 良好 优异 合计 附:K2nadbc2abcdacbd,其中 nabcd.P(K2k0)0.1000.0500.0250.0100.001 k02.7063.8415.0246.63510.828 解(1)t 10(350.01450.02550.03650.025750.01850.005)57.所以批学生作业用时的平均数为 57.(2)优异学生数与良好学生数之比为 0.01(0.020.03)15,按照分层抽样得 3
9、00 人中优异 50 人,良好 250 人;女生 90 人,男生 210 人;女生优异 20,良好 70 人,男生优异 30 人,良好 180 人,列联表如下:男生女生合计 良好18070250 优异302050 合计21090300 K2300180207030221090250502.857 x2,s1s2B.x1s2 C.x1 x2,s1s2D.x1 x2,s1 x2,s1b,aaB.bb,aa C.baD.bb,aa 答案 C 解析 描出散点图,易观察出ba,故选 C.6(2019四川乐山第三次调研)某调查机构对全国互联网行业进行调查统计,得到整个互联网行业从业者年龄分布饼状图、90
10、后从事互联网行业岗位分布条形图,则下列结论中不一定正确的是()注:90 后指 1990 年及以后出生,80 后指 19801989 年之间出生,80 前指1979 年及以前出生 A互联网行业从业人员中 90 后占一半以上 B互联网行业中从事技术岗位的人数超过总人数的 20%C互联网行业中从事运营岗位的人数 90 后比 80 前多 D互联网行业中从事技术岗位的人数 90 后比 80 后多 答案 D 解析 对于选项 A,互联网行业从业人员中 90 后占 56%,占一半以上,所以正确;对于选项 B,互联网行业中 90 后从事技术岗位的人数占总人数的39.6%56%22.176%,超过总人数的 20%
11、,所以正确;对于选项 C,互联网行业中从事运营岗位的人数 90 后占总人数的 56%17%9.52%,比 80 前多,所以正确;对于选项 D,互联网行业中从事运营岗位的人数 90 后占总人数的 56%17%9.52%,80 后占总人数的 41%,所以互联网行业中从事运营岗位的人数 90 后不一定比 80 后多,所以不一定正确,故选 D.7针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”作了一次调查,其中女生人数是男生人数的12,男生追星的人数占男生人数的16,女生追星的人数占女生人数的23.若有 95%的把握认为是否追星和性别有关,则男生至少有()A11 人B12 人C18
12、人D24 人 附表及公式:K2nadbc2abcdacbd,nabcd.P(K2k0)0.0500.0250.0100.005 k03.8415.0246.6357.879 答案 B 解析 设男生人数为 x,依题意可得列联表如下:喜欢追星不喜欢追星总计 男生x65x6x 女生x3x6x2 总计x2x3x2 若在犯错误的概率不超过 95%的前提下认为是否喜欢追星和性别有关,则K23.841,由 K23x2 x2365x2182x2xxx23x8 3.841,解得 x10.24,x2,x6为整数,若在犯错误的概率不超过 95%的前提下认为是否喜欢追星和性别有关,则男生至少有12 人,故选 B.8(
13、2019江西南昌一模)已知具有线性相关的五个样本点 A1(0,0),A2(2,2),A3(3,2),A4(4,2),A5(6,4),用最小二乘法得到回归直线方程 l1:ybxa,过点 A1,A2 的直线方程 l2:ymxn,那么下列四个命题中:mb,an;直线 l1 过点 A3;5i1(yibxia)25i1(yimxin)2;5i1|yibxia|5i1|yimxin|.参考公式:bni1xiyin x yni1x2in x2 ni1 xi xyi yni1 xi x2,a yb x 正确命题有()A1 个B2 个C3 个D4 个 答案 B 解析 由所给的数据计算可得 x3,y2,回归方程为
14、 y0.6x0.2,过点A1,A2 的直线方程为 yx,逐一考查所给的结论:mb,an,该说法正确;直线 l1 过点 A3 即回归方程过样本中心点,该说法正确;5i1(yibxia)20.8,5i1(yimxin)29,说法错误;5i1|yibxia|1.6,5i1|yimxin|5,说法错误,综上可得正确命题的个数有 2 个,故选 B.二、填空题 9空气质量指数(Air Quality Index,简称 AQI)是定量描述空气质量状况的指数,空气质量按照 AQI 大小分为六级,050 为优;51100 为良;101150 为轻度污染;151200 为中度污染;201300 为重度污染;大于
15、300 为严重污染一环保人士从当地某年的 AQI 记录数据中,随机抽取 10 个,用茎叶图记录如图根据该统计数据,估计此地该年 AQI 大于 100 的天数为_(该年为 365 天)答案 146 解析 该样本中 AQI 大于 100 的频数为 4,频率为25,以此估计此地全年 AQI大于 100 的频率为25,故此地该年 AQI 大于 100 的天数约为 36525146.10某数学老师身高 176 cm,他爷爷、父亲和儿子的身高分别是 173 cm、170 cm 和 182 cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为_cm.bi1nxi xyi yi1n
16、xi x2,a ybx 答案 185 解析 设父亲身高为 x cm,儿子身高为 y cm,则 x173170176 y170176182 x173,y176,b06303602991,a ybx17611733,所以yx3,当 x182 时,y185.11甲、乙两人要竞争一次大型体育竞技比赛射击项目的参赛资格,如图是在测试中甲、乙各射靶 10 次的条形图,则参加比赛的最佳人选为_ 答案 乙 解析 甲的平均数 x140.250.170.380.190.2100.17.0,乙的平均数 x250.160.270.480.290.17.0,所以 x1 x2;甲的方差 s21 110(74)22(75)
17、21(77)23(78)21(79)22(710)214,乙的方差 s22 110(75)21(76)22(77)24(78)22(79)211.2,所以 s21s22,即参加比赛的最佳人选为乙 12某学校开展一次“五四”知识竞赛活动,共有三个问题,其中第 1、2题满分都是 15 分,第 3 题满分是 20 分每个问题或者得满分,或者得 0 分活动结果显示,每个参赛选手至少答对一道题,有 6 名选手只答对其中一道题,有12 名选手只答对其中两道题答对第 1 题的人数与答对第 2 题的人数之和为 26,答对第 1 题的人数与答对第 3 题的人数之和为 24,答对第 2 题的人数与答对第 3题的人
18、数之和为 22.则参赛选手中三道题全答对的人数是_;所有参赛选手得分的平均数是_ 答案 2 29.5 解析 设 x1,x2,x3 分别表示答对第 1 题、第 2 题、第 3 题的人数,则有x1x226,x1x324,x2x322,解得 x114,x212,x310,又只答对一道题的人数为 6,只答对两道题的人数为 12,设答对三道题的人数为 x,则全班人数为 612x,611223x36,解得 x2,三道题全答对的人数是 2,所有参赛选手得分的平均数是 x 120(141512151020)29.5.三、解答题 13(2019长沙一模)某互联网公司为了确定下一季度的前期广告投入计划,收集了近
19、6 个月广告投入量 x(单位:万元)和收益 y(单位:万元)的数据如下表:月份123456 广告投入量/万元24681012 收益/万元14.2120.3131.831.1837.8344.67 他们用两种模型ybxa,yaebx 分别进行拟合,得到相应的回归方程并进行残差分析,得到如图所示的残差图及一些统计量的值:xy6i1xiyi6i1x2i 7301464.24364(1)根据残差图,比较模型,的拟合效果,应选择哪个模型?并说明理由;(2)残差绝对值大于 2 的数据被认为是异常数据,需要剔除:()剔除异常数据后,求出(1)中所选模型的回归方程;()广告投入量 x18 时,(1)中所选模型
20、收益的预报值是多少?附:对于一组数据(x1,y1),(x2,y2),(xn,yn),其回归直线ybxa的斜率和截距的最小二乘估计分别为:bni1 xi xyi yni1 xi x2ni1xiyin x yni1x2in x2,a ybx.解(1)应该选择模型,因为模型的残差点比较均匀地落在水平的带状区域中,且模型的带状区域比模型的带状区域窄,所以模型的拟合精度高,回归方程的预报精度高(2)()剔除异常数据,即 3 月份的数据后,得 x15(766)7.2,y15(30631.8)29.64.5i1xiyi1464.24631.81273.44,5i1x2i36462328.b5i1xiyi5
21、x y5i1x2i5 x2 1273.4457.229.6432857.27.2206.468.8 3,a ybx29.6437.28.04.所以 y 关于 x 的回归方程为y3x8.04.()把 x18 代入()中所求回归方程得y3188.0462.04,故预报值为 62.04 万元 14(2019云南省第二次高三统一检测)在某市创建全国文明城市的过程中,创文专家组对该市的中小学进行了抽检,其中抽检的一个环节是对学校的教师和学生分别进行问卷测评下表是被抽检到的五所学校 A,B,C,D,E 的教师和学生的测评成绩(单位:分):学校ABCDE 教师测评成绩 x9092939496 学生测评成绩
22、y8789899293(1)建立 y 关于 x 的回归方程ybxa;(2)现从 A,B,C,D,E 这五所学校中随机选两所派代表参加座谈,求 A,B两所学校至少有一所被选到的概率 P.附:bi1nxi xyi yi1nxi x2,a ybx.解(1)依据题意计算得 x9092939496593,y8789899293590,5i1(xi x)2(3)2(1)202123220,5i1(xi x)(yi y)(3)(3)(1)(1)0(1)123321,bi15xi xyi yi15xi x22120,a ybx9021209315320.所求回归方程为y2120 x15320.(2)从 A,B,C,D,E 这 5 所学校中随机选 2 所,具体情况为(A,B),(A,C),(A,D),(A,E),(B,C),(B,D),(B,E),(C,D),(C,E),(D,E),共有 10种等可能的结果 A,B 两所学校至少有一所被选到的为(A,B),(A,C),(A,D),(A,E),(B,C),(B,D),(B,E),共有 7 种 所以 A,B 两所学校至少有一所被选到的概率 P 710.