1、专题检测(十二)统计、统计案例 A 组“633”考点落实练一、选择题1.利用系统抽样法从编号分别为 1,2,3,80 的 80 件不同产品中抽出一个容量为 16的样本,如果抽出的产品中有一件产品的编号为 13,则抽到产品的最大编号为()A.73 B.78C.77 D.76解析:选 B 样本的分段间隔为80165,所以 13 号在第三组,则最大的编号为 13(163)578.故选 B.2.(2019全国卷)演讲比赛共有 9 位评委分别给出某选手的原始评分,评定该选手的成绩时,从 9 个原始评分中去掉 1 个最高分、1 个最低分,得到 7 个有效评分.7 个有效评分与 9 个原始评分相比,不变的数
2、字特征是()A.中位数B.平均数C.方差D.极差解析:选 A 中位数是将 9 个数据从小到大或从大到小排列后,处于中间位置的数据,因而去掉 1 个最高分和 1 个最低分,不变的是中位数,平均数、方差、极差均受影响.故选 A.3.(2019广东六校第一次联考)某单位为了落实“绿水青山就是金山银山”理念,制定节能减排的目标,先调查了用电量 y(单位:kWh)与气温 x(单位:)之间的关系,随机选取了 4天的用电量与当天气温,并制作了如下对照表:x(单位:)1714101y(单位:kWh)243438a由表中数据得线性回归方程:y2x60,则 a 的值为()A.48 B.62C.64 D.68解析:
3、选 C 由题意,得 x1714101410,y243438a496a4.样本点的中心(x,y)在回归直线y2x60 上,代入线性回归方程可得96a42060,解得 a64,故选 C.4.如图是民航部门统计的 2019 年春运期间十二个城市售出的往返机票的平均价格以及相比去年同期变化幅度的数据统计图表,根据图表,下面叙述不正确的是()A.深圳的变化幅度最小,北京的平均价格最高B.深圳和厦门的春运期间往返机票价格同去年相比有所下降C.平均价格从高到低居于前三位的城市为北京、深圳、广州D.平均价格的涨幅从高到低居于前三位的城市为天津、西安、厦门解析:选 D 由图可知深圳对应的小黑点最接近 0%,故变
4、化幅度最小,北京对应的条形图最高,则北京的平均价格最高,故 A 正确;由图可知深圳和厦门对应的小黑点在 0%以下,故深圳和厦门的价格同去年相比有所下降,故 B 正确;由图可知条形图由高到低居于前三位的城市为北京、深圳和广州,故 C 正确;由图可知平均价格的涨幅由高到低分别为天津、西安和南京,故 D 错误,选 D.5.一个样本容量为 10 的样本数据,它们组成一个公差不为 0 的等差数列an,若 a38,且 a1,a3,a7 成等比数列,则此样本的平均数和中位数分别是()A.13,12 B.13,13C.12,13 D.13,14解析:选 B 设等差数列an的公差为 d(d0),a38,a1a7
5、a2364,(82d)(84d)64,即 2dd20,又 d0,故 d2,故样本数据为:4,6,8,10,12,14,16,18,20,22,平均数为(422)51013,中位数为1214213.6.(2019成都市第二次诊断性检测)为比较甲、乙两名篮球运动员的近期竞技状态,选取这两名球员最近五场比赛的得分,制成如图所示的茎叶图.有下列结论:甲最近五场比赛得分的中位数高于乙最近五场比赛得分的中位数;甲最近五场比赛得分的平均数低于乙最近五场比赛得分的平均数;从最近五场比赛的得分看,乙比甲更稳定;从最近五场比赛的得分看,甲比乙更稳定.其中所有正确结论的编号为()A.B.C.D.解析:选 C 对于,
6、甲得分的中位数为 29,乙得分的中位数为 30,错误;对于,甲得分的平均数为15(2528293132)29,乙得分的平均数为15(2829303132)30,正确;对于,甲得分的方差为15(2529)2(2829)2(2929)2(3129)2(3229)215(161049)6,乙得分的方差为15(2830)2(2930)2(3030)2(3130)2(3230)215(41014)2,所以乙比甲更稳定,正确,错误.所以正确结论的编号为.二、填空题7.(2019全国卷)我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10 个车次的正点率为 0.97,有 20 个车次的正点率为
7、 0.98,有 10 个车次的正点率为 0.99,则经停该站高铁列车所有车次的平均正点率的估计值为_.解析:x100.97200.98100.991020100.98.则经停该站高铁列车所有车次的平均正点率的估计值为 0.98.答案:0.988.(2019安徽五校联盟第二次质检)数据 a1,a2,a3,an 的方差为 2,则数据 2a1,2a2,2a3,2an 的方差为_.解析:设 a1,a2,a3,an 的平均数为 a,则 2a1,2a2,2a3,2an 的平均数为 2a,2(a1a)2(a2a)2(a3a)2(ana)2n.则 2a1,2a2,2a3,2an 的方差为(2a12a)2(2a
8、22a)2(2a32a)2(2an2a)2n4(a1a)2(a2a)2(a3a)2(ana)2n42.答案:429.某新闻媒体为了了解观众对央视开门大吉节目的喜爱与性别是否有关系,随机调查了观看该节目的观众 110 名,得到如下的列联表:女男总计喜爱402060不喜爱203050总计6050110试根据样本估计总体的思想,估计在犯错误的概率不超过_的前提下(约有_的把握)认为“喜爱该节目与否和性别有关”.参考附表:P(K2k0)0.0500.0100.001k03.8416.63510.828参考公式:K2n(adbc)2(ab)(cd)(ac)(bd),其中nabcd解析:分析列联表中数据,
9、可得 K2 的观测值 k110(40302020)2605060507.8226.635,所以在犯错误的概率不超过 0.01 的前提下(有 99%的把握)认为“喜爱该节目与否和性别有关”.答案:0.01 99%三、解答题10.(2019全国卷)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将 200只小鼠随机分成 A,B 两组,每组 100 只,其中 A 组小鼠给服甲离子溶液,B 组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记 C 为事件:“乙离子残留在体内的百分比不低于
10、 5.5”,根据直方图得到 P(C)的估计值为 0.70.(1)求乙离子残留百分比直方图中 a,b 的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).解:(1)由已知得 0.70a0.200.15,故 a0.35.b10.050.150.700.10.(2)甲离子残留百分比的平均值的估计值为 20.1530.2040.3050.2060.1070.054.05,乙离子残留百分比的平均值的估计值为 30.0540.1050.1560.3570.2080.156.00.11.某市教育学院从参加市级高中数学竞赛的考生中随机抽取 60 名学生,将其竞赛成绩(均
11、为整数)分成六段:40,50),50,60),60,70),90,100,得到如图所示的频率分布直方图.(1)根据频率分布直方图,估计参加高中数学竞赛的考生的成绩的平均数、众数、中位数(小数点后保留一位有效数字);(2)用分层抽样的方法在各分数段的考生中抽取一个容量为 20 的样本,则各分数段抽取的人数分别是多少?解:(1)由频率分布直方图可知,(0.0100.0150.015a0.0250.005)101,所以 a0.03.所以参加高中数学竞赛的考生的成绩的平均数为 450.1550.15650.15750.3850.25950.0571,成绩的众数为 75.设参加高中数学竞赛的考生的成绩的
12、中位数为 x,则 0.10.150.15(x70)0.030.5,解得 x73.3,所以中位数为 73.3.(2)因为各层人数分别为 6,9,9,18,15,3,各层抽取比例为206013,所以各分数段抽取人数依次为 2,3,3,6,5,1.12.(2019沈阳市质量监测(一)某篮球运动员的投篮命中率为 50%,他想提高自己的投篮水平,制定了一个夏季训练计划,为了了解训练效果,执行训练前,他统计了 10 场比赛的得分,计算出得分的中位数为 15,平均得分为 15,得分的方差为 46.3.执行训练后也统计了 10场比赛的得分,茎叶图如图所示:(1)请计算该篮球运动员执行训练后统计的 10 场比赛
13、得分的中位数、平均得分与方差.(2)如果仅从执行训练前后统计的各 10 场比赛得分数据分析,你认为训练计划对该运动员的投篮水平的提高是否有帮助?为什么?解:(1)训练后得分的中位数为1415214.5;平均得分为8912141415161821231015;方差为 110(815)2(915)2(1215)2(1415)2(1415)2(1515)2(1615)2(1815)2(2115)2(2315)220.6.(2)尽管中位数训练后比训练前稍小,但平均得分一样,训练后方差 20.6 小于训练前方差46.3,说明训练后得分稳定性提高了(阐述观点合理即可),这是投篮水平提高的表现.故此训练计划
14、对该篮球运动员的投篮水平的提高有帮助.B 组大题专攻强化练1.(2019武汉市调研测试)一个工厂在某年里连续 10 个月每月产品的总成本 y(万元)与该月产量 x(万件)之间有如下一组数据:x1.081.121.191.281.361.481.591.681.801.87 y2.252.372.402.552.642.752.923.033.143.26(1)通过画散点图,发现可用线性回归模型拟合 y 与 x 的关系,请用相关系数加以说明.(2)建立月总成本 y 与月产量 x 之间的回归方程;通过建立的 y 关于 x 的回归方程,估计某月产量为 1.98 万件时,产品的总成本为多少万元?(均精
15、确到 0.001)附注:参考数据:错误!i27.31,i110 x2i 10 x20.850,i110y2i 10y21.042,b1.223.参考公式:相关系数回归直线yabx 中斜率和截距的最小二乘估计公式分别为:解:(1)由已知条件得,rbi110 x2i 10 x2i110y2i10y2,r1.2230.8501.0420.998,这说明 y 与 x 正相关,且相关性很强.(2)由已知求得 x1.445,y2.731,aybx2.7311.2231.4450.964,所求回归直线方程为y1.223x0.964.当 x1.98 时,y1.2231.980.9643.386(万元),此时产
16、品的总成本约为 3.386 万元.2.海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了 100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:(1)估计旧养殖法的箱产量低于 50 kg 的概率并估计新养殖法的箱产量的平均值;(2)填写下面的 22 列联表,并根据列联表判断是否有 99%的把握认为箱产量与养殖方法有关.箱产量50 kg箱产量50 kg总计旧养殖法新养殖法总计附:K2n(adbc)2(ab)(cd)(ac)(bd),其中 nabcd.P(K2k0)0.0500.0100.001k03.8416.63510.828解:(1)旧养殖法的箱产量低
17、于 50 kg 的频率为(0.0120.0140.0240.0340.040)50.62,所以旧养殖法的箱产量低于 50 kg 的概率估计值为 0.62;新养殖法的箱产量的平均值为37.50.0045 42.50.0205 47.5 0.044 5 52.50.0685 57.50.0465 62.50.010567.50.008552.35.(2)根据箱产量的频率分布直方图得 22 列联表如下:箱产量6.635,故有 99%的把握认为箱产量与养殖方法有关.3.(2019长沙市统一模拟考试)某互联网公司为了确定下一季度的前期广告投入计划,收集了近 6 个月广告投入量 x(单位:万元)和收益 y
18、(单位:万元)的数据如下表:月份123456广告投入量/万元24681012收益/万元14.2120.3131.831.1837.8344.67他们用两种模型ybxa,yaebx 分别进行拟合,得到相应的回归方程并进行残差分析,得到如图所示的残差图及一些统计量的值:xy 7301 464.24364(1)根据残差图,比较模型,的拟合效果,应选择哪个模型?并说明理由.(2)残差绝对值大于 2 的数据被认为是异常数据,需要剔除:()剔除异常数据后,求出(1)中所选模型的回归方程;()广告投入量 x18 时,(1)中所选模型收益的预报值是多少?附:对于一组数据(x1,y1),(x2,y2),(xn,
19、yn),其回归直线ybxa的斜率和截距的最小二乘估计分别为:解:(1)应该选择模型,因为模型的残差点比较均匀地落在水平的带状区域中,且模型的带状区域比模型的带状区域窄,所以模型的拟合精度高,回归方程的预报精度高.(2)()剔除异常数据,即 3 月份的数据后,得 x15(766)7.2,y15(30631.8)29.64.()把 x18 代入()中所求回归方程得y3188.0462.04,故预报值为 62.04 万元.4.每年 10 月中上旬是小麦的最佳种植时间,但小麦的发芽会受到土壤、气候等多方面因素的影响.某科技兴趣小组为了解昼夜温差的大小与小麦发芽的多少之间的关系,在不同的温差下统计了 1
20、00 颗小麦种子的发芽数,得到了如下数据:温差 x()810111312发芽数 y(颗)7981859086(1)请根据统计的最后三组数据,求出 y 关于 x 的线性回归方程ybxa;(2)若由(1)中的线性回归方程得到的估计值与前两组数据的实际值误差均不超过两颗,则认为线性回归方程是可靠的,试判断(1)中得到的线性回归方程是否可靠;(3)若 100 颗小麦种子的发芽数为 n 颗,则记 n%的发芽率,当发芽率为 n%时,平均每亩地的收益为 10n 元,某农场有土地 10 万亩,小麦种植期间昼夜温差大约为 9,根据(1)中得到的线性回归方程估计该农场种植小麦所获得的收益.附:在线性回归方程ybxa中,b解:(1)x111312312,y859086387,b11851390128631287112132122312252,由bxay,即5212a87,得a57,线性回归方程为y52x57.(2)当 x8 时,y5285777,与实际值 79 比较,误差没有超过两颗;当 x10 时,y52105782,与实际值 81 比较,误差也没有超过两颗.所以(1)中得到的线性回归方程y52x57 是可靠的.(3)由y52x57 得,当 x9 时,y79.5,即每亩地的收益大约为 795 元,所以该农场种植小麦所获得的收益大约为 7 950 万元.