1、第2讲统计与统计案例做真题题型一抽样方法与总体分布的估计1(2019高考全国卷)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是()A中位数B平均数C方差D极差解析:选A.记9个原始评分分别为a,b,c,d,e,f,g,h,i(按从小到大的顺序排列),易知e为7个有效评分与9个原始评分的中位数,故不变的数字特征是中位数,故选A.2(2018高考全国卷)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番为更好地了解该地区农村的经济收入变化情况,统计了该地区新
2、农村建设前后农村的经济收入构成比例,得到如下饼图:则下面结论中不正确的是()A新农村建设后,种植收入减少B新农村建设后,其他收入增加了一倍以上C新农村建设后,养殖收入增加了一倍D新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半解析:选A.法一:设建设前经济收入为a,则建设后经济收入为2a,则由饼图可得建设前种植收入为0.6a,其他收入为0.04a,养殖收入为0.3a.建设后种植收入为0.74a,其他收入为0.1a,养殖收入为0.6a,养殖收入与第三产业收入的总和为1.16a,所以新农村建设后,种植收入减少是错误的故选A.法二:因为0.60.372,所以新农村建设后,种植收入增加,
3、而不是减少,所以A是错误的故选A.3(2019高考全国卷)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液每只小鼠给服的溶液体积相同、摩尔浓度相同经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表)解:(1)由已知得0.70a0.
4、200.15,故a0.35.b10.050.150.700.10.(2)甲离子残留百分比的平均值的估计值为20.1530.2040.3050.2060.1070.054.05.乙离子残留百分比的平均值的估计值为30.0540.1050.1560.3570.2080.156.00.题型二变量间的相关关系、统计案例(2018高考全国卷)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人第一组工人用第一种生产方式,第二组工人用第二种生产方式根据工人完成生产任务的工作时间(单位:min)绘制了如图所示
5、的茎叶图:(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;(2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m的工人数填入下面的列联表:超过m不超过m第一种生产方式第二种生产方式(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?附:K2,解:(1)第二种生产方式的效率更高理由如下:()由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80分钟,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多79分钟因此第二种生产方式的效率更高()由茎叶图可知:用第一种生产方式的工人完成生产任务所
6、需时间的中位数为85.5分钟,用第二种生产方式的工人完成生产任务所需时间的中位数为73.5分钟因此第二种生产方式的效率更高()由茎叶图可知:用第一种生产方式的工人完成生产任务平均所需时间高于80分钟;用第二种生产方式的工人完成生产任务平均所需时间低于80分钟因此第二种生产方式的效率更高()由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完
7、成生产任务所需的时间更少因此第二种生产方式的效率更高(2)由茎叶图知m80.列联表如下:超过m不超过m第一种生产方式155第二种生产方式515(3)由于K2106.635,所以有99%的把握认为两种生产方式的效率有差异山东省学习指导意见1随机抽样理解随机抽样的必要性和重要性,学会用简单随机抽样方法从总体中抽取样本,通过对实例的分析,了解分层抽样和系统抽样方法2用样本估计总体(1)在表示样本数据的过程中,学会列频率分布表、画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点(2)理解样本数据标准差的意义和作用,学会计算数字特征(如平均数、标准差),并作出合理的解释(3)会用样本估计总体的思想
8、,会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征;初步体会样本频率分布和数字特征的随机性3统计案例(1)通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系知道最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程,并能初步应用(2)通过对典型案例(如“肺癌与吸烟有关吗”等)的探究,了解独立性检验(只要求22列联表)的基本思想、方法及初步应用用样本估计总体典型例题 (2019广东六校第一次联考)某市大力推广纯电动汽车,对购买用户依照车辆出厂续驶里程R(单位:千米)的行业标准,予以地方财政补贴,其补贴标准如下表:出厂续驶
9、里程R/千米补贴/(万元/辆)150R2503250R乙,乙选手平均用时更短答案:选手甲代表公司参加职业技能挑战赛比较合适,因为在相同次数的挑战中,两位选手在关键技能挑战的完成次数和失败次数都分别相同,虽然甲乙,但两者相差不大,水平相当,ss,表明甲选手的发挥更稳定答案:选手乙代表公司参加职业技能挑战赛比较合适,因为在相同次数的挑战中,两位选手在关键技能挑战的完成次数和失败次数都分别相同,但x乙s,说明乙选手进步幅度更大,成绩提升趋势更好(答案不唯一,可酌情给分)回归分析典型例题命题角度一线性回归分析 某地110岁男童年龄xi(单位:岁)与身高的中位数yi(单位:cm)(i1,2,10)如下表
10、:x/岁12345678910y/cm76.588.596.8104.1111.3117.7124.0130.0135.4140.2对上表的数据作初步处理,得到下面的散点图及一些统计量的值 (ix)2 (yi)2 (xi)(yi)5.5112.4582.503 947.71566.85(1)求y关于x的线性回归方程(线性回归方程系数精确到0.01);(2)某同学认为ypx2qxr更适宜作为y关于x的回归方程类型,他求得的回归方程是0.30x210.17x68.07.经调查,该地11岁男童身高的中位数为145.3 cm.与(1)中的线性回归方程比较,哪个回归方程的拟合效果更好?附:回归方程x中的
11、斜率和截距的最小二乘估计公式分别为:,.【解】(1)6.8716.87,112.456.8715.574.66,所以y关于x的线性回归方程为6.87x74.66.(2)若回归方程为6.87x74.66,当x11时,150.23.若回归方程为0.30x210.17x68.07,当x11时,y143.64.|143.64145.3|1.66|150.23145.3|4.93,所以回归方程0.30x210.17x68.07对该地11岁男童身高中位数的拟合效果更好求回归直线方程的关键及实际应用(1)关键:正确理解计算,的公式和准确地计算(2)实际应用:在分析实际中两个变量的相关关系时,可根据样本数据作
12、出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程估计和预测变量的值 命题角度二非线性回归分析 某机构为研究某种图书每册的成本费y(单位:元)与印刷数量x(单位:千册)的关系,收集了一些数据并进行了初步处理,得到了下面的散点图及一些统计量的值 (xi)2 (xi)(yi) (ui)2 (ui)(yi)15.253.630.2692 085.5230.30.7877.049表中ui,ui.(1)根据散点图判断:yabx与yc哪一个模型更适合作为该图书每册的成本费y(单位:元)与印刷数量x(单位:千册)的回归方程?(只要求给出判断,不必说明理由)(2)根据(1)的
13、判断结果及表中数据,建立y关于x的回归方程(回归系数的结果精确到0.01);(3)若该图书每册的定价为10元,则至少应该印刷多少册才能使销售利润不低于78 840元?(假设能够全部售出,结果精确到1)附:对于一组数据(w1,v1),(w2,v2),(wn,vn),其回归直线w的斜率和截距的最小二乘估计分别为,.【解】(1)由散点图判断,yc更适合作为该图书每册的成本费y(单位:元)与印刷数量x(单位:千册)的回归方程(2)令u,先建立y关于u的线性回归方程,由于8.9578.96,所以3.638.9570.2691.22,所以y关于u的线性回归方程为1.228.96u,所以y关于x的回归方程为
14、1.22.(3)假设印刷x千册,依题意得10xx78.840,解得x10,所以至少印刷10 000册才能使销售利润不低于78 840元求非线性回归方程的步骤(1)确定变量,作出散点图(2)根据散点图,选择恰当的拟合函数(3)变量置换,通过变量置换把非线性回归问题转化为线性回归问题,并求出线性回归方程(4)分析拟合效果:通过计算相关指数或画残差图来判断拟合效果(5)根据相应的变换,写出非线性回归方程 命题角度三回归分析与正态分布的综合问题 某地一商场记录了12月份某5天当中某商品的销售量y(单位:kg)与该地当日最高气温x(单位:)的相关数据,如下表:x119852y7881012(1)试求y与
15、x的回归方程x;(2)判断y与x之间是正相关还是负相关;若该地12月某日的最高气温是6 ,试用所求回归方程预测这天该商品的销售量;(3)假定该地12月份的日最高气温XN(,2),其中近似取样本平均数x,2近似取样本方差s2,试求P(3.8X13.4)附:参考公式和有关数据,3.2,1.8,若XN(,2),则P(X)0.682 7,且P(2X2)0.954 5.【解】(1)由题意,7,9,xiyin 28757928,xn229557250,0.56,x9(0.56)712.92.所以所求回归直线方程为0.56x12.92.(2)由0.560知,y与x负相关将x6代入回归方程可得,0.56612
16、.929.56,即可预测当日该商品的销售量为9.56 kg.(3)由(1)知7,3.2,所以P(3.8X13.4)P(X2)P(X)P(2X6.635,所以有99%的把握认为对下“禁奥令”的态度与性别有关(2)由题意,可知在这10人中,男、女生各5人,其中男生有4人、女生有2人认为不应下“禁奥令”,的所有可能取值有1,2,3,4.P(1);P(2);P(3);P(4).所以的分布列是1234P所以E()2.4.独立性检验的关键(1)根据22列联表准确计算K2,若22列联表没有列出来,要先列出此表(2)K2的观测值k越大,对应假设事件H0成立的概率越小,H0不成立的概率越大 对点训练(2019武
17、汉市调研测试)2019年,在庆祝中华人民共和国成立70周年之际,又迎来了以“创军人荣耀,筑世界和平”为口号的第七届世界军人运动会(以下简称“军运会”)据悉,这次军运会将于2019年10月18日至27日在美丽的江城武汉举行,届时将有来自100多个国家的近万名军人运动员参赛相对于奥运会、亚运会等大型综合赛事,军运会或许对很多人来说还很陌生,所以武汉某高校为了在学生中更广泛地推介普及军运会相关知识内容,特在网络上组织了一次“我所知晓的武汉军运会”知识问答比赛为便于对答卷进行对比研究,组委会抽取了1 000名男生和1 000名女生的答卷,他们的成绩(单位:分)频率分布直方图如下:(注:答卷满分100分
18、,成绩80的答卷为“优秀”等级)(1)从现有1 000名男生和1 000名女生的答卷中各取一份,分别求答卷成绩为“优秀”等级的概率;(2)求下面列联表中a,b,c,d的值,并根据列联表回答:能否在犯错误的概率不超过0.025的前提下认为“答卷成绩为优秀等级与性别有关”?男女总计优秀abab非优秀cdcd总计1 0001 0002 000(3)根据男、女生成绩频率分布直方图,对他们的成绩的优劣进行比较附:P(K2k0)0.050.0250.010k03.8415.0246.635K2,其中nabcd.解:(1)男生答卷成绩为“优秀”等级的概率P(0.0580.0340.0140.010)50.5
19、8,女生答卷成绩为“优秀”等级的概率P(0.0460.0340.0160.010)50.53.(2)男女总计优秀5805301 110非优秀420470890总计1 0001 0002 000所以a580,b530,c420,d470.由K2得,K25.0615.024,所以在犯错误的概率不超过0.025的前提下认为“答卷成绩为优秀等级与性别有关”(3)根据男、女生成绩频率分布直方图可得,男、女生成绩的中位数均在80到85之间,但男生的成绩分布集中程度较女生成绩分布集中程度高,因此,可以认为男生的成绩较好且稳定A组夯基保分专练一、选择题1某电视台在因特网上就观众对其某一节目的喜爱程度进行调查,
20、参加调查的一共有20 000人,其中各种态度对应的人数如下表所示:最喜爱喜爱一般不喜欢4 8007 2006 4001 600电视台为了了解观众的具体想法和意见,打算从中抽选出100人进行更为详细的调查,为此要进行分层抽样,那么在分层抽样时,每类人中应抽选出的人数分别为()A25,25,25,25B48,72,64,16C20,40,30,10D24,36,32,8解析:选D.法一:因为抽样比为,所以每类人中应抽选出的人数分别为4 80024,7 20036,6 40032,1 6008.故选D.法二:最喜爱、喜爱、一般、不喜欢的比例为4 8007 2006 4001 6006982,所以每类
21、人中应抽选出的人数分别为10024,10036,10032,1008,故选D.2(2019湖南省五市十校联考)在某次赛车中,50名参赛选手的成绩(单位:min)全部介于13到18之间(包括13和18),将比赛成绩分为五组:第一组13,14),第二组14,15),第五组17,18,其频率分布直方图如图所示,若成绩在13,15)内的选手可获奖,则这50名选手中获奖的人数为()A39B35C15D11解析:选D.由频率分布直方图知成绩在15,18内的频率为(0.380.320.08)10.78,所以成绩在13,15)内的频率为10.780.22,则成绩在13,15)内的选手有500.2211(人),
22、即这50名选手中获奖的人数为11,故选D.3(2019武汉市调研测试)某学校为了了解本校学生的上学方式,在全校范围内随机抽查部分学生,了解到上学方式主要有:A结伴步行,B自行乘车,C家人接送,D其他方式并将收集的数据整理绘制成如下两幅不完整的统计图请根据图中信息,求本次抽查的学生中A类人数是()A30B40C42D48解析:选A.由条形统计图知,B自行乘车上学的有42人,C家人接送上学的有30人,D其他方式上学的有18人,采用B,C,D三种方式上学的共90人,设A结伴步行上学的有x人,由扇形统计图知,A结伴步行上学与B自行乘车上学的学生占60%,所以,解得x30,故选A.4(2019广东六校第
23、一次联考)某单位为了落实“绿水青山就是金山银山”理念,制定节能减排的目标,先调查了用电量y(单位:kWh)与气温x(单位:)之间的关系,随机选取了4天的用电量与当天气温,并制作了如下对照表:x(单位:)1714101y(单位:kWh)243438a由表中数据得线性回归方程2x60,则a的值为()A48B62C64D68解析:选C.由题意,得x10,y.样本点的中心(x,y)在回归直线2x60上,代入线性回归方程可得2060,解得a64,故选C.5(2019郑州市第二次质量预测)将甲、乙两个篮球队各5场比赛的得分数据整理成如图所示的茎叶图,由图可知以下结论正确的是()A甲队平均得分高于乙队的平均
24、得分B甲队得分的中位数大于乙队得分的中位数C甲队得分的方差大于乙队得分的方差D甲、乙两队得分的极差相等解析:选C.由题中茎叶图得,甲队的平均得分x甲29,乙队的平均得分x乙30,x甲s,选项C正确;甲队得分的极差为31265,乙队得分的极差为32284,两者不相等,选项D不正确故选C.6(多选)CPI是居民消费价格指数(consumer price index)的简称居民消费价格指数是一个反映居民家庭一般所购买的消费品和服务项目价格水平变动情况的宏观经济指标如图是根据国家统计局发布的2017年6月2018年6月我国CPI涨跌幅数据绘制的折线图(注:2018年6月与2017年6月相比较,叫同比;
25、2018年6月与2018年5月相比较,叫环比),根据该折线图,则下列结论错误的是()A2018年1月至6月各月与去年同期比较,CPI有涨有跌B2018年2月至6月CPI只跌不涨C2018年3月以来,CPI在缓慢增长D2017年8月与同年12月相比较,8月环比更大解析:选ABC.A选项,2018年1月至6月各月与去年同期比较,CPI均是上涨的,故A错误;B选项,2018年2月CPI是增长的,故B错误;C选项,2018年3月以来,CPI是下跌的,故C错误;D选项,2017年8月CPI环比增长0.4%,12月环比增长0.3%,故D正确故选ABC.二、填空题7如图是某学校一名篮球运动员在10场比赛中所
26、得分数的茎叶图,则该运动员在这10场比赛中得分的中位数为_,平均数为_解析:把10场比赛的所得分数按顺序排列为5,8,9,12,14,16,16,19,21,24,中间两个为14与16,故中位数为15,平均数为(58912141616192124)14.4.答案:1514.48已知一组数据x1,x2,xn的方差为2,若数据ax1b,ax2b,axnb(a0)的方差为8,则a的值为_解析:根据方差的性质可知,a228,故a2.答案:29给出下列四个命题:某班级一共有52名学生,现将该班学生随机编号,用系统抽样的方法抽取一个容量为4的样本,如果7号、33号、46号同学在样本中,那么样本中另一位同学
27、的编号为23;一组数据1,2,3,3,4,5的平均数、众数、中位数都相同;若一组数据a,0,1,2,3的平均数为1,则其标准差为2;根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为x,其中2,x1,y3,则1.其中真命题有_(填序号)解析:在中,由系统抽样知抽样的分段间隔为52413,故抽取的样本的编号分别为7号、20号、33号、46号,故是假命题;在中,数据1,2,3,3,4,5的平均数为(123345)3,中位数为3,众数为3,都相同,故是真命题;在中,因为样本的平均数为1,所以a01235,解得a1,故样本的方差为(11)2(01)2(11)2(21)2(31)22,标准差为
28、,故是假命题;在中,回归直线方程为x2,又回归直线过点(x,y),把(1,3)代入回归直线方程x2,得1,故是真命题答案:三、解答题10(2019兰州市诊断考试)“一本书,一碗面,一条河,一座桥”曾是兰州的城市名片,而现在“兰州马拉松”又成为了兰州的另一张名片,随着全民运动健康意识的提高,马拉松运动不仅在兰州,而且在全国各大城市逐渐兴起,参与马拉松训练与比赛的人数逐年增加为此,某市对人们参加马拉松运动的情况进行了统计调查其中一项调查是调查人员从参与马拉松运动的人中随机抽取200人,对其每周参与马拉松长跑训练的天数进行统计,得到以下统计表:平均每周进行长跑训练天数不大于23或4不少于5人数301
29、3040若某人平均每周进行长跑训练天数不少于5,则称其为“热烈参与者”,否则称为“非热烈参与者”(1)经调查,该市约有2万人参与马拉松运动,试估计其中“热烈参与者”的人数;(2)根据上表的数据,填写下列22列联表,并通过计算判断是否能在犯错误的概率不超过0.01的前提下认为“热烈参与马拉松”与性别有关?热烈参与者非热烈参与者总计男140女55总计附:K2(n为样本容量)P(K2k0)0.5000.4000.2500.1500.1000.0500.0250.0100.0050.001k00.4550.7081.3232.0722.7063.8415.0246.6357.87910.828解:(1
30、)以200人中“热烈参与者”的频率作为概率,则该市“热烈参与者”的人数约为20 0004 000.(2)22列联表为热烈参与者非热烈参与者总计男35105140女55560总计40160200K27.2926.635,故能在犯错误的概率不超过0.01的前提下认为“热烈参与马拉松”与性别有关11(2019武汉市调研测试)中共十九大以来,某贫困地区扶贫办积极贯彻落实国家精准扶贫的要求,带领广大农村地区人民群众脱贫奔小康经过不懈的奋力拼搏,新农村建设取得巨大进步,农民年收入也逐年增加为了更好地制定2019年关于加快提升农民年收入,力争早日脱贫的工作计划,该地扶贫办统计了2018年50位农民的年收入(
31、单位:千元)并制成如下频率分布直方图:(1)根据频率分布直方图,估计50位农民的年平均收入x(单位:千元)(同一组数据用该组数据区间的中点值表示)(2)由频率分布直方图,可以认为该贫困地区农民年收入X服从正态分布N(,2),其中近似为年平均收入x,2近似为样本方差s2,经计算得s26.92.利用该正态分布,解决下列问题:(i)在2019年脱贫攻坚工作中,若使该地区约有占总农民人数的84.14%的农民的年收入高于扶贫办制定的最低年收入标准,则最低年收入大约为多少千元?(ii)为了调研“精准扶贫,不落一人”的落实情况,扶贫办随机走访了1 000位农民若每个农民的年收入相互独立,问:这1 000位农
32、民中年收入不少于12.14千元的人数最有可能是多少?附:参考数据与公式2.63,若XN(,2),则P(X)0.682 7;P(2X2)0.954 5;P(3)0.841 4,17.402.6314.77,即最低年收入大约为14.77千元(ii)由P(X12.14)P(X2)0.50.977 3,得每个农民的年收入不少于12.14千元的事件的概率为0.977 3,记这1 000位农民中年收入不少于12.14千元的人数为,则B(103,p),其中p0.977 3,于是恰好有k位农民的年收入不少于12.14千元的事件的概率是P(k)Ck103pk(1p)103k,从而由1,得k1,得k1 001p1
33、,而1 001p978.277 3,所以,977.277 3k978.277 3,由此可知,在所走访的1 000位农民中,年收入不少于12.14千元的人数最有可能是978.12(2019洛阳市统考)某学校高三年级共有4个班,其中实验班和普通班各2个,且各班学生人数大致相当在高三第一次数学统一测试(满分100分)成绩揭晓后,教师对这4个班的数学成绩进行了统计分析,其中涉及试题“难度”和“区分度”等指标根据该校的实际情况,规定其具体含义如下:难度,区分度.(1)现从这4个班中各随机抽取5名学生,根据这20名学生的数学成绩,绘制茎叶图如下:请根据以上样本数据,估计该次考试试题的难度和区分度;(2)为
34、了研究试题的区分度与难度的关系,调取了该校上一届高三6次考试的成绩分析数据,得到下表:考试序号123456难度x0.650.710.730.760.770.82区分度y0.120.160.160.190.200.13用公式r计算区分度y与难度x之间的相关系数r(精确到0.001);判断y与x之间相关关系的强与弱,并说明是否适宜用线性回归模型拟合y与x之间的关系参考数据:xiyi0.713 4, 0.009 2.解:(1)由茎叶图知,实验班这10人的数学总成绩为860分,普通班这10人的数学总成绩为700分,故这20人的数学平均成绩为78(分),由此估计这4个班的平均分为78分,所以难度0.78
35、.由86估计实验班的平均分为86分,由70估计普通班的平均分为70分,所以区分度0.16.(2)由于 (xix)(yiy) (xiyiyxixyixy)xiyiyxixyinxyxiyinxynxynxyxiyinxy,且xiyi0.713 4,0.009 2,6xy60.740.160.710 4,所以r0.326.由于r0.3260.30,0.75),故两者之间相关性非常一般,不适宜用线性回归模型拟合y与x之间的关系,即使用线性回归模型来拟合,效果也不理想B组大题增分专练1(2019济南市七校联合考试)“黄梅时节家家雨”“梅雨如烟暝村树”“梅雨暂收斜照明”江南梅雨的点点滴滴都流润着浓烈的诗
36、情每年六、七月份,我国长江中下游地区进入持续25天左右的梅雨季节,如图是江南Q镇20092018年梅雨季节的降雨量(单位:mm)的频率分布直方图,试用样本频率估计总体概率,解答下列问题:(1)“梅实初黄暮雨深”,请用样本平均数估计Q镇明年梅雨季节的降雨量;(2)“江南梅雨无限愁”,Q镇的杨梅种植户老李也在犯愁,他过去种植的甲品种杨梅,亩产量受降雨量的影响较大(把握超过八成),而乙品种杨梅20092018年的亩产量(单位:kg)与降雨量的发生频数(年)如22列联表所示(部分数据缺失),请你帮助老李排解忧愁,他来年应该种植哪个品种的杨梅受降雨量影响更小?(完善列联表,并说明理由)降雨量亩产量200
37、,400)100,200)400,500总计60026001总计10附:K2,其中nabcd.P(K2k0)0.500.400.250.150.10k00.4550.7081.3232.0722.706解:(1)频率分布直方图中第四组的频率为1100(0.0020.0040.003)0.1.所以用样本平均数估计Q镇明年梅雨季节的降雨量为1500.22500.43500.34500.13010010545280(mm)(2)根据频率分布直方图可知,降雨量在200,400)内的频数为10100(0.0030.004)7.进而完善列联表如下降雨量亩产量200,400)100,200)400,500总
38、计600224600516总计7310K21.2701.323.故认为乙品种杨梅的亩产量与降雨量有关的把握不足75%.而甲品种杨梅受降雨量影响的把握超过八成,故老李来年应该种植乙品种杨梅受降雨量影响更小2(2019佛山模拟)表中的数据是一次阶段性考试某班的数学、物理原始成绩:学号12345678910111213141516171819202122数学1171289611313613912412412111511512312511712312213212996105106120物理80848385898191788591727687827982848963737745学号23242526272
39、829303132333435363738394041424344数学1081378795108117104128125748113510197116102761006286120101物理7680715772656979055567763707563596442627765用这44人的两科成绩制作如下散点图:学号为22号的A同学由于严重感冒导致物理考试发挥失常,学号为31号的B同学因故未能参加物理学科的考试,为了使分析结果更客观准确,老师将A,B两同学的成绩(对应于图中A,B两点)剔除后,用剩下的42个同学的数据作分析,计算得到下列统计指标:数学学科平均分为110.5,标准差为18.36,物
40、理学科的平均分为74,标准差为11.18,数学成绩x与物理成绩y的相关系数r0.822 2,回归直线l(如图所示)的方程为0.500 6x18.68.(1)若不剔除A,B两同学的数据,用全部44人的成绩作回归分析,设数学成绩x与物理成绩y的相关系数为r0,回归直线为l0,试分析r0与r的大小关系,并在图中画出回归直线l0的大致位置(2)如果B同学参加了这次物理考试,估计B同学的物理分数(精确到个位)(3)就这次考试而言,学号为16号的C同学数学与物理哪个学科成绩要好一些?(通常为了比较某个学生不同学科的成绩水平,可按公式Zi统一化成标准分再进行比较,其中xi为学科原始成绩,x为学科平均分,s为
41、学科标准差)解:(1)r00.63,所以C同学物理成绩比数学成绩要好一些3(2019济南市模拟考试)某客户准备在家中安装一套净水系统,该系统为三级过滤,使用寿命为十年如图所示,两个一级过滤器采用并联安装,二级过滤器与三级过滤器为串联安装其中每一级过滤都由核心部件滤芯来实现在使用过程中,一级滤芯和二级滤芯都需要不定期更换(每个滤芯是否需要更换相互独立),三级滤芯无需更换若客户在安装净水系统的同时购买滤芯,则一级滤芯每个80元二级滤芯每个160元若客户在使用过程中单独购买滤芯,则一级滤芯每个200元,二级滤芯每个400元现需决策安装净水系统的同时购买滤芯的数量,为此参考了根据100套该款净水系统在
42、十年使用期内更换滤芯的相关数据制成的图表,其中图1是根据200个一级过滤器更换的滤芯个数制成的柱状图,表1是根据100个二级过滤器更换的滤芯个数制成的频数分布表二级滤芯更换的个数56频数6040表1以200个一级过滤器更换滤芯的频率代替1个一级过滤器更换滤芯发生的概率,以100个二级过滤器更换滤芯的频率代替1个二级过滤器更换滤芯发生的概率(1)求一套净水系统在使用期内需要更换的各级滤芯总个数恰好为30的概率;(2)记X表示该客户的净水系统在使用期内需要更换的一级滤芯总数,求X的分布列及数学期望;(3)记m,n分别表示该客户在安装净水系统的同时购买的一级滤芯和二级滤芯的个数,若mn28,且n5,
43、6,以该客户的净水系统在使用期内购买各级滤芯所需总费用的期望值为决策依据,试确定m,n的值解:(1)由题意可知,若一套净水系统在使用期内需要更换的各级滤芯总个数恰好为30,则该套净水系统中的两个一级过滤器均需更换12个滤芯,二级过滤器需要更换6个滤芯设“一套净水系统在使用期内需要更换的各级滤芯总个数恰好为30”为事件A,因为一个一级过滤器需要更换12个滤芯的概率为0.4,二级过滤器需要更换6个滤芯的概率为0.4,所以P(A)0.40.40.40.064.(2)由柱状图可知,一个一级过滤器需要更换的滤芯个数为10,11,12,对应的概率分别为0.2,0.4,0.4,由题意,X可能的取值为20,2
44、1,22,23,24,并且P(X20)0.20.20.04,P(X21)0.20.420.16,P(X22)0.40.40.20.420.32,P(X23)0.40.420.32,P(X24)0.40.40.16.所以X的分布列为X2021222324P0.040.160.320.320.16E(X)200.04210.16220.32230.32240.1622.4.(3)因为mn28,n5,6,所以若m22,n6,则该客户在十年使用期内购买各级滤芯所需总费用的期望值为22802000.324000.1661602 848.若m23,n5,则该客户在十年使用期内购买各级滤芯所需总费用的期望值
45、为23802000.1651604000.42 832.故m,n的值分别为23,5.4某基地蔬菜大棚采用无土栽培方式种植各类蔬菜根据过去50周的资料显示,该地周光照量X(单位:小时)都在30小时以上,其中不足50小时的有5周,不低于50小时且不超过70小时的有35周,超过70小时的有10周根据统计,该基地的西红柿增加量y(千克)与使用某种液体肥料的质量x(千克)之间的关系为如图所示的折线图(1)依据折线图,是否可用线性回归模型拟合y与x的关系?请计算相关系数r并加以说明(精确到0.01);(若|r|0.75,则线性相关程度很高,可用线性回归模型拟合)(2)蔬菜大棚对光照要求较大,某光照控制仪商
46、家为该基地提供了部分光照控制仪,但每周光照控制仪运行台数受周光照量X限制,并有如下关系:周光照量X(单位:小时)30X70光照控制仪运行台数321若某台光照控制仪运行,则该台光照控制仪周利润为3 000元;若某台光照控制仪未运行,则该台光照控制仪周亏损1 000元以频率作为概率,商家欲使周总利润的均值达到最大,应安装光照控制仪多少台?附相关系数公式:r,参考数据:0.55,0.95.解:(1)由已知数据可得x5,y4.因为(xix)(yiy)(3)(1)000316,2,所以相关系数r0.95.因为|r|0.75,所以可用线性回归模型拟合y与x的关系(2)记商家周总利润为Y元,由条件可知至少需
47、安装1台,最多安装3台光照控制仪安装1台光照控制仪可获得周总利润3 000元安装2台光照控制仪的情形:当X70时,只有1台光照控制仪运行,此时周总利润Y3 0001 0002 000(元),P(Y2 000)0.2,当3070时,只有1台光照控制仪运行,此时周总利润Y13 00021 0001 000(元)P(Y1 000)0.2.当50X70时,有2台光照控制仪运行,此时周总利润Y23 00011 0005 000(元),P(Y5 000)0.7,当30X50时,3台光照控制仪都运行,周总利润Y33 0009 000(元),P(Y9 000) 0.1,故Y的分布列为Y1 0005 0009 000P0.20.70.1所以E(Y)1 0000.25 0000.79 0000.14 600(元)综上可知,为使商家周总利润的均值达到最大,应该安装2台光照控制仪