1、2023届高考数学一轮复习单元双优测评卷第八章 成对数据的统计解析一、选择题:本题共8小题,每小题5分,共40分在每小题给出的四个选项中,只有一项是符合题目要求的1已知某种商品的广告费支出(单位:万元)与销售额(单位:万元)之间有如下对应数据:245683040506070根据上表可得回归方程为,计算得,则当投入10万元广告费时,销售额的预报值为( )A75万元B85万元C95万元D105万元2某种兼职工作虽然以计件的方式计算工资,但是对于同一个人的工资与其工作时间还是存在一定的相关关系,已知小孙的工作时间(单位:小时)与工资(单位:元)之间的关系如下表:若与的线性回归方程为,预测当工作时间为
2、小时时,工资大约为( )A元B元C元D元3为了研究某班男生的体重与身高的关系,随机调查了该班部分男生的体重与身高数据,根据散点图可以看出与线性相关.当体重单位为“”,身高单位为“”时,得到的回归方程为,当体重单位为“”,身高单位为“”时,得到的回归方程为.则( )A,B,C,D,4党的十九大报告中指出:从2020年到2035年,在全面建成小康社会的基础上,再奋斗15年,基本实现社会主义现代化.若到2035年底我国人口数量增长至14.4亿,由2013年到2019年的统计数据可得国内生产总值()(单位:万亿元)关于年份代号的回归方程为,由回归方程预测我国在2035年底人均国内生产总值(单位:万元)
3、约为( )A14.04B202.16C13.58D14.505下列说法错误的是( )A用相关指数来刻画回归效果,越小说明拟合效果越好B已知随机变量,若,则C某人每次投篮的命中率为,现投篮5次,设投中次数为随机变量则D对于独立性检验,随机变量的观测值值越小,判定“两分类变量有关系”犯错误的概率越大6某产品的广告费用与销售额的统计数据如下表:广告费用(万元)23456销售额(万元)1925343844根据上表可得回归直线方程为,下列说法正确的是( )A回归直线 必经过样本点、B这组数据的样本中心点未必在回归直线上C回归系数6.3的含义是广告费用每增加1万元,销售额实际增加6.3万元D据此模型预报广
4、告费用为7万元时销售额为50.9万元7我国目前部分普通高中学生在高一升高二时面临着选文理科的问题,某学校抽取了部分男、女学生意愿的一份样本,制作出如下两个等高堆积条形图根据这两幅图中的信息,下列统计结论正确的是( )A样本中的男生数量多于女生数量B样本中有理科意愿的学生数量少于有文科意愿的学生数量C对理科有意愿的男生人数多于对文科有意愿的男生人数D对文科有意愿的女生人数多于对理科有意愿的女生人数8下列说法:分类变量与的随机变量越大,说明“与有关系”的可信度越大,以模型去拟合一组数据时,为了求出回归方程,设,将其变换后得到线性方程,则的值分别是和0.3,根据具有线性相关关系的两个变量的统计数据所
5、得的回归直线方程为中,则,若变量和满足关系,且变量与正相关,则与也正相关,正确的个数是( )A1B2C3D4二、选择题:本题共4小题,每小题5分,共20分在每小题给出的选项中,有多项符合题目要求全部选对的得5分,部分选对的得2分,有选错的得0分9习近平总书记指出:扶贫必扶智,扶智就是扶知识、扶技术、扶方法某地响应总书记号召,建立农业科技图书馆,供农民免费借阅,收集了近5年的借阅数据如下表:年份20162017201820192020年份代码12345年借阅量(万册)4.95.15.55.75.8根据上表,可得关于的经验回归方程为,则( )AB近5年借阅量估计以0.24万册/年的速度增长C与的线
6、性相关系数D2021年的借阅量一定不少于6.12万册105G技术的运营不仅提高了网络传输速度,更拓宽了网络资源的服务范围.目前,我国加速了5G技术的融合与创新,前景美好!某手机商城统计了5个月的5G手机销量,如表所示:月份2020年6月2020年7月2020年8月2020年9月2020年10月月份编号12345销量部5295185227若与线性相关,由上表数据求得线性回归方程为,则下列说法正确的是( )A5G手机的销量逐月增加,平均每个月增加约10台BC与正相关D预计12月份该手机商城的5G手机销量约为318部11某城市为吸引和留住人才,推出“共有产权房”政策,由政府出资30%(14级人才)或
7、20%(57级人才)垫付首付,支持高层次人才到本区购房落户.以下是某小区5套共有产权房成交价格y(单位:万元)与住房面积x(单位:m2)之间的统计数据(成交价格受面积、楼层、位置等因素影响) 面积x/m28095105110125价格y/万元120142161171186若y与x之间具有线性相关关系,根据表中数据可求得y关于x的回归方程为,则下列说法正确的是( )AB变量x与y具有负相关关系C当住房面积增加1m2时,其价格增加约0.98万元D根据回归方程估计,若住房面积为150m2,则成交价格约为202万元12已知由样本数据点集合求得的线性回归方程为,.现发现两个数据点和的误差较大,去除这两个
8、数据点后重新求得的回归直线l的斜率为1.2,则下列说法中正确的有( )A去除这两个数据点前,当变量x每增加1个单位长度时,变量y减少1.5个单位长度B去除这两个数据点后的回归直线过点C去除这两个数据点后y的估计值的增长速度变慢D去除这两个数据点后,当时,y的估计值为6.2三、填空题:本题共4小题,每小题5分,共20分13人均可支配收入是反映一个地区居民收入水平和城市经济发展水平的重要指标,并且对人均消费水平有重大影响.如图是根据国家统计局发布的年上半年居民收入和消费支出情况绘制的,是我国个省(区市)年上半年人均可支配收入(单位:元)与人均消费支出(单位:元)的散点图.用线性回归模型拟合人均消费
9、支出与人均可支配收入的关系,规定半年人均盈余(人均可支配收入人均消费支出)不低于元的省(区市)达到阶段小康的标准,根据线性回归方程(回归方程的斜率精确到),估计达到阶段小康标准的省(区市)的半年人均可支配收入至少为_元.参考公式与参考数据:,14已知具有相关关系的两个随机变量的一组数据的散点图如图所示,可以用来拟合,设,将其变换后得到线性回归方程,若,则_152021年受疫情影响,国家鼓励员工在工作地过年.某机构统计了某市5个地区的外来务工人员数与他们选择留在当地过年的人数占比,得到如下的表格:A区B区C区D区E区外来务工人员数50004000350030002500留在当地的人数占比80%9
10、0%80%80%84%根据这5个地区的数据求得留在当地过年人员数y与外来务工人员数x的线性回归方程为.该市对外来务工人员选择留在当地过年的每人补贴1000元,该市F区有10000名外来务工人员,根据线性回归方程估计F区需要给外来务工人员中留在当地过年的人员的补贴总额为_万元.(参考数据:取)16下列说法:线性回归方程必过;命题“”的否定是“” 相关系数越小,表明两个变量相关性越弱;在一个列联表中,由计算得,则有的把握认为这两个变量间有关系;其中正确的说法是_(把你认为正确的结论都写在横线上)本题可参考独立性检验临界值表:四、解答题:本题共6小题,共70分解答应写出文字说明、证明过程或演算步骤1
11、7已知火龙果的甜度一般在1120度之间,现某火龙果种植基地对在新、旧施肥方法下种植的火龙果的甜度作对比,从新、旧施肥方法下种植的火龙果中各随机抽取了100个火龙果,根据水果甜度(单位:度)进行分组,若按,分组,旧施肥方法下的火龙果的甜度的频率分布直方图与新施肥方法下的火龙果的甜度的频数分布表如下所示,若规定甜度不低于15度为“超甜果”,其他为“非超甜果”甜度频数581210161418125新施肥方法下的火龙果的甜度的频数分布表(1)设两种施肥方法下的火龙果的甜度相互独立,记表示事件:“旧施肥方法下的火龙果的甜度低于15度,新施肥方法下的火龙果的甜度不低于15度”,以样本估计总体,求事件的概率
12、(2)根据上述样本数据,列出列联表,并判断是否有99.5%的把握认为是否为“超甜果”与施肥方法有关?(3)以样本估计总体,若从旧施肥方法下的100个火龙果中按“超甜果”与“非超甜果”的标准划分,采用分层抽样的方法抽取5个,再从这5个火龙果中随机抽取2个,设“超甜果”的个数为,求随机变量的分布列及数学期望附:0.0250.0100.0055.0246.6357.879,其中18某工厂在疫情形势好转的情况下,复工后的前5个月的利润情况如下表所示:第1个月第2个月第3个月第4个月第5个月利润(单位:万元)111275180设第i个月的利润为y万元(1)根据表中数据,求y关于i的方程(,的值要求保留小
13、数点后四位有效数字);(2)根据已知数据求得回归方程后,为验证该方程的可靠性,可用一个新数据加以验证,方法如下:先计算新数据对应的残差,再计算,若,则说明该方程是可靠的,否则说明不可靠现已知该厂第6个月的利润为120万元,是判断(1)中求得的回归方程是否可靠,说明你的理由参考数据:,取附:回归直线的斜率和截距的最小二乘估计分别为,19推进垃圾分类处理,是落实绿色发展理念的必然选择为加强社区居民的垃圾分类意识,某社区在健身广场举办了“垃圾分类,从我做起”生活垃圾分类大型宣传活动,号召社区居民用实际行动为建设绿色家园贡献一份力量,为此需要征集一部分垃圾分类志愿者(1)为调查社区居民喜欢担任垃圾分类
14、志愿者是否与性别有关,现随机选取了一部分社区居民进行调查,其中被调查的男性居民30人,女性居民20人,男性居民中不喜欢担任垃圾分类志愿者占男性居民的,女性居民中不喜欢担任垃圾分类志愿者占女性居民的,判断能否在犯错误概率不超过0.5%的前提下,认为居民喜欢担任垃圾分类志愿者与性别有关?附:,0.1000.0500.0100.0050.0012.7063.8416.6357.87910.828(2)某垃圾站的日垃圾分拣量y(千克)与垃圾分类志愿者人数x(人)满足回归直线方程,数据统计如表:志愿者人数x(人)23456日垃圾分拣量y(千克)24294146t已知,根据所给数据求t,预测志愿者人数为1
15、0人时,该垃圾站的日垃圾分拣量附:,202021年6月17日9时22分,我国酒泉卫星发射中心用长征遥十二运载火箭,成功将神舟十二号载人飞船送入预定轨道,顺利将聂海胜、刘伯明、汤洪波3名航天员送入太空,发射取得圆满成功,这标志着中国人首次进入自己的空间站某公司负责生产的A型材料是神舟十二号的重要零件,该材料应用前景十分广泛该公司为了将A型材料更好地投入商用,拟对A型材料进行应用改造、根据市场调研与模拟,得到应用改造投入x(亿元)与产品的直接收益y(亿元)的数据统计如下:序号123456789101112x2346810132122232425y1522274048546068.56867.566
16、65当时,建立了y与x的两个回归模型:模型:,模型:;当时,确定y与x满足的线性回归方程为(1)根据下列表格中的数据,比较当时模型,的相关指数的大小,并选择拟合精度更高、更可靠的模型,预测对A型材料进行应用改造的投入为17亿元时的直接收益;回归模型模型模型回归方程79.1320.2(2)为鼓励科技创新,当应用改造的投入不少于20亿元时,国家给予公司补贴5亿元,以回归方程为预测依据,根据(1)中选择的拟合精度更高更可靠的模型,比较投入17亿元与20亿元时公司收益(直接收益+国家补贴)的大小附:刻画回归效果的相关指数,且当越大时,回归方程的拟合效果越好用最小二乘法求线性回归方程的截距:21某校随机
17、抽出30名女教师和20名男教师参加学校组织的“纪念中国人民抗日战争暨世界反法西斯战争胜利76周年”知识竞赛(满分100分),成绩统计如表:女教师成绩分布表成绩分组频数523m8男教师成绩分布表成绩分组频数1310n2(1)试估计所有教师成绩的平均分(同一组中的数据用该组区间的中点值作代表);(2)若分数为80分及以上为优秀,低于80分为非优秀,请完成下面列联表,并判断是否有99%的把握认为这次竞赛成绩优秀与性别有关女教师男教师总计优秀非优秀总计附,其中0.0500.0100.0013.8416.63510.82822随着我国经济的发展,人们生活水平的提高,汽车的保有量越来越高汽车保险费是人们非
18、常关心的话题保险公司规定:上一年的出险次数决定了下一年的保费倍率,具体关系如下表:上一年的出险次数次以上(含次)下一年的保费倍率连续两年没有出险打折,连续三年没有出险打折经验表明新车商业车险保费与购车价格有较强的线性相关关系,下面是随机采集的组数据(其中(万元)表示购车价格,(元)表示商业车险保费):,设由这组数据得到的回归直线方程为(1)求的值(2)某车主蔡先生购买一辆价值万元的新车估计该车主蔡先生购车时的商业车险保费若该车今年保险期间内已出过一次险,现在又被刮花了,蔡先生到店询价,预计修车费用为元,保险专员建议蔡先生自费(即不出险),你认为蔡先生是否应该接受建议?并说明理由(假设该车辆下一
19、年与上一年购买相同的商业车险产品进行续保)一、选择题:本题共8小题,每小题5分,共40分在每小题给出的四个选项中,只有一项是符合题目要求的1已知某种商品的广告费支出(单位:万元)与销售额(单位:万元)之间有如下对应数据:245683040506070根据上表可得回归方程为,计算得,则当投入10万元广告费时,销售额的预报值为( )A75万元B85万元C95万元D105万元【答案】B【解析】解:由题意得,样本中心为,回归直线过样本中心,解得:,回归直线方程为,当时,故当投入10万元广告费时,销售额的预报值为85万元故选:B2某种兼职工作虽然以计件的方式计算工资,但是对于同一个人的工资与其工作时间还
20、是存在一定的相关关系,已知小孙的工作时间(单位:小时)与工资(单位:元)之间的关系如下表:若与的线性回归方程为,预测当工作时间为小时时,工资大约为( )A元B元C元D元【答案】B【解析】由表格数据知:,线性回归方程为,即当工作时间为小时时,工资大约为元.故选:B.3为了研究某班男生的体重与身高的关系,随机调查了该班部分男生的体重与身高数据,根据散点图可以看出与线性相关.当体重单位为“”,身高单位为“”时,得到的回归方程为,当体重单位为“”,身高单位为“”时,得到的回归方程为.则( )A,B,C,D,【答案】B【解析】解:根据题意可知,当体重单位为“”,身高单位为“”变为体重单位为“”,身高单位
21、为“”时,回归方程为变为,所以,.故选:B.4党的十九大报告中指出:从2020年到2035年,在全面建成小康社会的基础上,再奋斗15年,基本实现社会主义现代化.若到2035年底我国人口数量增长至14.4亿,由2013年到2019年的统计数据可得国内生产总值()(单位:万亿元)关于年份代号的回归方程为,由回归方程预测我国在2035年底人均国内生产总值(单位:万元)约为( )A14.04B202.16C13.58D14.50【答案】A【解析】根据题意可得2035年底对应的,将代入可得:万亿元,所以我国在2035年底人均国内生产总值约为万元,故选:A.5下列说法错误的是( )A用相关指数来刻画回归效
22、果,越小说明拟合效果越好B已知随机变量,若,则C某人每次投篮的命中率为,现投篮5次,设投中次数为随机变量则D对于独立性检验,随机变量的观测值值越小,判定“两分类变量有关系”犯错误的概率越大【答案】A【解析】对于A选项,相关指数越大,说明残差平方和越小,则模型拟合效果越好,故A错;对于B选项,正态分布图像关于对称,因为概率为,所以概率为,故的概率为,故B正确;对于C选项,服从二项分布,因此,则,故C正确;对于D选项,对于分类变量进行独立性检验时,随机变量的观测值越小,则分类变量间越有关系的可信度越小,故判定两分类变量约有关系发错误的概率越大,故D正确故选:A6某产品的广告费用与销售额的统计数据如
23、下表:广告费用(万元)23456销售额(万元)1925343844根据上表可得回归直线方程为,下列说法正确的是( )A回归直线 必经过样本点、B这组数据的样本中心点未必在回归直线上C回归系数6.3的含义是广告费用每增加1万元,销售额实际增加6.3万元D据此模型预报广告费用为7万元时销售额为50.9万元【答案】D【解析】回归直线 ,不一定经过任何一个样本点,故 A错;由最小二乘法可知,这组数据的样本中心点一定在回归直线上,故B错;回归系数6.3的含义是广告费用每增加1万元,预测销售额增加6.3万元,故C错;,将代入可得,则回归方程为,时,故D正确.故选:D.7我国目前部分普通高中学生在高一升高二
24、时面临着选文理科的问题,某学校抽取了部分男、女学生意愿的一份样本,制作出如下两个等高堆积条形图根据这两幅图中的信息,下列统计结论正确的是( )A样本中的男生数量多于女生数量B样本中有理科意愿的学生数量少于有文科意愿的学生数量C对理科有意愿的男生人数多于对文科有意愿的男生人数D对文科有意愿的女生人数多于对理科有意愿的女生人数【答案】C【解析】由等高堆积条形图1可知,不管是文科还是理科,女生占比均高于男生,故样本中的女生数量多于男生数量,A错误;从图2可以看出男生和女生中选择理科的人数均高于选择文科的人数,故选:C8下列说法:分类变量与的随机变量越大,说明“与有关系”的可信度越大,以模型去拟合一组
25、数据时,为了求出回归方程,设,将其变换后得到线性方程,则的值分别是和0.3,根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为中,则,若变量和满足关系,且变量与正相关,则与也正相关,正确的个数是( )A1B2C3D4【答案】C【解析】根据独立性检验的原理,分类变量与的随机变量越大,说明“与有关系”的可信度越大,正确;由,得,所以,所以,正确;根据回归直线过样本点中心,即,解得,所以正确;根据回归方程可得变量与负相关,而变量与正相关,则与负相关,错误;综上可知正确命题的个数是3 ,故选:C.二、选择题:本题共4小题,每小题5分,共20分在每小题给出的选项中,有多项符合题目要求全部选对的
26、得5分,部分选对的得2分,有选错的得0分9习近平总书记指出:扶贫必扶智,扶智就是扶知识、扶技术、扶方法某地响应总书记号召,建立农业科技图书馆,供农民免费借阅,收集了近5年的借阅数据如下表:年份20162017201820192020年份代码12345年借阅量(万册)4.95.15.55.75.8根据上表,可得关于的经验回归方程为,则( )AB近5年借阅量估计以0.24万册/年的速度增长C与的线性相关系数D2021年的借阅量一定不少于6.12万册【答案】ABC【解析】把代入,可得,所以A正确;,所以直线的斜率为,4万册是每年的借阅量的增长量的预测值,所以B正确;因为,所以与正相关,所以,所以C正
27、确;把代入得,然而6.12万册是预测值,不是精确值,所以D错误故选:ABC105G技术的运营不仅提高了网络传输速度,更拓宽了网络资源的服务范围.目前,我国加速了5G技术的融合与创新,前景美好!某手机商城统计了5个月的5G手机销量,如表所示:月份2020年6月2020年7月2020年8月2020年9月2020年10月月份编号12345销量部5295185227若与线性相关,由上表数据求得线性回归方程为,则下列说法正确的是( )A5G手机的销量逐月增加,平均每个月增加约10台BC与正相关D预计12月份该手机商城的5G手机销量约为318部【答案】CD【解析】线性回归方程为,5G手机的销量逐月增加,平
28、均每个月增加约44台,所以A不正确;根据表中数据,可得,.于是,即,故B不正确;由回归方程中的系数大于0,可知与正相关,且相关系数,故C正确;12月份时,部,故D正确.故选:CD11某城市为吸引和留住人才,推出“共有产权房”政策,由政府出资30%(14级人才)或20%(57级人才)垫付首付,支持高层次人才到本区购房落户.以下是某小区5套共有产权房成交价格y(单位:万元)与住房面积x(单位:m2)之间的统计数据(成交价格受面积、楼层、位置等因素影响) 面积x/m28095105110125价格y/万元120142161171186若y与x之间具有线性相关关系,根据表中数据可求得y关于x的回归方程
29、为,则下列说法正确的是( )AB变量x与y具有负相关关系C当住房面积增加1m2时,其价格增加约0.98万元D根据回归方程估计,若住房面积为150m2,则成交价格约为202万元【答案】CD【解析】根据表中数据可求得 将点代入回归方程解得,故A错;由回归方程为,可知变量x与y具有正相关关系,故B错;因为,故增加1时,就增加,故C正确;将代入方程求得,故D正确故选:CD12已知由样本数据点集合求得的线性回归方程为,.现发现两个数据点和的误差较大,去除这两个数据点后重新求得的回归直线l的斜率为1.2,则下列说法中正确的有( )A去除这两个数据点前,当变量x每增加1个单位长度时,变量y减少1.5个单位长
30、度B去除这两个数据点后的回归直线过点C去除这两个数据点后y的估计值的增长速度变慢D去除这两个数据点后,当时,y的估计值为6.2【答案】BCD【解析】解:去掉两个数据点和之前,所以x每增加1个单位,y约增加1.5个单位,故选项A错误;去掉两个数据点和之前,回方程过,则,而去掉的2个点,所以去掉后的,没有变化,故去除这两个数据点后的回归直线过点,故选项B正确;去掉两个数据点后,回归方程的斜率由1.5变为1.2,故去除这两个数据点后y的估计值的增长速度变慢,故选项C正确;去掉两个数据点后,得到样本的中心为,则有,解得,故回归方程变为,当时,故选项D正确.故选:BCD.三、填空题:本题共4小题,每小题
31、5分,共20分13人均可支配收入是反映一个地区居民收入水平和城市经济发展水平的重要指标,并且对人均消费水平有重大影响.如图是根据国家统计局发布的年上半年居民收入和消费支出情况绘制的,是我国个省(区市)年上半年人均可支配收入(单位:元)与人均消费支出(单位:元)的散点图.用线性回归模型拟合人均消费支出与人均可支配收入的关系,规定半年人均盈余(人均可支配收入人均消费支出)不低于元的省(区市)达到阶段小康的标准,根据线性回归方程(回归方程的斜率精确到),估计达到阶段小康标准的省(区市)的半年人均可支配收入至少为_元.参考公式与参考数据:,【答案】【解析】,所以.半年人均盈余为,令,得,故估计达到阶段
32、小康标准的省(区市)的半年人均可支配收入至少为元.故答案为:14已知具有相关关系的两个随机变量的一组数据的散点图如图所示,可以用来拟合,设,将其变换后得到线性回归方程,若,则_【答案】【解析】,因为变换后得到线性回归方程,所以有,又,所以,因此,故答案为:152021年受疫情影响,国家鼓励员工在工作地过年.某机构统计了某市5个地区的外来务工人员数与他们选择留在当地过年的人数占比,得到如下的表格:A区B区C区D区E区外来务工人员数50004000350030002500留在当地的人数占比80%90%80%80%84%根据这5个地区的数据求得留在当地过年人员数y与外来务工人员数x的线性回归方程为.
33、该市对外来务工人员选择留在当地过年的每人补贴1000元,该市F区有10000名外来务工人员,根据线性回归方程估计F区需要给外来务工人员中留在当地过年的人员的补贴总额为_万元.(参考数据:取)【答案】【解析】由已知,所以,则,即,时,估计应补贴(万元)故答案为:16下列说法:线性回归方程必过;命题“”的否定是“” 相关系数越小,表明两个变量相关性越弱;在一个列联表中,由计算得,则有的把握认为这两个变量间有关系;其中正确的说法是_(把你认为正确的结论都写在横线上)本题可参考独立性检验临界值表:【答案】【解析】解析:根据性回归方程,独立性检验,相关关系,以及命题的否定等知识,选出正确的,得到结果解析
34、:线性回归方程必过样本中心点,故正确命题“”的否定是“” 故错误相关系数r绝对值越小,表明两个变量相关性越弱,故不正确;在一个列联表中,由计算得,则有的把握认为这两个变量间有关系,正确.故答案为.四、解答题:本题共6小题,共70分解答应写出文字说明、证明过程或演算步骤17已知火龙果的甜度一般在1120度之间,现某火龙果种植基地对在新、旧施肥方法下种植的火龙果的甜度作对比,从新、旧施肥方法下种植的火龙果中各随机抽取了100个火龙果,根据水果甜度(单位:度)进行分组,若按,分组,旧施肥方法下的火龙果的甜度的频率分布直方图与新施肥方法下的火龙果的甜度的频数分布表如下所示,若规定甜度不低于15度为“超
35、甜果”,其他为“非超甜果”甜度频数581210161418125新施肥方法下的火龙果的甜度的频数分布表(1)设两种施肥方法下的火龙果的甜度相互独立,记表示事件:“旧施肥方法下的火龙果的甜度低于15度,新施肥方法下的火龙果的甜度不低于15度”,以样本估计总体,求事件的概率(2)根据上述样本数据,列出列联表,并判断是否有99.5%的把握认为是否为“超甜果”与施肥方法有关?(3)以样本估计总体,若从旧施肥方法下的100个火龙果中按“超甜果”与“非超甜果”的标准划分,采用分层抽样的方法抽取5个,再从这5个火龙果中随机抽取2个,设“超甜果”的个数为,求随机变量的分布列及数学期望附:0.0250.0100
36、.0055.0246.6357.879,其中【答案】(1)(2)列联表见解析;有99.5%的把握认为是否为“超甜果”与施肥方法有关(3)分布列见解析;期望为【解析】(1)首先根据频率分布表,计算新,旧方法下的火龙果的甜度不低于15度的频率,再利用独立事件概率求;(2)由题意可得列联表,求计算,再根据临界值,即可判断;(3)由题意可得随机变量的所有可能取值为0,1,2,再利用超几何概率分布,求分布列和数学期望.(1)记表示事件:“旧施肥方法下的火龙果的甜度低于15度”,表示事件:“新施肥方法下的火龙果的甜度不低于15度”,则有由频率分布直方图可知旧施肥方法下的火龙果的甜度低于15度的频率为由频数
37、分布表可知新施肥方法下的火龙果的甜度不低于15度的频率为故事件的概率为(2)依题意可得到列联表非超甜果超甜果合计旧施肥方法6040100新施肥方法3565100合计95105200,故有99.5%的把握认为是否为“超甜果”与施肥方法有关(3)旧施肥方法下的100个火龙果中,“非超甜果”为60个,“超甜果”为40个,按分层抽样的方法随机抽取5个,则抽取的“非超甜果”为3个,“超甜果”为2个,所以随机变量的所有可能取值为0,1,2,随机变量的分布列为012数学期望18某工厂在疫情形势好转的情况下,复工后的前5个月的利润情况如下表所示:第1个月第2个月第3个月第4个月第5个月利润(单位:万元)111
38、275180设第i个月的利润为y万元(1)根据表中数据,求y关于i的方程(,的值要求保留小数点后四位有效数字);(2)根据已知数据求得回归方程后,为验证该方程的可靠性,可用一个新数据加以验证,方法如下:先计算新数据对应的残差,再计算,若,则说明该方程是可靠的,否则说明不可靠现已知该厂第6个月的利润为120万元,是判断(1)中求得的回归方程是否可靠,说明你的理由参考数据:,取附:回归直线的斜率和截距的最小二乘估计分别为,【答案】(1)(2)可靠(1)解:设,则,则,所以,故关于的回归方程为.(2)解:由(1)知,当时,因为,所以(1)中求得的回归方程可靠.19推进垃圾分类处理,是落实绿色发展理念
39、的必然选择为加强社区居民的垃圾分类意识,某社区在健身广场举办了“垃圾分类,从我做起”生活垃圾分类大型宣传活动,号召社区居民用实际行动为建设绿色家园贡献一份力量,为此需要征集一部分垃圾分类志愿者(1)为调查社区居民喜欢担任垃圾分类志愿者是否与性别有关,现随机选取了一部分社区居民进行调查,其中被调查的男性居民30人,女性居民20人,男性居民中不喜欢担任垃圾分类志愿者占男性居民的,女性居民中不喜欢担任垃圾分类志愿者占女性居民的,判断能否在犯错误概率不超过0.5%的前提下,认为居民喜欢担任垃圾分类志愿者与性别有关?附:,0.1000.0500.0100.0050.0012.7063.8416.6357
40、.87910.828(2)某垃圾站的日垃圾分拣量y(千克)与垃圾分类志愿者人数x(人)满足回归直线方程,数据统计如表:志愿者人数x(人)23456日垃圾分拣量y(千克)24294146t已知,根据所给数据求t,预测志愿者人数为10人时,该垃圾站的日垃圾分拣量附:,【答案】(1)能(2),93.4千克【解析】(1)根据题意,列出22列联表,再根据公式计算,对照临界表中的数据,比较即可得到答案;(2)由表中数据和题中所给数据,可求出的值,再根据参考公式求得线性回归系数和,可得回归直线方程为,再将代入,即可求出结果(1)解:根据题意,列出的22列联表如下:喜欢担任垃圾分类志愿者不喜欢担任垃圾分类志愿
41、者合计男性居民102030女性居民15520合计252550,所以,能在犯错误概率不超过0.5%的前提下,认为居民喜欢担任垃圾分类志愿者与性别有关(2)解:由表中数据可知,回归直线方程为当时,所以当志愿者为10人时,垃圾分拣量大约为93.4千克.202021年6月17日9时22分,我国酒泉卫星发射中心用长征遥十二运载火箭,成功将神舟十二号载人飞船送入预定轨道,顺利将聂海胜、刘伯明、汤洪波3名航天员送入太空,发射取得圆满成功,这标志着中国人首次进入自己的空间站某公司负责生产的A型材料是神舟十二号的重要零件,该材料应用前景十分广泛该公司为了将A型材料更好地投入商用,拟对A型材料进行应用改造、根据市
42、场调研与模拟,得到应用改造投入x(亿元)与产品的直接收益y(亿元)的数据统计如下:序号123456789101112x2346810132122232425y1522274048546068.56867.56665当时,建立了y与x的两个回归模型:模型:,模型:;当时,确定y与x满足的线性回归方程为(1)根据下列表格中的数据,比较当时模型,的相关指数的大小,并选择拟合精度更高、更可靠的模型,预测对A型材料进行应用改造的投入为17亿元时的直接收益;回归模型模型模型回归方程79.1320.2(2)为鼓励科技创新,当应用改造的投入不少于20亿元时,国家给予公司补贴5亿元,以回归方程为预测依据,根据(
43、1)中选择的拟合精度更高更可靠的模型,比较投入17亿元与20亿元时公司收益(直接收益+国家补贴)的大小附:刻画回归效果的相关指数,且当越大时,回归方程的拟合效果越好用最小二乘法求线性回归方程的截距:【答案】(1)模型拟合精度更高、更可靠,亿;(2)投入17亿元比投入20亿元时收益小.【解析】(1)对于模型,对应的,故对应的,故对应的相关指数,对于模型,同理对应的相关指数,故模型拟合精度更高、更可靠.故对A型材料进行应用改造的投入为17亿元时的直接收益为.(2)当时,后五组的,由最小二乘法可得,故当投入20亿元时公司收益(直接收益+国家补贴)的大小为:,故投入17亿元比投入20亿元时收益小.21
44、某校随机抽出30名女教师和20名男教师参加学校组织的“纪念中国人民抗日战争暨世界反法西斯战争胜利76周年”知识竞赛(满分100分),成绩统计如表:女教师成绩分布表成绩分组频数523m8男教师成绩分布表成绩分组频数1310n2(1)试估计所有教师成绩的平均分(同一组中的数据用该组区间的中点值作代表);(2)若分数为80分及以上为优秀,低于80分为非优秀,请完成下面列联表,并判断是否有99%的把握认为这次竞赛成绩优秀与性别有关女教师男教师总计优秀非优秀总计附,其中0.0500.0100.0013.8416.63510.828【答案】(1)78.8(分);(2)列联表见解析,没有99%的把握认为这次
45、竞赛成绩优秀与性别有关【解析】(1)由题意,得,设所有教师成绩的平均分为,则(分)(2)列联表如下:女教师男教师总计优秀20626非优秀101424总计302050,没有99%的把握认为这次竞赛成绩优秀与性别有关22随着我国经济的发展,人们生活水平的提高,汽车的保有量越来越高汽车保险费是人们非常关心的话题保险公司规定:上一年的出险次数决定了下一年的保费倍率,具体关系如下表:上一年的出险次数次以上(含次)下一年的保费倍率连续两年没有出险打折,连续三年没有出险打折经验表明新车商业车险保费与购车价格有较强的线性相关关系,下面是随机采集的组数据(其中(万元)表示购车价格,(元)表示商业车险保费):,设由这组数据得到的回归直线方程为(1)求的值(2)某车主蔡先生购买一辆价值万元的新车估计该车主蔡先生购车时的商业车险保费若该车今年保险期间内已出过一次险,现在又被刮花了,蔡先生到店询价,预计修车费用为元,保险专员建议蔡先生自费(即不出险),你认为蔡先生是否应该接受建议?并说明理由(假设该车辆下一年与上一年购买相同的商业车险产品进行续保)【答案】(1);(2)3411(元);应该接受建议;理由见解析【解析】(1)(万元)(元),回归直线经过样本点的中心,即,所以(2)价值为万元的新车的商业车险保费预报值为(元)由于该车已出过一次险,若再出一次险,则保费增加,即增加(元)因为,所以应该接受建议