1、考点测试56变量间的相关关系与统计案例高考概览高考在本考点的常考题型为选择题、填空题与解答题,分值为5分,12分,中、低等难度考纲研读1会作两个相关变量的数据的散点图,会利用散点图认识变量间的相关关系2了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程3了解独立性检验的基本思想、方法及其简单应用4了解回归分析的基本思想、方法及其简单应用一、基础小题1已知回归直线的斜率的估计值是1.23,样本点的中心为(4,5),则回归直线的方程是()A1.23x4 B1.23x5C1.23x0.08 D0.08x1.23答案C解析选项D显然错误因为回归方程必过样本中心点,把点(4,5)代入
2、选项A,B,C检验,满足的只有选项C故选C2某公司一种型号的产品近期销售情况如下表:月份(x)23456销售额y/万元15.116.317.017.218.4根据上表可得到回归直线方程0.75x,据此估计,该公司7月份这种型号产品的销售额约为()A19.5万元 B19.25万元C19.15万元 D19.05万元答案D解析由表可知(23456)4,(15.116.31717.218.4)16.8,则样本中心点(4,16.8)在线性回归直线上,故16.80.754,得13.8.故当x7时,0.75713.819.05.故选D3为了解户籍、性别对生育二胎选择倾向的影响,某地从育龄人群中随机抽取了容量
3、为200的调查样本,其中城镇户籍与农村户籍各100人;男性120人,女性80人,绘制不同群体中倾向选择生育二胎与倾向选择不生育二胎的人数比例图(如图所示),其中阴影部分表示倾向选择生育二胎的对应比例,则下列叙述中错误的是()A是否倾向选择生育二胎与户籍有关B是否倾向选择生育二胎与性别有关C倾向选择生育二胎的人群中,男性人数与女性人数相同D倾向选择不生育二胎的人群中,农村户籍人数少于城镇户籍人数答案C解析由比例图可知,是否倾向选择生育二胎与户籍、性别有关,倾向选择不生育二胎的人群中,农村户籍人数为0.210020,城镇户籍人数为0.610060,农村户籍人数少于城镇户籍人数,倾向选择生育二胎的人
4、群中,男性人数为0.812096人,女性人数为0.68048人,男性人数与女性人数不相同,故C错误,故选C4在一组样本数据(x1,y1),(x2,y2),(xn,yn)(n2,x1,x2,xn不全相等)的散点图中,若所有样本点(xi,yi)(i1,2,n)都在直线yx1上,则这组样本数据的样本相关系数为()A1 B0 C D1答案D解析由题设,知这组样本数据完全正相关,故其相关系数为1.故选D5甲、乙、丙、丁四位同学各自对A,B两变量的线性相关性做试验,并用回归分析方法分别求得相关系数r与残差平方和m,如下表:甲乙丙丁r0.820.780.690.85m106115124103则试验结果体现A
5、,B两变量有更强的线性相关性的是()A甲 B乙 C丙 D丁答案D解析r越大,m越小,线性相关性越强,丁同学的试验结果体现A,B两变量有更强的线性相关性故选D6在研究吸烟与患肺癌的关系中,通过收集数据、整理分析数据得“吸烟与患肺癌有关”的结论,并且有99%以上的把握认为这个结论是成立的,则下列说法中正确的是()A100个吸烟者中至少有99人患肺癌B1个人吸烟,那么这人有99%的概率患有肺癌C在100个吸烟者中一定有患肺癌的人D在100个吸烟者中可能一个患肺癌的人也没有答案D解析统计的结果只是说明事件发生可能性的大小,具体到一个个体不一定发生故选D7设某大学的女生体重y(单位:kg)与身高x(单位
6、:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i1,2,n),用最小二乘法建立的回归方程为0.85x85.71,则下列结论中不正确的是()Ay与x具有正的线性相关关系B回归直线过样本点的中心(,)C若该大学某女生身高增加1 cm,则其体重约增加0.85 kgD若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg答案D解析由于线性回归方程中x的系数为0.85,因此y与x具有正的线性相关关系,故A正确又线性回归方程必过样本点的中心(,),因此B正确由线性回归方程中系数的意义知,x每增加1 cm,其体重约增加0.85 kg,故C正确当某女生的身高为170 cm时,其体重估
7、计值是58.79 kg,而不是具体值,因此D不正确8以模型ycekx去拟合一组数据时,为了求出回归方程,设zln y,其变换后得到线性回归方程z0.3x4,则c_.答案e4解析因为ycekx,所以两边取对数,可得ln yln (cekx)ln cln ekxln ckx,令zln y,可得zln ckx.因为z0.3x4,所以ln c4,所以ce4.二、高考小题9(2017山东高考)为了研究某班学生的脚长x(单位:厘米)和身高y(单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y与x之间有线性相关关系设其回归直线方程为x.已知i225,i1600,4.该班某学生的脚长
8、为24,据此估计其身高为()A160 B163 C166 D170答案C解析i225,i22.5.i1600,i160.又4, 160422.570.回归直线方程为4x70.将x24代入上式得42470166.故选C三、模拟小题10(2020南阳市一中模拟)为考察A,B两种药物预防某疾病的效果,进行动物实验,分别得到如下等高条形图根据图中信息,在下列各项中,说法最佳的一项是()A药物B的预防效果优于药物A的预防效果B药物A的预防效果优于药物B的预防效果C药物A,B对该疾病均有显著的预防效果D药物A,B对该疾病均没有预防效果答案B解析由题图可得服用药物A的患病人数少于服用药物B的患病人数,而服用
9、药物A的未患病人数多于服用药物B的未患病人数,所以药物A的预防效果优于药物B的预防效果故选B11(2019广东深中、华附、省实、广雅四校联考)如图是一组数据(x,y)的散点图,经最小二乘估计公式计算,y与x之间的线性回归方程为x1,则_.答案0.8解析由题图知2,2.6,将(2,2.6)代入x1中,解得0.8.一、高考大题1(2019全国卷)某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:满意不满意男顾客4010女顾客3020(1)分别估计男、女顾客对该商场服务满意的概率;(2)能否有95%的把握认为男、女顾客对该商场服
10、务的评价有差异?附:K2.P(K2k0)0.0500.0100.001k03.8416.63510.828解(1)由调查数据,男顾客中对该商场服务满意的比率为0.8,因此男顾客对该商场服务满意的概率的估计值为0.8.女顾客中对该商场服务满意的比率为0.6,因此女顾客对该商场服务满意的概率的估计值为0.6.(2)K2的观测值k4.762.由于4.7623.841,故有95%的把握认为男、女顾客对该商场服务的评价有差异2(2018全国卷)下图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型根
11、据2000年至2016年的数据(时间变量t的值依次为1,2,17)建立模型:30.413.5t;根据2010年至2016年的数据(时间变量t的值依次为1,2,7)建立模型:9917.5t.(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;(2)你认为用哪个模型得到的预测值更可靠?并说明理由解(1)利用模型,该地区2018年的环境基础设施投资额的预测值为30.413.519226.1(亿元)利用模型,该地区2018年的环境基础设施投资额的预测值为9917.59256.5(亿元)(2)利用模型得到的预测值更可靠理由如下:()从折线图可以看出,2000年至2016年的数据对应
12、的点没有随机散布在直线y30.413.5t上下,这说明利用2000年至2016年的数据建立的线性模型不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型9917.5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型得到的预测值更可靠()从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型得到的预测值226.1亿元的增幅明显偏低,而利用模型得到
13、的预测值的增幅比较合理,说明利用模型得到的预测值更可靠3(2018全国卷)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;(2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m的工人数填入下面的列联表:超过m不超过m第一种生产方式第二种生产方式(3)根据(2)中的列联表,能否有99%
14、的把握认为两种生产方式的效率有差异?附:K2,P(K2k0)0.0500.0100.001k03.8416.63510.828解(1)第二种生产方式的效率更高理由如下:由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间超过80分钟,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间不超过79分钟因此第二种生产方式的效率更高由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为85.5分钟,用第二种生产方式的工人完成生产任务所需时间的中位数为73.5分钟因此第二种生产方式的效率更高由茎叶图可知:用第一种生产方式的工人完成生产任务平均所需时间高于80分
15、钟;用第二种生产方式的工人完成生产任务平均所需时间低于80分钟,因此第二种生产方式的效率更高由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布,又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少,因此第二种生产方式的效率更高(以上给出了4种理由,考生答出其中任意一种或其他合理理由均可得分)(2)由茎叶图知m80.列联表如下:超过m不超过m第一种生产方式155第二种
16、生产方式515(3)由于K2的观测值k106.635,所以有99%的把握认为两种生产方式的效率有差异二、模拟大题4(2020大同市高三调研)下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(单位:吨)与相应的生产能耗y(单位:吨标准煤)的几组对照数据x3456y2.5344.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法,求出y关于x的线性回归方程x;(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤,试根据(2)求出的线性回归方程预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?参考数据:32.5435464.566.5, .解(1)由题
17、设所给数据,可得散点图如图所示(2)由对照数据计算得4.5,3.5,x86,xiyi66.5,0.7, 3.50.74.50.35,0.7x0.35.(3)由(2)得到的线性回归方程,可得生产100吨甲产品的生产能耗,比技改前降低90(0.71000.35)19.65(吨标准煤)5(2020南昌市高三摸底考试)某“双一流”大学专业奖学金以所学专业各学科考试成绩作为评选依据,分为专业一等奖学金、专业二等奖学金及专业三等奖学金,且专业奖学金每年评选一次,每个学生一年最多只能获得一次图1是该校2019年500名学生周课外平均学习时间的频率分布直方图,图2是这500名学生在2019年周课外平均学习时间
18、获得专业奖学金的频率柱状图(1)求这500名学生中获得专业三等奖学金的人数;(2)若周课外平均学习时间超过35 h的学生称为“努力型”学生,否则称为“非努力型”学生,列出22列联表并判断是否有99.9%的把握认为该校学生获得专业一、二等奖学金与“努力型”学生有关?附:P(K2k0)0.100.050.0100.0050.001k02.7063.8416.6357.87910.828K2.解(1)获得专业三等奖学金的频率为(0.0080.0160.04)50.15(0.040.0560.016)50.4(0.0160.008)50.40.32,5000.32160(人),故这500名学生中获得专
19、业三等奖学金的人数为160.(2)周课外平均学习时间不超过35 h的“非努力型”学生有500(0.0080.0160.040.040.0560.016)5440(人),其中获得一、二等奖学金的学生有500(0.0080.0160.04)50.05500(0.040.0560.016)5(0.250.05)92(人)周课外平均学习时间超过35 h的“努力型”学生有500(0.0160.08)560(人),其中获得一、二等奖学金的学生有60(0.350.25)36(人)22列联表为“非努力型”学生“努力型”学生总计获得专业一、二等奖学金9236128未获得专业一、二等奖学金34824372总计44060500K242.3610.828,故有99.9%的把握认为获得专业一、二等奖学金与“努力型”学生有关