1、20102014年高考真题备选题库第10章 算法初步、统计、统计案例第4节 变量间的相关关系、统计案例1(2014重庆,5分)已知变量x与y正相关,且由观测数据算得样本平均数3,3.5,则由该观测数据算得的线性回归方程可能为()A.0.4x2.3 B.2x2.4C.2x9.5 D.0.3x4.4解析:依题意知,相应的回归直线的斜率应为正,排除C,D.且直线必过点(3,3.5)代入A,B得A正确答案:A2(2014湖北,5分)根据如下样本数据x345678y4.02.50.50.52.03.0 得到的回归方程为bxa,则()Aa0,b0 Ba0,b0 Ca0 Da0,b0解析:由表中数据画出散点
2、图,如图,由散点图可知b0,选B.答案:B3(2014新课标全国卷,12分)某地区2007年至2013年农村居民家庭纯收入y(单位:千元)的数据如下表:年份2007200820092010201120122013年份代号t1234567人均纯收入y2.93.33.64.44.85.25.9(1)求y关于t的线性回归方程;(2)利用(1)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入附:回归直线的斜率和截距的最小二乘估计公式分别为:,解:(1)由所给数据计算得(1234567)4,(2.93.33.64.44.85.2
3、5.9)4.3,(ti)2941014928,(ti)(yi)(3)(1.4)(2)(1)(1)(0.7)00.110.520.931.614,0.5,4.30.542.3,所求回归方程为0.5t2.3.(2)由(1)知,0.50,故2007年至2013年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元将2015年的年份代号t9代入(1)中的回归方程,得0.592.36.8,故预测该地区2015年农村居民家庭人均纯收入为6.8千元4(2014江西,5分)某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查52名中学生,得到统计数据如表1至表4,则与性别有关联的可
4、能性最大的变量是()表1成绩性别不及格及格总计男61420女102232总计163652表2视力性别好差总计男41620女122032总计163652表3智商性别偏高正常总计男81220女82432总计163652表4阅读量性别丰富不丰富总计男14620女23032总计163652A成绩 B视力C智商 D阅读量解析:因为,则有,所以阅读量与性别关联的可能性最大答案:D5(2013福建,5分)已知x与y之间的几组数据如下表: x123456 y021334假设根据上表数据所得线性回归直线方程为x,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为ybxa,则以下结论正确的是()
5、A.b,aB.b,aC.a D.b,a解析:本题主要考查线性回归直线方程,意在考查考生的数形结合能力、转化和化归能力、运算求解能力由两组数据(1,0)和(2,2)可求得直线方程为y2x2,b2,a2.而利用线性回归方程的公式与已知表格中的数据,可求得,所以a.答案:C6(2013湖北,5分)四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直线方程,分别得到以下四个结论:y与x负相关且2.347x6.423;y与x负相关且3.476x5.648; y与x正相关且5.437x8.493;y与x正相关且4.326x4.578:其中一定不正确的结论的序号是()A BC D解析:本题主
6、要考查两个变量的相关性,并能判断正相关和负相关中y与x负相关而斜率为正,不正确;中y与x正相关而斜率为负,不正确答案:D7.(2013重庆,13分)从某居民区随机抽取10个家庭,获得第i个家庭的月收入xi(单位:千元)与月储蓄yi(单位:千元)的数据资料,算得xi80,yi20,xiyi184,x720.(1)求家庭的月储蓄y对月收入x的线性回归方程ybxa;(2)判断变量x与y之间是正相关还是负相关;(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄附:线性回归方程ybxa中,b,ab,其中,为样本平均值,线性回归方程也可写为x.解:本题主要考查两个变量的相关性、线性回归方程的求法及预
7、报作用,考查考生的运算求解能力与逻辑思维能力(1)由题意知n10,xi8,yi2.又xn2720108280,xiyin 184108224,由此可得b0.3,ab20.380.4,故所求回归方程为y0.3x0.4.(2)由于变量y的值随x的值增加而增加(b0.30),故x与y之间是正相关(3)将x7代入回归方程可以预测该家庭的月储蓄为y0.370.41.7(千元)8(2013福建,12分)某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄
8、在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分成5组:50,60),60,70),70,80),80,90),90,100分别加以统计,得到如图所示的频率分布直方图(1)从样本中日平均生产件数不足60件的工人中随机抽取2人,求至少抽到一名“25周岁以下组”工人的概率;(2)规定日平均生产件数不少于80件者为“生产能手”,请你根据已知条件完成22列联表,并判断是否有90%的把握认为“生产能手与工人所在的年龄组有关”?P(2k)0.1000.0500.0100.001k2.7063.8416.63510.828附:2解:本题主要考查古典概型、抽样方法、独
9、立性检验等基础知识,考查运算求解能力、应用意识,考查必然与或然思想、化归与转化思想等(1)由已知得,样本中有25周岁以上组工人60名,25周岁以下组工人40名所以,样本中日平均生产件数不足60件的工人中,25周岁以上组工人有600.053(人),记为A1,A2,A3;25周岁以下组工人有400.052(人),记为B1,B2.从中随机抽取2名工人,所有的可能结果共有10种,它们是:(A1,A2),(A1,A3),(A2,A3),(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2)其中,至少1名“25周岁以下组”工人的可能结果共有7种,它们
10、是(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2)故所求的概率P.(2)由频率分布直方图可知,在抽取的100名工人中,“25周岁以上组”中的生产能手有600.2515(人),“25周岁以下组”中的生产能手有400.37515(人),据此可得22列联表如下:生产能手非生产能手合计25周岁以上组15456025周岁以下组152540合计3070100所以得21.79.因为1.792.706,所以没有90%的把握认为“生产能手与工人所在的年龄组有关”9(2012湖南,5分)设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相
11、关关系,根据一组样本数据(xi,yi)(i1,2,n),用最小二乘法建立的回归方程为0.85x85.71,则下列结论中不正确的是()Ay与x具有正的线性相关关系B回归直线过样本点的中心(,)C若该大学某女生身高增加1 cm,则其体重约增加0.85 kgD若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg解析:由于回归直线的斜率为正值,故y与x具有正的线性相关关系,选项A中的结论正确;回归直线过样本点的中心,选项B中的结论正确;根据回归直线斜率的意义易知选项C中的结论正确;由于回归分析得出的是估计值,故选项D中的结论不正确答案:D10(2011山东,5分)某产品的广告费用x与销
12、售额y的统计数据如下表:广告费用x(万元)4235销售额y(万元)49263954根据上表可得回归方程x中的为9.4,据此模型预报广告费用为6万元时销售额为()A63.6万元 B65.5万元C67.7万元 D72.0万元解析:样本中心点是(3.5,42),则429.43.59.1,所以回归直线方程是9.4x9.1,把x6代入得65.5.答案:B11(2011陕西,5分)设(x1,y1),(x2,y2),(xn,yn)是变量x和y的n个样本点,直线l是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论中正确的是()Ax和y的相关系数为直线l的斜率Bx和y的相关系数在0到1之间C当n为偶数时,分布在l两侧的样本点的个数一定相同D直线l过点(,)解析:回归直线过样本中心点(,)答案:D12(2011辽宁,5分)调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程:0.254x0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加_万元解析:以x1代x,得0.254(x1)0.321,与0.254x0.321相减可得,年饮食支出平均增加0.254万元答案:0.254