1、课时作业(二十)(第一次作业)1下列两个变量之间的关系不具有相关关系的是()A小麦产量与施肥量B正方体的体积与表面积C蛋鸭产蛋个数与饲养天数D甘蔗的含糖量与生长期的日照天数答案B解析正方体的体积与表面积之间是函数关系,不是相关关系2在对两个变量x,y进行线性回归分析时有下列步骤:对所求出的回归方程作出解释;收集数据(xi,yi),i1,2,n;求回归方程;求相关系数;根据所收集的数据绘制散点图若根据可靠性要求能够作出变量x,y具有线性相关结论,则在下列操作顺序中正确的是()ABC D答案D解析由线性回归分析的步骤可知3一位母亲记录了儿子39岁的身高,由此建立的身高与年龄的回归模型为7.19x7
2、3.93,用这个模型预测这个孩子10岁时的身高,则正确的叙述是()A身高一定是145.83 cm B身高在145.83 cm以上C身高在145.83 cm以下 D身高在145.83 cm左右答案D解析回归直线是用来估计总体的,所以我们求的值都是估算值,所以我们得到的结果也是近似的只要把自变量的值代入回归直线方程即可求得结果为145.83 cm.4工人月工资y(元)依劳动生产率x(千元)变化的回归方程为y5080x,下列判断不正确的是()A劳动生产率为1 000元时,工资约为130元B劳动生产率提高1 000元时,工资平均提高80元C劳动生产率提高1 000元时,工资平均提高130元D当月工资为
3、210元时,劳动生产率约为2 000元答案C解析x1千元时,50801130.A正确,B,D叙述都正确,故C错5(高考真题湖南卷)设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i1,2,n),用最小二乘法建立的回归方程为0.85x85.71,则下列结论中不正确的是()Ay与x具有正的线性相关关系B回归直线过样本点的中心(x,y)C若该大学某女生身高增加1 cm,则其体重约增加0.85 kgD若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg答案D解析D选项中,若该大学某女生身高为170 cm,则可断定其体重约为0.8
4、517085.7158.79 kg.故D不正确6某商品销售量y(件)与销售价格x(元/件)负相关,则其回归方程可能是()A10x200 B10x200C10x200 D10x200答案A7设有一个回归方程21.5x,当变量增加1个单位时,则()Ay平均增加1.5个单位 By平均减少1.5个单位Cy平均增加2个单位 Dy平均减少2个单位答案B解析21.5(x1)21.5x1.51.5,即x增加1个单位时,y平均减少1.5个单位故选B.8某化工厂为预测某产品的回收率y,需要研究它和原料有效成分含量x之间的相关关系,现取8对观测值,计算得: xi52, yi228, xi2478, xiyi1 84
5、9,则y与x之间的回归直线方程是()A. 11.472.62x B. 11.472.62xC. 2.6222.47x D. 11.472.62x,答案A解析=2.62, 28.52.626.511.47,所以回归方程是11.472.62x.9(高考真题山东卷)某产品的广告费用x与销售额y的统计数据如下表:广告费用x(万元)4235销售额y(万元)49263954根据上表可得回归方程x中的为9.4,据此模型预报广告费用为6万元时销售额约为()A63.6万元 B65.5万元C67.7万元 D72.0万元答案B解析由表可计算,42,因为点(,42)在回归直线x上,且9.4,所以429.4,解得9.1
6、.故回归方程为9.4x9.1,令x6,得65.5,故选B.10某炼钢厂废品率x(%)与成本y(元/t)的线性回归方程为105.49242.569x.当成本控制在176.5元/t时,可以预计生产1 000 t钢中,约有_t钢是废品答案16.68解析176.5105.49242.569x,x1.668,即成本控制在176.5元/t时,废品率为1.668%.生产1 000 t钢中,约有1 0001.668%16.68(t)钢是废品11为了了解全球金融危机对市民生活的影响,对某地的某社区的10户家庭进行调查,这10户家庭的年收入和年饮食支出统计资料如下表:年收入x(万元)24466677810年饮食支
7、出y(万元)0.91.41.62.02.11.91.82.12.22.3(1)作出散点图;(2)根据数据,家庭年收入与年饮食支出之间是否具有线性相关关系?若是求出两个变量的回归方程解析(1)散点图如下图(2)由散点图可知,年收入越高,年饮食支出越高,图中点的趋势表明两个变量间也确实存在着线性相关关系依题意可计算得:6,1.83,236,10.98,xiyi117.7,xi2406,0.17, 0.81,0.17x0.81.所求的回归方程为0.17x0.81.12某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了四次试验,得到的数据如下:零件的个数x(个)2345加工的时间y(小时)
8、2.53.04.04.5(1)在给定的坐标系中画出表中数据的散点图;(2)求出y关于x的线性回归方程x,并在坐标中画出回归直线(注:,=-)思路(1)描点作图.(2)求出相关数据,x2i,xiyi,并求出,.解析(1)散点图如下图.,(2)由表中数据,得 xiyi52.5,3.5,, 3.5, xi254,0.7,1.05,0.7x1.05.,回归直线如下图所示.13.某种产品的广告费支出x与销售额y(单位均为百万元)之间有如下对应关系:x24568y3040605070(1)画出散点图;(2)根据散点图判断x与y是否相关,若相关,则求回归直线方程;(3)若广告费支出为12百万元,则销售额大约
9、为多少百万元?思路把广告费支出与销售额之间的关系用线性回归方程表示出来,然后根据它来预测要求的销售额.解析(1)散点图如图,由图中散点可以看出,它们分布在一条直线的附近,因而它们是线性相关的.(2)由上述散点图可知x与y具有相关关系.列出下表.可得6.5,y x506.5517.5.故回归直线方程为y6.5x17.5.(3)当x12时,y6.51217.595.5,即广告费支出为12百万元时,销售额大约为95.5百万元课时作业(二十一)(第二次作业)1下列各关系中,不属于相关关系的是()A产品成本与生产数量B球的表面积与体积C家庭的支出与收入 D人的年龄与体重答案B2对变量x,y有观测数据(x
10、i,yi)(i1,2,10),得散点图如下图所示由这个散点图可以判断()A变量x与y正相关B变量x与y不相关C变量x与y负相关D变量x与y是函数关系答案C3(高考真题陕西)设(x1,y1),(x2,y2),(xn,yn)是变量x和y的n个样本点,直线l是由这些样本点通过最小二乘法得到的线性回归方程(如图),以下结论中正确的是()A直线l过点(,)Bx和y的相关系数为直线l的斜率Cx和y的相关系数在0到1之间D当n为偶数时,分布在l两侧的样本点的个数一定相同答案A解析由样本点的中心(,)落在回归直线上可知A正确;x和y的相关系数表示为x与y之间的线性相关程度,不表示直线l的斜率,故B错;x和y的
11、相关系数应在1到1之间,故C错;分布在回归直线两侧的样本点的个数并不绝对平均,即无论样本点个数是奇数还是偶数,故D错4农民工月工资y(元)与劳动生产率x(千元)变化的回归直线方程为50100x,下列判断正确的是()A劳动生产率为1 000元时,工资为150元B劳动生产率提高1 000元时,工资平均提高100元C劳动生产率提高1 000元时,工资平均提高150元D当月工资为250元时,劳动生产率为2 000元答案B解析由回归直线方程50100x知,x每增加1,y增加100,但要注意x的单位是千元,y的单位是元5某考查团对全国10大城市进行职工人均工资水平x(千元)与居民人均消费水平y(千元)统计
12、调查,y与x具有线性相关关系,回归方程0.66x1.562,若某城市居民人均消费水平为7.675(千元),估计该城市人均消费额占人均工资收入的百分比约为()A83% B72%C67% D66%答案A解析将7.675代入回归方程得0.66x1.5627.675,解得x9.262.所以,人均消费额占人均工资收入的比例为0.83.6改革开放以来,我国高等教育事业迅速发展,为调查某省从1990年到2000年农村18岁到24岁的青年人每年考入大学的百分比,为便于统计,把1990年到2000年的年号依次编号为0,1,10作为自变量x,每年考入大学的百分比作为因变量y,进行回归分析,得回归直线方程1.800
13、.42x.下列对数据解释正确的是()每年升入大学的百分比为1.80升入大学的18岁到24岁的人数按大约每年0.42%的速度递增1990年升入大学的百分比约为1.80%,2000年升入大学的百分比约为6%从1990年到2000年升入大学的人数成等距离增加A BC D答案D解析由0.42表示回归直线1.800.42x的斜率估值,1.80表示截距,再结合在直线方程中斜率与截距的意义可得正确7某单位为了解用电量y千瓦时与气温x 之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表:气温()1813101用电量(千瓦时)24343864由表中数据得线性回归方程x中2,预测当气温为4 时,用电量
14、约为_千瓦时答案68解析10,40, 4021060,2x60.当x4时,2(4)6068.8假设学生在初中的英语成绩和高一英语成绩是线性相关的现有10名学生的初中英语成绩(x)和高一英语成绩(y)如下:x74717268767367706574y76757170767965776272则由此得到的回归直线的斜率约为_(保留到小数点后第2位)答案1.22解析求回归方程中的,按照公式进行即可,即需要依次计算出71,xi250 520,72.3,xiyi51 467,所以1.22,所以斜率为1.22.9在某种产品表面进行腐蚀刻线试验,得到腐蚀深度y(单位:m)与腐蚀时间x(单位:s)之间相应的一组
15、观察值如下表:腐蚀时间x5101520304050607090120腐蚀深度y610101316171923252946(1)画出表中数据的散点图;(2)求回归方程;(3)如果腐蚀时间为100 s,试预测此时的腐蚀深度解析(1)散点图如下图所示(2)由散点图可以看出,这些点大致分布在一条直线的附近,可求回归方程利用计算器求得回归方程为0.304x5.344.(3)根据上面求得的回归方程,当腐蚀时间为100 s时,0.3041005.34435.744(m),即此时的腐蚀深度大约是35.744 m.10某市近10年的煤气消耗量与使用煤气户数的历史资料如下:年份199319941995199619
16、9719981999200020012002用户(万户)11.21.61.822.53.244.24.5煤气消耗量(百万立方米)679.81212.114.5202425.427.5(1)检验是否线性相关;(2)求回归方程;(3)若政府下一步再扩大5 000煤气用户,试预测该市煤气消耗量将达到多少?解析(1)观察散点图可知,煤气消耗量与使用煤气户数两者线性相关(图略)(2)经计算可求得其回归方程6.057 3x0.081 1.(3)x04.50.55,代入得30.37,所以,若政府下一步再扩大5 000煤气用户,该市煤气消耗量将达30.37百万立方米11下表提供了某厂节能降耗技术改造后生产甲产
17、品过程中记录的产量x(吨)与相应的生产能耗y(吨)标准煤的几组对照数据x3456y2.5344.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出回归方程x;(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?解析(1)散点图,如图所示(2)由题意,得iyi32.5435464.566.5,4.5,3.5,i23242526286,=0.7, 3.50.74.50.35.故线性回归方程为0.7x0.35.(3)根据回归方程的预测,现在生产100吨产品消耗的标准煤的数量为0.
18、71000.3570.35,故能耗减少了9070.3519.65(吨)12某班40名学生,按某课程的学习时数每8人为一组进行分组,其对应的学习成绩如下表:学习时数(x小时)学习成绩(y分)10401450206025703690试根据上述资料建立学习成绩y与学习时间x的直线回归方程(要求列表计算所需数据资料,写出公式和计算过程,结果保留两位小数)解析根据已知数据,可以计算出:21,62.根据资料列表计算如下表:学生xiyixi2xiyiA1040100400B1450196700C20604001 200D25706251 750E36901 2963 240合计1053102 6177 29
19、0进而,可以求得1.89,621.892122.31,所以,学习成绩y与学习时间x的直线回归方程为1.89x22.31.1(2013课标全国)为了解某地区的中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大在下面的抽样方法中,最合理的抽样方法是()A简单随机抽样B按性别分层抽样C按学段分层抽样 D系统抽样答案C解析由分层抽样的定义知,合理的抽样方法是分层抽样,要按学段分层,故选C.2(2013湖南)某学校有男、女学生各500名,为了解男、女学生在学习兴趣与业余爱好方面是否存在显著差异,拟从
20、全体学生中抽取100名学生进行调查,则宜采用的抽样方法是()A抽签法 B随机数法C系统抽样法 D分层抽样法答案D解析由数据特点可采用分层抽样当总体是由差异明显的几部分组成时宜用分层抽样3(2013江西)总体由编号01,02,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为()7816657208026314070243699728019832049234493582003623486969387481A.08 B07C02 D01答案D解析本题考查简单随机抽样的随机数表法这5个数
21、依次为08,02,14,07,01.故选D.4(2013山东)将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91.现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x表示:则7个剩余分数的方差为()A. B.C36 D.答案B解析由图可知去掉的两个数是87,99,所以879029129490x917,x4.s2(8791)2(9091)22(9191)22(9491)22.5(2012山东)在某次测量中得到的A样本数据如下:82,84,84,86,86,86,88,88,88,88.若B样本数据恰好是A样本数据每个都加2后所得数据,则A,B两样本的下列数字
22、特征对应相同的是()A众数 B平均数C中位数 D标准差答案D解析只有标准差不变,其中众数、平均数和中位数都加2.6(2012安徽)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则()A甲的成绩的平均数小于乙的成绩的平均数B甲的成绩的中位数等于乙的成绩的中位数C甲的成绩的方差小于乙的成绩的方差D甲的成绩的极差小于乙的成绩的极差答案C解析由题意可知,甲的成绩为4,5,6,7,8,乙的成绩为5,5,5,6,9.所以甲、乙的成绩的平均数均为6,A错;甲、乙的成绩的中位数分别为6,5,B错;甲、乙的成绩的方差分别为(46)2(56)2(66)2(76)2(86)22,(56)2(5
23、6)2(56)2(66)2(96)2,C对;甲、乙的成绩的极差均为4,D错7(2016山东)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是17.5,30,样本数据分组为17.5,20),20,22.5),22.5,25),25,27.5),27.5,30根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是()A56B60C120 D140答案D解析由频率分布直方图知,数据落在区间22.5,30的频率为2.5(0.160.080.04)0.7.故这200名学生中每周的自习时间不少于22.5小时的人数为2000.7140.
24、故选D.8(2014山东理)为了研究某药品的疗效,选取若干名志愿者进行临床试验所有志愿者的舒张压数据(单位:kPa)的分组区间为12,13),13,14),14,15),15,16),16,17,将其按从左到右的顺序分别编号为第一组,第二组,第五组如图是根据试验数据制成的频率分布直方图已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为()A6 B8C12 D18答案C解析第一组和第二组的频率之和为0.4,故样本容量为50,第三组的频率为0.36,故第三组的人数为500.3618,故第三组中有疗效的人数为18612.9(2015山东文)为比较甲、乙两地某月14时的气
25、温状况,随机选取该月中的5天,将这5天中14时的气温数据(单位:)制成如图所示的茎叶图考虑以下结论:甲地该月14时的平均气温低于乙地该月14时的平均气温;甲地该月14时的平均气温高于乙地该月14时的平均气温;甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差;甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差其中根据茎叶图能得到的统计结论的编号为()A BC D答案B解析由茎叶图中的数据通过计算求得甲29,s甲;乙30,s乙.甲s乙,故正确选B.10(2014重庆理)已知变量x与y正相关,且由观测数据算得样本平均数x3,y3.5,则由该观测数据算得的线性回归方程可能是()A
26、0.4x2.3B2x2.4C2x9.5 D0.3x4.4答案A解析依题意知,相应的回归直线的斜率应为正,排除C,D.且直线必过点(3,3.5),代入A,B得A正确11(2016江苏)已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是_答案0.1解析这组数据的平均数5.1,则方差s2 0.1.12(2013湖北)从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示(1)直方图中x的值为_;(2)在这些用户中,用电量落在区间100,250)内的户数为_答案(1)0.004 4(2)70解析(1)(0.001 20.002 420.
27、003 6x0.006 0)501x0.004 4.(2)1(0.001 20.002 42)5010070.13(2012浙江)某中学为了解学生数学课程的学习情况,在3 000名学生中随机抽取200名,并统计这200名学生的某次数学考试成绩,得到了样本的频率分布直方图(如图)根据频率分布直方图推测,这3 000名学生在该次数学考试中成绩小于60分的学生数是_答案600解析根据样本的频率分布直方图,成绩小于60分的学生的频率为0.020.060.120.20,所以可推测3 000名学生中成绩小于60分的人数为600名14(2013湖南)为了考查某校各班参加课外书法小组的人数,从全校随机抽取5个
28、班级,把每个班级参加该小组的人数作为样本数据,已知样本平均数为7,样本方差为4,且样本数据互不相同,则样本数据中的最大值为_答案10解析由已知可设5个班级参加的人数分别为x1,x2,x3,x4,x5,则7,4,故(x17)2(x27)2(x37)2(x47)2(x57)220,即五个完全平方数之和为20,要使其中一个达到最大,这五个数必须是关于0对称分布的,而9101920,也就是(3)2(1)202123220,所以五个班级参加的人数分别为4,6,7,8,10,最大数字为10.15(2012广东)由正整数组成的一组数据x1,x2,x3,x4,其平均数和中位数都是2,且标准差等于1,则这组数据
29、为_(从小到大排列)答案1,1,3,3解析首先要弄清平均数和中位数的概念,并用等式表示出来,再由标准差的定义进行计算得到等式,根据它们之间的关系逐渐减少字母的个数,根据都是整数确定出四个数的大小设x1x2x3x4,根据已知条件得到x1x2x3x48,且x2x34,所以x1x44,又因为1,所以(x12)2(x22)22,又因为x1,x2,x3,x4是正整数,所以(x12)2(x22)21,所以x11,x21,x33,x43.16(2012福建)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价x(元)88.28.48.68.89销量y(件)90848
30、3807568(1)求回归直线方程x,其中20,yx;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润销售收入成本)解析(1)由于x(x1x2x3x4x5x6)8.5,y(y1y2y3y4y5y6)80.所以ayb x80208.5250,从而回归直线方程为20x250.(2)设工厂获得的利润为L元,依题意得Lx(20x250)4(20x250)20x2330x1 00020(x)2361.25.当且仅当x8.25时,L取得最大值故当单价定为8.25元时,工厂可获得最大利润17(2014课标全国理)某地
31、区2007年至2013年农村居民家庭人均纯收入y(单位:千元)的数据如下表:年份2007200820092010201120122013年份代号t1234567人均纯收入y2.93.33.64.44.85.25.9(1)求y关于t的线性回归方程;(2)利用(1)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入附:回归直线的斜率和截距的最小二乘估计公式分别为:解析(1)由所给数据计算,得t(1234567)4,y(2.93.33.64.44.85.25.9)4.3,(tit)2941014928,(tit)(yiy)(3
32、)(1.4)(2)(1)(1)(0.7)00.110.520.931.614,yt4.30.542.3.所求回归方程为0.5t2.3.(2)由(1)知,0.50,故2007年至2013年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元将2015年的年份代号t9代入(1)中的回归方程,得0.592.36.8,故预测该地区2015年农村居民家庭人均纯收入约为6.8千元18(2015重庆文)随着我国经济的发展,居民的储蓄存款逐年增长设某地区城乡居民人民币储蓄存款(年底余额)如下表:年份20102011201220132014时间代号t12345储蓄存款y(千亿元)567810(1)求y关
33、于t的回归方程t;(2)用所求回归方程预测该地区2015年(t6)的人民币储蓄存款附:回归方程t中,解析(1)列表计算如下,itiyiti2tiyi11515226412337921448163255102550153655120这里n5,i3,i7.2.从而=1.2,a b 7.21.233.6,故所求回归方程为1.2t3.6.(2)将t6代入回归方程可预测该地区2015年的人民币储蓄存款为y 1.263.610.8(千亿元)19下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;(2)建立y与
34、t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量附注:参考数据:yi9.32,tiyi40.17, 0.55,2.646.参考公式:相关系数r,回归方程t中斜率和截距的最小二乘估计公式分别为:, .解析(1)由折线图中数据和附注中参考数据得4, (ti)228, 0.55, (ti)(yi)tiyiyi40.1749.322.89,r0.99.因为y与t的相关系数近似为0.99,说明y与t的线性相关程度相当高,从而可以用线性回归模型拟合y与t的关系(2)由1.331及(1)得b0.103,ab 1.3310.10340.92.所以,y关于t的回归方程为0.920.10
35、t,将2016年对应的t9代入回归方程得0.920.1091.82.所以预测2016年我国生活垃圾无害化处理量约为1.82亿吨1(2011辽宁)某农场计划种植某种新作物,为此对这种作物的两个品种(分别称为品种甲和品种乙)进行田间试验选取两大块地,每大块地分成n小块地,在总共2n小块地中,随机选n小块地种植品种甲,另外n小块地种植品种乙试验时每大块地分成8小块,即n8,试验结束后得到品种甲和品种乙在各小块地上的每公顷产量(单位:kg/hm2)如下表:品种甲403397390404388400412406品种乙419403412418408423400413分别求品种甲和品种乙的每公顷产量的样本平
36、均数和样本方差;根据试验结果,你认为应该种植哪一品种?附:样本数据x1,x2,xn的样本方差s2(x1)2(x2)2(xn)2,其中为样本平均数解析品种甲的每公顷产量的样本平均数和样本方差分别为:甲(403397390404388400412406)400,s甲2(32(3)2(10)242(12)2021226257.25.品种乙的每公顷产量的样本平均数和样本方差分别为:乙(419403412418408423400413)412,s乙272(9)20262(4)2112(12)21256.由以上结果可看出,品种乙的样本平均数大于品种甲的样本平均数,且两品种的样本方差差异不大,故应该选择种植品种乙