1、课时作业1回归分析的基本思想及其初步应用时间:45分钟分值:100分一、选择题(每小题6分,共计36分)1四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直线方程,分别得到以下四个结论:y与x负相关且 2.347x6.423;y与x负相关且 3.476x5.648;y与x正相关且 5.437x8.493;y与x正相关且 4.326x4.578.其中一定不正确的结论的序号是()A BC D解析:正相关指的是y随x的增大而增大,负相关指的是y随x的增大而减小,故不正确的为,故选D.答案:D2由一组样本数据(x1,y1),(x2,y2),(x3,y3),(xn,yn)得到的线性回归
2、方程为 x ,下列说法不正确的是()A直线 x 必经过点(,)B直线 x 至少过点(x1,y1),(x2,y2),(xn,yn)中的一个C直线 x 的斜率为D直线 x是坐标平面上与各点(x1,y1),(x2,y2),(xn,yn)偏差最小的直线解析:由回归直线方程可知,由一组样本数据(x1,y1),(x2,y2),(x3,y3),(xn,yn)得到的回归直线方程x,不一定要经过这些数据点,可以在回归直线方程的附近,因此,B的说法是不正确的答案:B3两个变量y与x的回归模型中,分别选择了4个不同模型,它们的R2如下,其中拟合效果最好的模型是()A模型1的R2为0.98 B模型2的R2为0.80C
3、模型3的R2为0.50 D模型4的R2为0.25解析:R2的值越大,说明模型拟合效果越好,故选A.答案:A4下列说法不正确的是()A回归分析中,R2的值越大,说明残差平方和越小B若一组观测值(x1,y1),(x2,y2),(xn,yn)满足yibxiaei(i1,2,n),若ei恒为0,则R21C回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法D画残差图时,纵坐标为残差,横坐标一定是编号解析:残差图中横坐标可以是样本编号,也可以是身高数据,还可以是体重估计值等,故选D.答案:D5设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)
4、(i1,2,n),用最小二乘法建立的回归方程为 0.85x85.71,则下列结论中不正确的是()Ay与x具有正的线性相关关系B回归直线过样本点的中心(,)C若该大学某女生身高增加1 cm,则其体重约增加0.85 kgD若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg解析:D选项中,若该大学某女生身高为170 cm,则可断定其体重约为:0.8517085.7158.79 kg.故D不正确答案:D6变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,
5、3),(12.5,2),(13,1)r1表示变量Y与X之间的线性相关系数,r2表示变量V与U之间的线性相关系数,则()Ar2r10 B0r2r1Cr200,U与V是负相关,相关系数r20,故选C.答案:C二、填空题(每小题8分,共计24分)7某种产品的广告费支出x与销售额y(单位:万元)之间有下表关系x24568y3040605070y与x的线性回归方程为 6.5x17.5,当广告支出5万元时,随机误差的效应(残差)为_解析:因为y与x的线性回归方程为6.5x17.5,当x5时,50,当广告支出5万元时,由表格得:y60,故随机误差的效应(残差)为605010.答案:108在研究身高和体重的关
6、系时,求得相关指数R2_,可以叙述为“身高解释了64%的体重变化,而随机误差贡献了剩余的36%”,所以身高对体重的效应比随机误差的效应大得多解析:R20.64表示“身高解释了64%的体重变化”或者说体重差异有64%是由身高引起的答案:0.649已知一系列样本点(xi,yi)(i1,2,3,n)的回归直线方程为 2x ,若样本点(r,1)与(1,s)的残差相同,则r和s的关系为_解析:由残差的定义可得,1(2r)s(2),化简得,s32r.答案:s32r三、解答题(共计40分)10(10分)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价x(元)88
7、.28.48.68.89销量y(件)908483807568(1)求回归直线方程 bxa,其中b20,ab;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润销售收入成本)解:(1)8.5,(908483807568)80b20,ab,a80208.5250,回归直线方程为 20x250.(2)设工厂获得的利润为L元,则Lx(20x250)4(20x250)20(x)2361.25,该产品的单价应定为元,工厂获得的利润最大11(15分)以下资料是一位销售经理收集到的每年销售额y(千元)和销售经验x(年)的
8、关系:销售经验x(年)13446810101113年销售额y(千元)809792102103111119123117136(1)依据这些数据画出散点图并作直线 784.2x,计算(yi i)2;(2)依据这些数据求回归直线方程并据此计算(yi i)2;(3)比较(1)(2)中的残差平方和(yi i)2的大小解:(1)散点图与直线784.2x的图形如图,对x1,3,13,有i82.2,90.6,94.8,94.8,103.2,111.6,120,120,124.2,132.6,(yii)2179.28.(2)i7,(xi)2142,i108,(xi)(yi)568,4,1087480,故804x
9、,对x1,3,13,有i84,92,96,96,104,112,120,120,124,132,(yii)2170.(3)比较可知,(2)中求出的(yii)2较小12(15分)在试验中得到变量y与x的数据如下表:x1923273135y41124109325试求y与x之间的回归方程,并预测x40时,y的值解:作散点图如图所示,从散点图可以看出,两个变量x,y不呈线性相关关系,根据学过的函数知识,样本点分布的曲线符合指数型函数yc1ec2x,通过对数变化把指数关系变为线性关系,令zlny,则zbxa(alnc1,bc2)列表:x1923273135z1.3862.3983.1784.6915.784作散点图如图所示,从散点图可以看出,两个变量x,z呈很强的线性相关关系由表中的数据得到线性回归方程为:0.277x3.992.所以y关于x的指数回归方程为:e0.277x3.992.所以,当x40时,ye0.277403.9921 197.510.