1、第二讲变量间的相关关系与统计案例考点1回归分析1.已知变量x和y满足关系y=-x+1,变量y与z满足z=3y+2. 下列结论中正确的是()A.x与y负相关,x与z负相关B.x与y正相关,x与z正相关C.x与y正相关,x与z负相关D.x与y负相关,x与z正相关2.下列说法中错误的是()A.自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫作相关关系B.在线性回归分析中,相关系数r的值越大,变量间的相关性越强C.在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高D.在回归分析中,R2为0.98的模型比R2为0.80的模型拟合的效果好3.某食品店为了了解气温对销售量的
2、影响,随机记录了该店1月份其中5天的日销售量y(单位:千克)与该地当日最低气温x(单位:)的数据,如下表:x258911y1210887(1)求出y与x的回归方程y=bx+a;(2)判断y与x之间是正相关还是负相关,若该地1月份某天的最低气温为6 ,请用所求回归方程预测该店当日的销售量.考点2独立性检验4.为了研究某学科成绩是否与学生性别有关,采用分层抽样的方法,从高三年级抽取了30名男生和20名女生的该学科成绩,得到如图14-2-1和图14-2-2所示的男生成绩的频率分布直方图和女生成绩的茎叶图,规定80分以上为优分(含80分).图14-2-1图14-2-2(1)请根据图示,将下列22列联表
3、补充完整;优分非优分总计男生女生总计50(2)据此列联表判断,能否在犯错误概率不超过10%的前提下认为“该学科成绩与性别有关”.答案1.A因为变量x和y满足关系y=-x+1,其中-10,所以x与y负相关;又z=3y+2,把y=-x+1代入即可得到z=-3x+5,因为-30时,r越大,相关性越强,当r0时,r越大,相关性越弱,故B不正确;对于一组数据的拟合程度的好坏的评价,一是残差点分布的带状区域越窄,拟合效果越好,二是R2越大,拟合效果越好,所以R2为0.98的模型比R2为0.80的模型拟合的效果好,C,D正确,故选B.3.(1)x=15i=15xi=355=7,y=15i=15yi=455=9,i=15xiyi-5x y=212+510+88+98+117-579=-28,i=15xi2-5x2=22+52+82+92+112-572=50,b=-2850=-0.56.a=y-bx=9-(-0.56)7=12.92.所求的回归方程是y=-0.56x+12.92.(2)由b=-0.562.706,所以能在犯错误概率不超过10%的前提下认为“该学科成绩与性别有关”.