1、第3节变量间的相关关系与独立性检验 课时训练 练题感 提知能【选题明细表】知识点、方法题号相关关系的判定1、14回归直线2、3、5、7、10、14、15独立性检验8、11综合应用4、6、9、12、13、16A组一、选择题1.(2013衡水中学模拟)对四组数据进行统计,获得以下散点图,关于其相关系数比较,正确的是(A)(A)r2r40r3r1(B)r4r20r1r3(C)r4r20r3r1(D)r2r40r1r30,又(2)(4)为负相关且(2)较集中在直线附近,(4)较分散,所以r2r40.综上得r2r40r36.635,故有99%的把握确认这两个变量间有关系,正确.故选B.二、填空题7.某车
2、间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如表),由最小二乘法求得回归方程=0.67x+54.9.现发现表中有一个数据模糊看不清,请你推断出该数据的值为.解析:依题意,=(10+20+30+40+50)=30.由于直线=0.67x+54.9必过点(,),于是有=0.6730+54.9=75,因此表中的模糊数据是755-(62+75+81+89)=68.答案:688.为了判断高中三年级学生选修文科是否与性别有关,现随机抽取50名学生,得到22列联表:理科文科合计男131023女72027合计203050已知P(K23.841)0.05,P(K25.0
3、24)0.025.根据表中数据,得到K2=4.844,则认为选修文科与性别有关系出错的可能性约为.解析:由K2=4.8443.841.故认为选修文科与性别有关系出错的可能性约为5%.答案:5%9.(2013济南三模)某市居民20092013年家庭年平均收入x(单位:万元)与年平均支出Y(单位:万元)的统计资料如表所示:年份20092010201120122013年平均收入x11.512.11313.315年平均支出Y6.88.89.81012根据统计资料,居民家庭年平均收入的中位数是,家庭年平均收入与年平均支出有线性相关关系.解析:5个x值是按从小到大的顺序排列的,因此居民家庭年平均收入的中位
4、数是13万元.以家庭年平均收入x作为x轴,年平均支出Y作为y轴,描点得到散点图如图所示:观察散点图可知,这些点大致分布在一条直线的附近,且总体呈上升趋势,因此家庭年平均收入与年平均支出有正线性相关关系.答案:13万元正10.某工厂经过技术改造后,降低了能源消耗,经统计该厂某种产品的产量x(单位:吨)与相应的生产能耗y(单位:吨)有如下几组样本数据:x3456y2.5344.5根据相关性检验,这组样本数据具有线性相关关系,通过线性回归分析,求得回归直线的斜率为0.7.已知该产品的年产量为10吨,则该工厂每年的生产能耗大约为吨.解析:由题知,=4.5,=3.5,故样本数据的中心点为A(4.5,3.
5、5).设回归方程为=0.7x+,将中心点坐标代入得:3.5=0.74.5+,解得=0.35,故回归方程为=0.7x+0.35,所以当x=10时,=0.710+0.35=7.35,即该工厂每年的生产能耗大约为7.35吨.答案:7.35三、解答题11.(2013湛江高考测试(二)某市甲、乙两个学校高二年级学生分别有1100人和1000人,为了解这两校全体高二年级学生期末统考中的数学成绩情况,采用分层抽样方法从两所学校共抽取了105名高二学生的数学成绩,并得到成绩频数分布表如下,规定考试成绩在120,150内为优秀.甲校:分组70,80)80,90)90,100)100,110)频数231015分组
6、110,120)120,130)130,140)140,150频数15x31乙校:分组70,80)80,90)90,100)100,110)频数1298分组110,120)120,130)130,140)140,150频数1010y3(1)求表中x与y的值;(2)由以上统计数据完成下面22列联表,问是否有99%的把握认为学生数学成绩优秀与所在学校有关?甲校乙校总计优秀非优秀总计解:(1)由分层抽样可知,甲校抽取105=55(人),乙校抽取105-55=50(人),所以x=6,y=7.(2)甲校乙校总计优秀102030非优秀453075总计5550105K2=6.1090),故x与y之间是正相关
7、.(3)将x=7代入回归方程可以预测该家庭的月储蓄为y=0.37-0.4=1.7(千元).13.(2013大连一模)某工厂用甲、乙两种不同工艺生产一大批同一种零件,零件尺寸均在21.7,22.3(单位:cm)之间,把零件尺寸在21.9,22.1)的记为一等品,尺寸在21.8,21.9)22.1,22.2)的记为二等品,尺寸在21.7,21.8)22.2,22.3的记为三等品,现从甲、乙工艺生产的零件中各随机抽取100件产品,所得零件尺寸的频率分布直方图如图所示:(1)根据上述数据完成下列22列联表,根据此数据你是否有95%的把握认为选择不同的工艺与生产出一等品有关?甲工艺乙工艺合计一等品非一等
8、品合计P(K2k0)0.050.01k03.8416.635(2)若一等品、二等品、三等品的单件利润分别为30元、20元、15元,求出上述甲工艺所抽取的100件产品的单件利润的平均数.解:(1)22列联表如表:甲工艺乙工艺合计一等品5060110非一等品504090合计100100200K2=2.02b,a(B)b,a(C)a(D)b,a解析:由两组数据(1,0)和(2,2)可求b=2,a=0-21=-2.利用线性回归方程的公式与已知表格中的数据,可求得=,=-=-=-,所以a.故选C.15.已知x,y之间的一组数据如表:x23456y34689对于表中数据,现给出如下拟合直线:y=x+1;y
9、=2x-1;y=x-;y=x.则根据最小二乘法的思想求得拟合程度最好的直线是(填序号).解析:由题意知=4,=6,=,=-=-,=x-,填.答案:16.(2013韶关市高考模拟)以下四个命题:在一次试卷分析中,从每个试室中抽取第5号考生的成绩进行统计,这种抽样方法是简单随机抽样;样本数据:3,4,5,6,7的方差为2;对于相关系数r,|r|越接近1,则线性相关程度越强;通过随机询问110名性别不同的行人,对过马路是愿意走斑马线还是愿意走人行天桥进行抽样调查,得到如下的列联表:男女总计走天桥402060走斑马线203050总计6050110由K2=7.8.则有99%以上的把握认为“选择过马路的方式与性别有关”,其中正确命题的序号是.附表:P(K2k)0.0500.0100.001k3.8416.63510.828解析:对于,易知该抽样方法属于系统抽样,因此不正确;对于,该组数据的平均数是(3+4+5+6+7)=5,方差是(222+122+02)=2,因此正确;对于,由相关系数的意义得知,正确;对于,注意到7.86.635,因此有99%以上的把握认为“选择过马路的方式与性别有关”,正确.答案: