1、第3节变量间的相关关系与独立性检验课时训练 练题感 提知能【选题明细表】知识点、方法题号相关关系的判定1、14回归直线2、3、6、9、10、12独立性检验5、8、13综合应用4、5、7、11、14一、选择题1.(2013衡水中学模拟)对四组数据进行统计,获得以下散点图,关于其相关系数比较,正确的是(A)(A)r2r40r3r1(B)r4r20r1r3(C)r4r20r3r1(D)r2r40r1r30,又(2)(4)为负相关且(2)较集中在直线附近,(4)较分散,所以r2r40.综上得r2r40r3r1.故选A.2.某产品的广告费用x与销售额y的统计数据如表:广告费用x(万元)4235销售额y(
2、万元)49263954根据表可得回归方程=x+中的为9.4,据此模型预报广告费用为6万元时销售额为(B)(A)63.6万元(B)65.5万元(C)67.7万元(D)72.0万元解析:样本中心点是(3.5,42),则=-=42-9.43.5=9.1,所以回归方程是=9.4x+9.1,把x=6代入得=65.5.故选B.3.(2013青岛市模拟)某商品销售量y(件)与销售价格x(元/件)负相关,则其回归方程可能是(A)(A)=-10x+200(B)=10x+200(C)=-10x-200(D)=10x-200解析:由于销售量y与销售价格x负相关,因此回归方程中的系数6.635,故有99%的把握确认这
3、两个变量间有关系,正确.故选B.6.(2013年高考福建卷)已知x与y之间的几组数据如表:x123456y021334假设根据如表数据所得线性回归直线方程为=x+,若某同学根据表中的前两组数据(1,0)和(2,2)求得的直线方程为y=bx+a,则以下结论正确的是(C)(A)b,a(B)b,a(C)a(D)b,a解析:由两组数据(1,0)和(2,2)可求b=2,a=0-21=-2.利用线性回归方程的公式与已知表格中的数据,可求得=,=-=-=-,所以a.故选C.二、填空题7.(2013济南三模)某市居民20092013年家庭年平均收入x(单位:万元)与年平均支出Y(单位:万元)的统计资料如表所示
4、:年份20092010201120122013年平均收入x11.512.11313.315年平均支出Y6.88.89.81012根据统计资料,居民家庭年平均收入的中位数是,家庭年平均收入与年平均支出有线性相关关系.解析:5个x值是按从小到大的顺序排列的,因此居民家庭年平均收入的中位数是13万元.以家庭年平均收入x作为x轴,年平均支出Y作为y轴,描点得到散点图如图所示:观察散点图可知,这些点大致分布在一条直线的附近,且总体呈上升趋势,因此家庭年平均收入与年平均支出有正线性相关关系.答案:13万元正8.为了判断高中三年级学生选修文科是否与性别有关,现随机抽取50名学生,得到22列联表:理科文科合计
5、男131023女72027合计203050已知P(K23.841)0.05,P(K25.024)0.025.根据表中数据,得到K2=4.844,则认为选修文科与性别有关系出错的可能性约为.解析:由K2=4.8443.841.故认为选修文科与性别有关系出错的可能性约为5%.答案:5%9.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如表),由最小二乘法求得回归方程=0.67x+54.9.现发现表中有一个数据模糊看不清,请你推断出该数据的值为.解析:依题意,=(10+20+30+40+50)=30.由于直线=0.67x+54.9必过点(,),于是有=0
6、.6730+54.9=75,因此表中的模糊数据是755-(62+75+81+89)=68.答案:6810.已知x,y之间的一组数据如表:x23456y34689对于表中数据,现给出如下拟合直线:y=x+1;y=2x-1;y=x-;y=x.则根据最小二乘法的思想求得拟合程度最好的直线是(填序号).解析:由题意知=4,=6,=,=-=-,=x-,填.答案:11.某工厂经过技术改造后,降低了能源消耗,经统计该厂某种产品的产量x(单位:吨)与相应的生产能耗y(单位:吨)有如下几组样本数据:x3456y2.5344.5根据相关性检验,这组样本数据具有线性相关关系,通过线性回归分析,求得回归直线的斜率为0
7、.7.已知该产品的年产量为10吨,则该工厂每年的生产能耗大约为吨.解析:由题知,=4.5,=3.5,故样本数据的中心点为A(4.5,3.5).设回归方程为=0.7x+,将中心点坐标代入得:3.5=0.74.5+,解得=0.35,故回归方程为=0.7x+0.35,所以当x=10时,=0.710+0.35=7.35,即该工厂每年的生产能耗大约为7.35吨.答案:7.35【教师备用】 有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到列联表:优秀非优秀总计甲班10b乙班c30总计105已知在全部105人中随机抽取1人,成绩优秀的概率为,则下列说法正确的是.列联表
8、中c的值为30,b的值为35列联表中c的值为15,b的值为50根据列联表中的数据,若按95%的可靠性要求,能认为“成绩与班级有关系”根据列联表中数据,若按95%的可靠性要求,不能认为“成绩与班级有关系”解析:由题意知,成绩优秀的学生人数是105=30,成绩非优秀的学生数是105-30=75,所以c=20,b=45,和错误.根据列联表中的数据,得到K2的观测值为k=6.1093.841,因此有95%的把握认为“成绩与班级有关系”,正确,而错误.答案:三、解答题12.(2013年高考重庆卷)从某居民区随机抽取10个家庭,获得第i个家庭的月收入xi(单位:千元)与月储蓄yi(单位:千元)的数据资料,
9、算得xi=80,yi=20,xiyi=184,=720.(1)求家庭的月储蓄y对月收入x的线性回归方程y=bx+a;(2)判断变量x与y之间是正相关还是负相关;(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.附:线性回归方程y=bx+a中,b=,a=-b,其中,为样本平均值,线性回归方程也可写为=x+.解:(1)由题意知n=10,=8,=2,又-n=720-1082=80,xiyi-n=184-1082=24,由此得b=0.3,a=-b=2-0.38=-0.4,故所求回归方程为y=0.3x-0.4.(2)由于变量y的值随x值的增加而增加(b=0.30),故x与y之间是正相关.(3)将
10、x=7代入回归方程可以预测该家庭的月储蓄为y=0.37-0.4=1.7(千元).13.为调查某社区居民的业余生活状况,研究这一社区居民在20:0022:00时间段的休闲方式与性别的关系,随机调查了该社区80人,得到数据表:休闲方式性别看电视看书合计男105060女101020合计206080(1)根据表中数据估计该社区居民在这一时间段以看书为休闲方式的概率和女性以看电视为休闲方式的概率;(2)根据以上数据,能否有99%的把握认为“在20:0022:00时间段居民的休闲方式与性别有关系”?参考公式:K2=,其中n=a+b+c+d.参考数据:P(K2k0)0.150.100.050.0250.01
11、0k02.0722.7063.8415.0246.635解:(1)由表可知该社区居民以看书为休闲方式的概率为=,女性以看电视为休闲方式的概率为=.(2)根据样本提供的22列联表得K2=8.8896.635.所以我们有99%的把握认为“在20:0022:00时间段居民的休闲方式与性别有关”.14.(2013大连一模)某工厂用甲、乙两种不同工艺生产一大批同一种零件,零件尺寸均在21.7,22.3(单位:cm)之间,把零件尺寸在21.9,22.1)的记为一等品,尺寸在21.8,21.9)22.1,22.2)的记为二等品,尺寸在21.7,21.8)22.2,22.3的记为三等品,现从甲、乙工艺生产的零
12、件中各随机抽取100件产品,所得零件尺寸的频率分布直方图如图所示:(1)根据上述数据完成下列22列联表,根据此数据你是否有95%的把握认为选择不同的工艺与生产出一等品有关?甲工艺乙工艺合计一等品非一等品合计P(K2k0)0.050.01k03.8416.635(2)若一等品、二等品、三等品的单件利润分别为30元、20元、15元,求出上述甲工艺所抽取的100件产品的单件利润的平均数.解:(1)22列联表如表:甲工艺乙工艺合计一等品5060110非一等品504090合计100100200K2=2.023.841,所以没有95%的把握认为选择不同的工艺与生产出一等品有关.(2)甲工艺抽取的100件产品中,一等品有50件,二等品有30件,三等品有20件,所以这100件产品单件利润的平均数为(5030+3020+2015)=24.