1、温馨提示: 此套题为Word版,请按住Ctrl,滑动鼠标滚轴,调节合适的观看比例,答案解析附后。关闭Word文档返回原板块。课时分层提升练 五十六变量间的相关关系与统计案例(25分钟45分)一、选择题(每小题5分,共20分)1.有下列关于回归分析的说法:线性回归分析就是由样本点去寻找一条直线,使之贴近这些样本点的方法;利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系去表示;通过回归方程=x+可以估计变量的取值和观测变量的变化趋势;因为由任何一组观测值都可以求得一个线性回归方程,所以没有必要进行相关性检验.其中正确的个数是()A.1B.2C.3D.4【解析】选C.反映的是最小二乘法
2、的思想,故正确;反映的是散点图的作用,也正确;解释的是回归方程=x+的作用,也正确;是不正确的,在求回归方程之前必须进行相关性检验,以体现两变量的关系.2.(2017宜昌模拟)某市2015年前n个月空气质量优良的总天数Sn与n之间的关系如图所示,若前m月的月平均空气质量优良天数最大,则m值为()A.7B.9C.10D.12【解题提示】根据题意,结合图形,分析出平均值的几何意义为原点与该点连线的斜率,由此得出答案.【解析】选C.前n个月的总天数Sn与n在图中对应P(n,Sn)点,则前n个月的月平均值即为直线OP的斜率,由图易得当n=10时,直线OP的斜率最大,即前10个月的月平均值最高,故m的值
3、为10.3.(2017孝义模拟)已知x,y取值如表:x01456y1.3m3m5.67.4画散点图分析可知:y与x线性相关,且求得回归方程为=x+1,则m的值(精确到0.1)为()A.1.5B.1.6C.1.7D.1.8【解析】选C.将=3.2代入回归方程=x+1可得=4.2,则4m=6.7,解得m=1.675,即精确到0.1后m的值为1.7.4.(2017德州模拟)为了增强环保意识,某校从男生中随机抽取了60人,从女生中随机抽取了50人参加环保知识测试,统计数据如表所示,经计算K27.822,则在犯错误的概率不超过的前提下认为环保知识是否优秀与性别有关()优秀非优秀总计男生402060女生2
4、03050总计6050110附:K2=.P(K2k0)0.5000.1000.0500.0100.001k00.4552.7063.8416.63510.828A.0.100B.0.050C.0.010D.0.001【解题提示】根据K2的值,对照数表即可得出结论.【解析】选C.由题意,K27.8226.635,所以,在犯错误的概率不超过0.010的情况下认为环保知识是否优秀与性别有关.【加固训练】(2017安庆模拟)某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是()表1成绩性别不及格及格总计男6
5、1420女102232总计163652表2视力性别好差总计男41620女122032总计163652表3智商性别偏高正常总计男81220女82432总计163652表4阅读量性别丰富不丰富总计男14620女23032总计163652A.成绩B.视力C.智商D.阅读量【解析】选D.因为k1=,k2=,k3=,k4=,则有k4k2k3k1,所以阅读量与性别关联的可能性最大.二、填空题(每小题5分,共15分)5.(2017唐山模拟)某市居民20112015年家庭年平均收入x(单位:万元)与年平均支出y(单位:万元)的统计资料如表所示:年份20112012201320142015收入x11.512.1
6、1313.315支出y6.88.89.81012根据统计资料,居民家庭年平均收入的中位数是,家庭年平均收入与年平均支出有线性相关关系.【解析】由中位数的定义知,总体个数为奇数个时按大小顺序排列后中间一个是中位数,而偶数个时需取中间两数的平均数.由统计资料可以看出,当年平均收入增多时,年平均支出也增多,因此两者之间具有正线性相关关系.答案:13正6.为了考察是否喜欢运动与性别之间的关系,得到一个22列联表,经计算K2的观测值k=6.679,则在犯错误的概率不超过的前提下认为是否喜欢运动与性别有关系.本题可以参考独立性检验临界值表P(K2k0)0.500.400.250.150.100.050.0
7、250.0100.0050.001k00.4550.7081.3232.0722.7063.8415.0246.6357.87910.828【解析】由于K2=6.6796.635,所以在犯错误的概率不超过0.01的前提下认为是否喜欢运动与性别有关系.答案:0.01【加固训练】(2017深圳模拟)某中学将100名高一新生分成水平相同的甲,乙两个“平行班”,每班50人.陈老师采用A,B两种不同的教学方式分别在甲,乙两个班级进行教改实验.为了解教学效果,期末考试后,陈老师分别从两个班级中各随机抽取20名学生的成绩进行统计,作出茎叶图如下,记成绩不低于90分者为“成绩优秀”.由以上统计数据填写下面22
8、列联表,并判断是否有90%的把握认为“成绩优秀”与教学方式有关.甲班(A方式)乙班(B方式)总计成绩优秀成绩不优秀总计【解析】由已知数据得:甲班(A方式)乙班(B方式)总计成绩优秀156成绩不优秀191534总计202040根据22列联表中数据,K2=3.1372.706,所以有90%的把握认为“成绩优秀”与教学方式有关.7.(2017岳阳模拟)车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如下表),由最小二乘法求得回归方程=0.67x+54.9.零件数x(个)1020304050加工时间y(min)62758189现发现表中有一个数据看不清,请你推
9、断出该数据的值为.【解析】由已知可计算求出=30,而回归直线方程必过点(,),则=0.6730+54.9=75,设模糊数据为a,则=75,计算得a=68.答案:68三、解答题8.(10分)(2017成都模拟)随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:年份20102011201220132014时间代号t12345储蓄存款y(千亿元)567810(1)求y关于t的回归方程=t+.(2)用所求回归方程预测该地区2015年(t=6)的人民币储蓄存款.附:回归方程=t+中,=,=-.【解题提示】(1)直接利用回归系数公式求解即可.(2)利用回归方程代
10、入直接进行计算即可.【解析】(1)列表计算如下:itiyitiyi11515226412337921448163255102550153655120这里n=5,=ti=3,=yi=7.2.又-n=55-532=10,tiyi-n=120-537.2=12,从而=1.2,=-=7.2-1.23=3.6,故所求回归方程为=1.2t+3.6.(2)将t=6代入回归方程可预测该地区2015年的人民币储蓄存款为=1.26+3.6=10.8(千亿元).【加固训练】(2017湖南模拟)某城市100户居民的月平均用电量(单位:度)以160,180), 180,200),200,220),220,240),24
11、0,260),260,280),280,300分组的频率分布直方图如图.(1)求直方图中x的值.(2)求月平均用电量的众数和中位数.(3)在月平均用电量220,240),240,260),260,280),280,300的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在220,240)的用户中应抽取多少户?【解题提示】(1)由直方图的性质可得(0.002+0.0095+0.011+0.0125+x+0.005+0.0025)20=1,解方程可得.(2)直方图中众数为最高矩形上端的中点,中位数在220,240)内,设中位数为a,解方程(0.002+0.0095+0.011)20+0.
12、0125(a-220)=0.5可得.(3)可得各段的用户分别为25,15,10,5,可得抽取比例,可得要抽取的户数.【解析】(1)由直方图的性质可得(0.002+0.0095+0.011+0.0125+x+0.005 +0.0025)20=1,解方程可得x=0.0075,所以直方图中x的值为0.0075.(2)月平均用电量的众数是=230,因为(0.002+0.0095+0.011)20=0.450.5,所以月平均用电量的中位数在220,240)内,设中位数为a,由(0.002+0.0095+0.011)20+0.0125(a-220)=0.5可得a=224,所以月平均用电量的中位数为224.
13、(3)月平均用电量为220,240)的用户有0.012520100=25,月平均用电量为240,260)的用户有0.007520100=15,月平均用电量为260,280)的用户有0.00520100=10,月平均用电量为280,300的用户有0.002520100=5,所以抽取比例为=,所以月平均用电量在220,240)的用户中应抽取25=5户.(20分钟40分)1.(5分)(2017咸阳模拟)某产品的广告费用x与销售额y的统计数据如下表:根据下表可得回归方程=x+中的=10.6,据此模型预报广告费用为10万元时销售额为()广告费用x(万元)4235销售额y(万元)49263958A.112
14、.1万元B.113.1万元C.113.9万元D.111.9万元【解析】选D.因为=3.5,=43,将(3.5,43)代入=10.6x+中得=5.9,=10.6x+5.9,当x=10时,y=111.9.2.(5分)(2017鹰潭模拟)以下四个命题:从匀速传递的产品生产流水线上,质检员每20分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;两个随机变量相关性越强,则相关系数的绝对值越接近1;在回归方程=0.2x+12中,当解释变量x每增加一个单位时,预报变量平均增加0.2个单位;对分类变量X与Y,它们的随机变量K2的观测值k来说,k越小,“X与Y有关系”的把握程度越大.其中正确的是()A
15、.B.C.D.【解题提示】第一个命题应是一个系统抽样,这个说法不正确;两个随机变量相关性越强,则相关系数的绝对值越接近1;在回归方程中,代入一个x的值,得到的是预报值;对分类变量X与Y,它们的随机变量K2的观测值k来说,k越大,“X与Y有关系”的把握程度越大.【解析】选B.从匀速传递的产品生产流水线上,质检员每20分钟从中抽取一件产品进行某项指标检测,这样的抽样是系统抽样,故不正确;两个随机变量相关性越强,则相关系数的绝对值越接近1,正确;在回归方程=0.2x+12中,当解释变量x每增加一个单位时,预报变量平均增加0.2个单位,正确;对分类变量X与Y,它们的随机变量K2的观测值k来说,k越大,
16、“X与Y有关系”的把握程度越大,不正确.3.(5分)已知x,y之间的一组数据如下表:x23456y34689对于表中数据,现给出如下拟合直线:y=x+2;y=3x-1;y=x-;y=x.则根据最小二乘法的思想求得拟合程度最好的直线是(填序号).【解析】由题意知=4,=6,所以=,所以=-=-,所以=x-,所以填.答案:4.(12分)(2017柳州模拟)某城市城镇化改革过程中最近五年居民生活用水量逐年上升,下表是2011至2015年的统计数据:年份x20112012201320142015居民生活用水量y(万吨)236246257276286(1)利用所给数据求年居民生活用水量与年份之间的回归方
17、程=x+.(2)根据改革方案,预计在2020年底城镇化改革结束,到时候居民的生活用水量将趋于稳定,预计该城市2023年的居民生活用水量.参考公式:=,=-.【解题提示】(1)根据回归系数公式计算回归系数,得出回归方程.(2)由于到2020年用水量趋于稳定,故2023年的用水量约等于2020年的用水量,把x=2020代入回归方程求出用水量的估计值.【解析】(1)=2013,=260.2,(xi-)(yi-)=(-2)(-24.2)+(-1)(-14.2)+0+115.8+225.8=130.(xi-)2=4+1+0+1+4=10.所以=13,所以回归方程为-260.2=13(x-2013),即=
18、13(x-2013)+260.2.(2)当x=2020时,y=13(2020-2013)+260.2=351.2(万吨).答:该城市2023年的居民生活用水量预计为351.2万吨.5.(13分)(2017唐山模拟)二手车经销商小王对其所经营的某一型号二手汽车的使用年数x(0x10)与销售价格y(单位:万元/辆)进行整理,得到如表的对应数据:使用年数246810售价16139.574.5(1)试求y关于x的回归方程.(2)已知每辆该型号汽车的收购价格为w=0.05x2-1.75x+17.2万元,根据(1)中所求的回归方程,预测x为何值时,小王销售一辆该型号汽车所获得的利润z最大?【解题提示】(1
19、)由表中数据计算,求出,即可写出回归方程.(2)写出利润函数z=y-w,利用二次函数的图象与性质求出x,使z取得最大值.【解析】(1)由表中数据得,=(2+4+6+8+10)=6,=(16+13+9.5+7+4.5)=10,由公式求得=-1.45,=10-(-1.45)6=18.7,所以y关于x的回归方程为y=-1.45x+18.7.(2)根据题意,利润函数为z=y-w=(-1.45x+18.7)-(0.05x2-1.75x+17.2)=-0.05x2+0.3x+1.5,所以,当x=-=3时,二次函数z取得最大值;即预测x=3时,小王销售一辆该型号汽车所获得的利润z最大.关闭Word文档返回原板块