1、模块复习课MOKUAIFUXIKE第1课时统计案例课后篇巩固提升A组1.根据如下样本数据x345678y4.02.5-0.50.5-2.0-3.0得到的回归方程为y=bx+a,则()A.a0,b0,b0C.a0,b0D.a0答案A解析由散点图知b0,选A.2.具有线性相关关系的变量x,y,满足一组数据如下表所示.若y与x的回归直线方程为y=3x-,则m的值是()x0123y-11m8A.4B.C.5D.6答案A解析由已知得+2,又因为点()在直线y=3x-上,所以+2=3,得m=4.3.下列说法:将一组数据中的每一个数据都加上或减去同一个常数后,方差不变;设有一个回归方程y=3-5x,变量x增
2、加1个单位时,y平均增加5个单位;线性回归方程y=bx+a必过点();设具有相关关系的两个变量x,y的相关系数为r,则|r|越接近于0,x,y之间的线性相关程度越高.其中错误的个数是()A.3B.2C.1D.0答案B解析将一组数据中的每一个数据都加上或减去同一个常数后,方差不变,正确;设有一个回归方程y=3-5x,变量x增加1个单位时,y平均减少5个单位,因此不正确;线性回归方程y=bx+a必过点(),正确;设具有相关关系的两个变量x,y的相关系数为r,则|r|越接近于0,x,y之间的线性相关程度越弱,因此不正确.其中错误的个数是2.故选B.4.2017年元旦期间,某市通过随机询问100名性别
3、不同的居民是否能做到“光盘”行动,得到如下的列联表:不能做到“光盘”能做到“光盘”男4510女3015则下面的正确结论是()A.有90%以上的把握认为“该市居民能否做到光盘与性别有关”B.在犯错误的概率不超过1%的前提下,认为“该市居民能否做到光盘与性别无关”C.在犯错误的概率不超过1%的前提下,认为“该市居民能否做到光盘与性别有关”D.有90%以上的把握认为“该市居民能否做到光盘与性别无关”答案A解析由22列联表得到a=45,b=10,c=30,d=15,则a+b=55,c+d=45,a+c=75,b+d=25,ad=675,bc=300,n=100,计算得2=3.030.因为2.7063.
4、0303.841,有95%的把握认为“国籍和邮箱名称里是否含有数字有关”.8.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩后,得到如下的列联表.优秀非优秀合计甲班10乙班30合计105已知在全部105人中随机抽取1人为优秀的概率为.(1)请完成上面的列联表;(2)根据列联表的数据,若按95%的可靠性要求,能否认为“成绩与班级有关系”?(3)若按下面的方法从甲班优秀的学生中抽取一人:把甲班优秀的10名学生从2到11进行编号,先后两次抛掷一枚均匀的骰子,出现的点数之和为被抽取人的序号.试求抽到6或10号的概率.参考公式:2=解(1)优秀非优秀合计甲班10455
5、5乙班203050合计3075105(2)根据列联表中的数据,得到2=6.1093.841,因此有95%的把握认为“成绩与班级有关系”.(3)设“抽到6或10号”为事件A,先后两次抛掷一枚均匀的骰子,出现的点数为(x,y).所有的基本事件有(1,1),(1,2),(1,3),(6,6),共36个.事件A包含的基本事件有:(1,5),(2,4),(3,3),(4,2),(5,1),(4,6),(5,5),(6,4),共8个,P(A)=.B组1.四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直线方程,分别得到以下四个结论:y与x负相关且y=2.347x-6.423;y与x负相关
6、且y=-3.476x+5.648;y与x正相关且y=5.437x+8.493;y与x正相关且y=-4.326x-4.578.其中一定不正确的结论的序号是()A.B.C.D.答案D解析中,回归方程中x的系数为正,不是负相关;方程中的x的系数为负,不是正相关,一定不正确.2.某种产品的广告支出费用x(单位:万元)与销售量y(单位:万件)之间的对应数据如下表所示:广告支出费用x/万元2.22.64.05.35.9销售量y/万件3.85.47.011.612.2根据表中的数据可得回归直线方程y=2.27x-1.08,R20.96,以下说法正确的是()A.第三个样本点对应的残差e3=-1,回归模型的拟合
7、效果一般B.第三个样本点对应的残差e3=1,回归模型的拟合效果较好C.销售量y的多少有96%是由广告支出费用引起的D.销售量y的多少有4%是由广告支出费用引起的答案C解析由题意得e3=7-(2.274-1.08)=-1,由于R20.96,所以该回归模型拟合的效果比较好,故A,B错误;在线性回归模型中R2表示解释变量对于预报变量的贡献率,R20.96,则销售量y的多少有96%是由广告支出费用引起的,C正确,D错误.故选C.3.已知x与y之间的几组数据如下表:x123456y021334假设根据上表数据所得线性回归直线方程为y=bx+a.若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直
8、线方程为y=bx+a,则以下结论正确的是()A.bb,aaB.bb,aaC.baD.bb,aa答案C解析,代入公式得,b=,a=b,而b=2,a=-2,所以ba.4.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价x/元88.28.48.68.89销量y/件908483807568由表中数据,求得线性回归方程为y=-20x+a.若在这些样本点中任取一点,则它在回归直线左下方的概率为()A.B.C.D.答案B解析易得=8.5,=80,故a=-b=80-(-20)8.5=250,y=-20x+250,写成y+20x-250=0,令f(x,y)=y+20
9、x-250,由f(0,0)0且点(0,0)在回归直线的左下方可知,满足f(x,y)0的数据点均在回归直线的左下方,逐一验证可知使f(x,y)6.635,所以有99%的把握认为“学生性别与支持该活动有关系”.6.若8名学生的身高和体重数据如下表:编号12345678身高x/cm165165157170175165155170体重y/kg48575464614359第3名学生的体重漏填,但线性回归方程是y=0.849x-85.712,则第3名学生的体重估计为.答案50 kg解析设第3名学生的体重为a,根据样本点的中心一定在回归直线上,可得=0.849-85.712,解得a50.7.微信是现代生活进
10、行信息交流的重要工具,据统计,某公司200名员工中90%的人使用微信,其中每天使用微信时间在一小时以内的有60人,其余的员工每天使用微信的时间在一小时以上,若将员工分成青年(年龄小于40岁)和中年(年龄不小于40岁)两个阶段,那么使用微信的人中75%是青年人.若规定:每天使用微信时间在一小时以上为经常使用微信,那么经常使用微信的员工中是青年人.(1)若要调查该公司使用微信的员工经常使用微信与年龄的关系,列出22列联表:青年人中年人总计经常使用微信不经常使用微信总计(2)由列联表中所得数据判断,是否有99%的把握认为“经常使用微信与年龄有关”?(3)采用分层抽样的方法从“经常使用微信”的人中抽取
11、6人,从这6人中任选2人,求选出的2人均是青年人的概率.附:2=解(1)由已知可得,该公司员工中使用微信的有20090%=180人,经常使用微信的有180-60=120人,其中青年人有120=80人,使用微信的人中青年人有18075%=135人,所以22列联表:青年人中年人合计经常使用微信8040120不经常使用微信55560合计13545180(2)将列联表中数据代入公式可得:2=13.333,由于13.3336.635,所以有99%的把握认为“经常使用微信与年龄有关”.(3)从“经常使用微信”的人中抽取6人,其中,青年人有6=4人,中年人有6=2人,记4名青年人的编号分别为1,2,3,4,
12、2名中年人的编号分别为5,6,则从这6人中任选2人的基本事件有(1,2),(1,3),(1,4),(1,5),(1,6),(2,3),(2,4),(2,5),(2,6),(3,4),(3,5),(3,6),(4,5),(4,6),(5,6),共15个,其中选出的2人均是青年人的基本事件有(1,2),(1,3),(1,4),(2,3),(2,4),(3,4),共6个,故所求事件的概率为.8.某种机械设备随着使用年限的增加,它的使用功能逐渐减退,使用价值逐年减少,通常把它使用价值逐年减少的“量”换算成费用,称之为“失效费”.某种机械设备的使用年限x(单位:年)与失效费y(单位:万元)的统计数据如下
13、表所示:使用年限x/年24568失效费y/万元34567(1)根据上表数据,计算y与x的相关系数r,并说明y与x的线性相关性的强弱.(已知:0.75|r|1,则认为y与x线性相关性很强;0.3|r|0.75,则认为y与x线性相关性一般;|r|0.3,则认为y与x线性相关性较弱)(2)求y关于x的线性回归方程,并估算该种机械设备使用10年的失效费.r=,b=,a=-b.解(1)由表知,(2+4+5+6+8)=5,(3+4+5+6+7)=5,xiyi=23+44+55+66+87=139,=22+42+52+62+82=145,=32+42+52+62+72=135,r=9.898,故0.75r1,认为y与x线性相关性很强.(2)由(1)知,b=0.7,又=5,a=-b=5-0.75=1.5,故y关于x的线性回归方程为y=0.7x+1.5,当x=10时,y=0.710+1.5=8.5(万元),即10年的失效费用为8.5万元.