1、模块复习课第1课时统计案例课后篇巩固提升基础巩固1.下列说法:将一组数据中的每一个数据都加上或减去同一个常数后,方差不变;设有一个回归方程=3-5x,变量x增加1个单位时,y平均增加5个单位;线性回归方程x+必过点();在线性回归模型中,R2越接近于1,表示回归效果越差.其中错误的个数是()A.3B.2C.1D.0解析将一组数据中的每一个数据都加上或减去同一个常数后,方差不变,正确;设有一个回归方程=3-5x,变量x增加1个单位时,y平均减少5个单位,因此不正确;线性回归方程x+必过点(),正确;在线性回归模型中,R2越接近于1,表示回归效果越好,因此不正确.其中错误的个数是2.故选B.答案B
2、2.有人发现,看电视多容易使人变冷漠,下表是一个调查机构对此现象的调查结果:冷漠不冷漠总计看电视多6842110看电视少203858总计8880168则在犯错误的概率不超过()的前提下认为多看电视与人变冷漠有关系. A.0.001B.0.025C.0.05D.0.01解析可计算K2=11.37710.828,因此在犯错误的概率不超过0.001的前提下认为看电视多与人变冷漠有关系.答案A3.为了解某地的海拔y(单位:km)与气温x(单位:)之间的关系,随机统计了4次海拔与相应的气温,并制作了对照表:气温x/181310-1海拔y/km2.43.43.86.4由表中数据,得到线性回归方程=-0.2
3、x+.由此估计海拔为7.2 km处的气温为()A.-10 B.-8 C.-6 D.-4 解析因为=10,=4,所以样本点的中心为(10,4).由回归直线过样本点的中心,得4=-2+,求得=6.于是线性回归方程为=-0.2x+6,所以海拔为7.2 km处的气温为-6 .故选C.答案C4.下表显示出样本中变量y随变量x变化的一组数据,由此判断它最可能是()x45678910y14181920232528A.线性函数模型B.二次函数模型C.指数函数模型D.对数函数模型解析画出散点图(图略)可以得到这些样本点在某一条直线上或该直线附近,故最可能是线性函数模型.答案A5.在对于变量y与x的10组统计数据
4、的回归模型中,相关指数R2=0.95,又知残差平方和为120.53,则(yi-)2的值为()A.241.06B.2 410.6C.253.08D.2 530.8解析由R2=1-,得0.95=1-,又(yi-)2=120.53,所以(yi-)2=2 410.6.答案B6.如图所示的等高条形图可以说明的问题是()A.“心脏搭桥”手术和“血管清障”手术对“诱发心脏病”的影响是绝对不同的B.“心脏搭桥”手术和“血管清障”手术对“诱发心脏病”的影响没有什么不同C.此等高条形图看不出两种手术有什么不同的地方D.“心脏搭桥”手术和“血管清障”手术对“诱发心脏病”的影响在某种程度上是不同的,但是没有100%的
5、把握解析由等高条形图知,D正确.答案D7.为了解高中学生选择文理科是否与性别有关,随机调查了50名学生,得到如下列联表:理科文科合计男131023女72027合计203050已知P(K23.841)0.05,P(K25.024)0.025.根据表中数据,认为选择文理科与性别有关系此推断犯错误的概率不超过.解析因为K2=4.8443.841,所以认为选择文理科与性别有关系此推断犯错误的概率不超过0.05.答案0.058.若y与x之间的一组数据为x01234y13556则y对x的回归直线一定经过的点是.解析由表中数据得=2,=4.因回归直线必过样本点的中心(),所以y与x的回归直线一定经过的点是(
6、2,4).答案(2,4)9.有两个分类变量X与Y,其一组观测值如下表所示:y1y2x1a20-ax215-a30+a其中a,15-a均为大于5的整数,当a取何值时,在犯错误的概率不超过0.10的前提下认为X与Y之间有关系?解要在犯错误的概率不超过0.10的前提下认为X与Y有关系,则k2.706.而k=,则2.706,解得a7.194或a5,且15-a5,aZ,故a=8或a=9.故当a取8或9时,在犯错误的概率不超过0.10的前提下认为X与Y之间有关系.10.已知某连锁经营公司所属5个零售店某月的销售额(单位:千万元)和利润额(单位:千万元)如下:商店名称ABCDE销售额x35679利润额y23
7、345(1)画出散点图;(2)根据如下的参数公式与参考数据,求利润额y与销售额x之间的线性回归方程;(3)若该公司还有一个零售店某月销售额为10千万元,试估计它的利润额是多少.参考数据:xiyi=112,=200解(1)根据所给的五对数据(3,2),(5,3),(6,3),(7,4),(9,5)在坐标系中画出散点图.(2)由已知数据计算得n=5,=6,=3.4,b=0.5,把样本中心点(6,3.4)代入y=0.5x+a,得到a=3.4-0.56=0.4,则线性回归方程为=0.5x+0.4.(3)将x=10代入线性回归方程中得到=0.510+0.4=5.4(千万元),即当零售店某月销售额为10千
8、万元,估计它的利润额是5.4千万元.能力提升1.某地两防指挥部在汛期对当地一条河流连续进行监测,下表是最近几日该河流某段的水位情况.河流水位表(1)第x日第1日第2日第3日第4日第5日第6日第7日水位y/米3.53.73.83.94.34.44.8而根据河流的堤防情况规定:水位超过一定高度将分别启动相应预警措施(见下表),当水位达到保证水位时,防汛进入紧急状态,防汛部门要按照紧急防汛期的权限,采取各种必要措施,确保堤防等工程的安全,并根据“有限保证、无限负责”的精神,对于可能出现超过保证水位的工程抢护和人员安全做好积极准备.水位预警分级表(2)水位4.75.15.6水位分类设防水位警戒水位保证
9、水位预警颜色黄色橙色红色现已根据上表得到水位y的线性回归方程为=0.21x+3.217,据上表估计()A.第8日将要启动洪水橙色预警B.第10日将要启动洪水红色预警C.第11日将要启动洪水红色预警D.第12日将要启动洪水红色预警解析因为水位y的线性回归方程为=0.21x+3.217,A选项,第8日的水位是=0.218+3.217=4.897(4.7,5.1),将启动黄色预警,A不符合题意;B选项,第10日的水位是=0.2110+3.217=5.317(5.1,5.6),将启动橙色预警,B不符合题意;C选项,第11日 的水位是=0.2111+3.217=5.527(5.1,5.6),将启动橙色预
10、警,C不符合题意;D选项,第12日的水位是=0.2112+3.217=5.7375.6,将启动红色预警,D符合题意.故选D.答案D2.某种产品的广告支出费用x(单位:万元)与销售量y(单位:万件)之间的对应数据如下表所示:广告支出费用x/万元2.22.64.05.35.9销售量y/万件3.85.47.011.612.2根据表中的数据可得回归直线方程=2.27x-1.08,R20.96,以下说法正确的是()A.第三个样本点对应的残差=-1,回归模型的拟合效果一般B.第三个样本点对应的残差=1,回归模型的拟合效果较好C.销售量y的多少有96%是由广告支出费用引起的D.销售量y的多少有4%是由广告支
11、出费用引起的解析由题意得=7-(2.274-1.08)=-1,由于R20.96,所以该回归模型拟合的效果比较好,故A,B错误;在线性回归模型中R2表示解释变量对于预报变量的贡献率,R20.96,则销售量y的多少有96%是由广告支出费用引起的,C正确,D错误.故选C.答案C3.下列关于回归分析与独立性检验的说法正确的是. (填序号)回归分析和独立性检验没有什么区别;回归分析是对两个变量准确关系的分析,而独立性检验是分析两个变量之间的不确定性关系;回归分析研究两个变量之间的相关关系,独立性检验是对两个变量是否具有某种关系的一种检验;独立性检验可以100%确定两个变量之间是否具有某种关系.解析由回归
12、分析、独立性检验的意义知,回归分析与独立性检验都是研究两个变量之间的相关性,但方法与手段有所不同,研究角度不同,由其意义知,正确.答案4.某高校共有学生15 000 人,其中男生10 500人,女生4 500人,为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法.收集300名学生每周平均体育运动时间的样本数据(单位:小时).(1)应收集多少名女生的样本数据?(2)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据的分组区间为:0,2,(2,4,(4,6,(6,8,(8,10,(10,12.估计该校学生每周平均体育运动时间超过4小时的概率;(
13、3)在样本数据中,有60名女生的每周平均体育运动时间超过4小时,请完成每周平均体育运动时间与性别列联表,并判断能否在犯错误的概率不超过0.05的前提下认为该校学生的每周平均体育运动时间与性别有关系.附:K2=(其中n=a+b+c+d).P(K2k0)0.100.050.0100.005k02.7063.8416.6357.879解(1)300=90,所以应收集90名女生的样本数据.(2)由频率分布直方图得1-2(0.100+0.025)=0.75,所以该校学生每周平均体育运动时间超过4小时的概率的估计值为0.75.(3)由(2)知,300名学生中有3000.75=225(名)学生的每周平均体育
14、运动时间超过4小时,75名学生的每周平均体育运动时间不超过4小时.又因为样本数据中有210份是关于男生的,90份是关于女生的,所以每周平均体育运动时间与性别列联表如下:男生女生总计每周平均体育运动时间不超过4小时453075每周平均体育运动时间超过4小时16560225总计21090300结合列联表可算得K2=4.7623.841.所以能在犯错误的概率不超过0.05的前提下认为该校学生的每周平均体育运动时间与性别有关系.5.某种机械设备随着使用年限的增加,它的使用功能逐渐减退,使用价值逐年减少,通常把它使用价值逐年减少的“量”换算成费用,称之为“失效费”.某种机械设备的使用年限x(单位:年)与失效费y(单位:万元)的统计数据如下表所示:使用年限x/年24568失效费y/万元34567(1)求y关于x的线性回归方程;(2)估算该种机械设备使用10年的失效费.解(1)由表知,(2+4+5+6+8)=5,(3+4+5+6+7)=5,xiyi=23+44+55+66+87=139,=22+42+52+62+82=145,=0.7,又=5,=5-0.75=1.5,故y关于x的线性回归方程为y=0.7x+1.5.(2)当x=10时,y=0.710+1.5=8.5,即10年的失效费用为8.5万元.