1、统计案例一、选择题(本大题共10小题,每小题5分,共50分)1对于自变量x和因变量y,当x取值一定时,y的取值带有一定的随机性,x,y之间的这种非确定性关系叫()A函数关系B线性关系C相关关系 D回归关系解析:选C由相关关系的概念可知,C正确2在一线性回归模型中,计算其相关指数R20.96,下面哪种说法不够妥当()A该线性回归方程的拟合效果较好B解释变量对于预报变量变化的贡献率约为96%C随机误差对预报变量的影响约占4%D有96%的样本点在回归直线上解析:选D由相关指数R2表示的意义可知A、B、C三种说法都很妥当,相关指数R20.96,其值较大,说明残差平方和较小,绝大部分样本点分布在回归直线
2、附近,不一定有96%的样本点在回归直线上,故选D.3下表显示出样本中变量y随变量x变化的一组数据,由此判断它最可能是()x45678910y14181920232528A线性函数模型 B二次函数模型C指数函数模型 D对数函数模型解析:选A画出散点图(图略)可以得到这些样本点在某一条直线上或该直线附近,故最可能是线性函数模型4下表是某厂14月份用水量(单位:百吨)的一组数据:月份x1234用水量y4.5432.5由散点图可知,用水量y与月份x之间有较好的线性相关关系,其线性回归方程是0.7x,则()A10.5 B5.15C5.2 D5.25解析:选D样本点的中心为(2.5,3.5),将其代入线性
3、回归方程可解得5.25.5下面的等高条形图可以说明的问题是()A“心脏搭桥”手术和“血管清障”手术对“诱发心脏病”的影响是绝对不同的B“心脏搭桥”手术和“血管清障”手术对“诱发心脏病”的影响没有什么不同C此等高条形图看不出两种手术有什么不同的地方D“心脏搭桥”手术和“血管清障”手术对“诱发心脏病”的影响在某种程度上是不同的,但是没有100%的把握解析:选D由等高条形图可知选项D正确6根据一位母亲记录儿子39岁的身高数据,建立儿子身高(单位:cm)对年龄(单位:岁)的线性回归方程为7.19x73.93,若用此方程预测儿子10岁时的身高,有关叙述正确的是()A身高一定为145.83 cmB身高大于
4、145.83 cmC身高小于145.83 cmD身高在145.83 cm左右解析:选D用线性回归方程预测的不是精确值,而是估计值当x10时,y145.83,只能说身高在145.83 cm左右7在22列联表中,下列哪两个比值相差越大,两个分类变量有关系的可能性就越大()A.与 B.与C.与 D.与解析:选A当ad与bc相差越大,两个分类变量有关系的可能性越大,此时与相差越大8如图,5个(x,y)数据,去掉D(3,10)后,下列说法错误的是()A相关系数r变大B残差平方和变大C相关指数R2变大D解释变量x与预报变量y的相关性变强解析:选B由散点图知,去掉D后,x与y的相关性变强,且为正相关,所以r
5、变大,R2变大,残差平方和变小9为了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机抽取了60名高中生,通过问卷调查,得到以下数据:作文成绩优秀作文成绩一般总计课外阅读量较大221032课外阅读量一般82028总计303060由以上数据,计算得到K2的观测值k9.643,根据临界值表,以下说法正确的是()A没有充足的理由认为课外阅读量大与作文成绩优秀有关B有0.5%的把握认为课外阅读量大与作文成绩优秀有关C有99.9%的把握认为课外阅读量大与作文成绩优秀有关D有99.5%的把握认为课外阅读量大与作文成绩优秀有关解析:选D根据临界值表,9.6437.879,在犯错误的概率不超过0.005的
6、前提下,认为课外阅读量大与作文成绩优秀有关,即有99.5%的把握认为课外阅读量大与作文成绩优秀有关10两个分类变量X和Y,值域分别为x1,x2和y1,y2,其样本频数分别是a10,b21,cd35.若X与Y有关系的可信程度不小于97.5%,则c等于()A3B4C5D6解析:选A列22列联表如下:x1x2总计y1102131y2cd35总计10c21d66故K2的观测值k5.024.把选项A,B,C,D代入验证可知选A.二、填空题(本大题共4小题,每小题5分,共20分)11给出下列关系:人的年龄与他(她)拥有的财富之间的关系;曲线上的点与该点的坐标之间的关系;苹果的产量与气候之间的关系;森林中的
7、同一种树木,其断面直径与高度之间的关系;学生与他(她)的学号之间的关系其中有相关关系的是_解析:利用相关关系的概念判断是不确定关系曲线上的点与该点坐标是一种对应关系,即每一个点对应一个坐标,是确定关系学生与其学号也是确定的对应关系答案:12已知回归直线的斜率的估计值是1.23,样本点的中心为(4,5),则回归直线方程是_解析:设回归直线的方程为x.回归直线的斜率的估计值是1.23,即1.23,又回归直线过样本点的中心(4,5),所以51.234,解得0.08,故回归直线的方程为1.23x0.08.答案:1.23x0.0813某单位为了了解用电量y(度)与气温x()之间的关系,随机统计了某4天的
8、用电量与当天气温,并制作了对照表由表中数据得线性回归方程x,其中2.现预测当气温为4时,用电量的度数约为_.用电量y(度)24343864气温x()1813101解析:由题意可知(1813101)10,(24343864)40,2.又回归直线2x过点(10,40),故60,所以当x4时,2(4)6068.答案:6814某部门通过随机调查89名工作人员的休闲方式是看电视还是运动,得到的数据如下表:看电视运动总计女243155男82634总计325789你认为性别与休闲方式有关系的把握为_解析:由列联表中的数据,得K2的观测值为k3.6892.706,因此,在犯错误的概率不超过0.10的前提下认为
9、性别与休闲方式有关系,即认为性别与休闲方式有关系的把握为90%.答案:90%三、解答题(本大题共4小题,共50分解答时应写出文字说明,证明过程或运算步骤)15(本小题满分12分)有两个分类变量x与y,其一组观测值如下面的22列联表所示:y1y2x1a20ax215a30a其中a,15a均为大于5的整数,则a取何值时,在犯错误的概率不超过0.1的前提下认为x与y之间有关系?解:查表可知,要使在犯错误的概率不超过0.1的前提下认为x与y之间有关系,则k2.706,而k.由k2.706得a7.19或a2.04.又a5且15a5,aZ,即a8或9,故a为8或9时,在犯错误的概率不超过0.1的前提下认为
10、x与y之间有关系16(本小题满分12分)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此做了4次试验,得到数据如下:零件的个数x(个)2345加工的时间y(小时)2.5344.5(1)在给定坐标系中画出表中数据的散点图;(2)求y关于x的线性回归方程x;(3)试预测加工10个零件需要的时间解:(1)散点图如图所示:(2)由题中表格数据得3.5,3.5, (xi)(yi)3.5, (xi)25,由公式计算得0.7,1.05,所以所求线性回归方程为0.7x1.05.(3)当x10时,0.7101.058.05,所以预测加工10个零件需要8.05小时17(本小题满分12分)通过随机询问某校
11、110名高中学生在购买食物时是否看营养说明,得到如下列联表:男女总计看营养说明503080不看营养说明102030总计6050110(1)从这50名女生中按是否看营养说明分层抽样,抽取一个容量为5的样本,问样本中看与不看营养说明的女生各有多少名?(2)从(1)中的5名女生中随机选取2名进行深度访谈,求选到看与不看营养说明的女生各1名的概率;(3)根据以上列联表,问能否在犯错误的概率不超过0.010的前提下认为“性别与在购买食物时看营养说明有关系”?参考公式:K2,其中nabcd.参考数据:P(K2k0)0.100.050.0250.0100.005k02.7063.8415.0246.6357
12、.879解:(1)根据分层抽样可得,样本中看营养说明的女生有303名,样本中不看营养说明的女生有202名(2)记样本中看营养说明的3名女生为a1,a2,a3,不看营养说明的2名女生为b1,b2,从这5名女生中随机选取2名,共有10个等可能的基本事件:(a1,a2),(a1,a3),(a1,b1),(a1,b2),(a2,a3),(a2,b1),(a2,b2),(a3,b1),(a3,b2),(b1,b2)其中事件A“选到看与不看营养说明的女生各1名”包含了6个基本事件:(a1,b1),(a1,b2),(a2,b1),(a2,b2),(a3,b1),(a3,b2)所以所求的概率P(A).(3)根
13、据题中的列联表得K27.486.由P(K26.635)0.010可知,在犯错误的概率不超过0.010的前提下认为该校高中学生“性别与在购买食物时看营养说明有关系”18(本小题满分14分)在关于人的脂肪含量(百分比)和年龄的关系的研究中,研究人员获得了一组数据如下表:年龄x2327394145495053545657586061脂肪含量y9.517.821.225.927.526.328.229.630.231.430.833.535.234.6(1)作出散点图,并判断y与x是否线性相关,若线性相关,求线性回归方程;(2)求相关指数R2,并说明其含义;(3)给出37岁时人的脂肪含量的预测值解:(1)散点图如图所示由散点图可知样本点呈条状分布,脂肪含量与年龄有比较好的线性相关关系,因此可以用线性回归方程来刻画它们之间的关系设线性回归方程为x,则由计算器算得0.576,0.448,所以线性回归方程为0.576x0.448.(2)残差平方和: (yii)237.20,总偏差平方和: (yi)2644.99,R210.942,表明年龄解释了94.2%的脂肪含量变化(3)当x37时,0.576370.44820.9,故37岁时人的脂肪含量约为20.9%.