1、章末检测试卷(一)(时间:120分钟满分:150分)一、选择题(本大题共12小题,每小题5分,共60分)1对有线性相关关系的两个变量建立的线性回归方程x中,回归系数 ()A可以小于0 B大于0C能等于0 D只能小于0考点线性回归分析题点回归直线的概念答案A解析0时,则r0,这时不具有线性相关关系,但可以大于0也可以小于0.2一位母亲记录了儿子39岁的身高,由此建立的身高与年龄的回归模型为y7.19x73.93.用这个模型预测这个孩子10岁时的身高,则正确的叙述是()A身高一定是145.83 cmB身高在145.83 cm以上C身高在145.83 cm以下D身高在145.83 cm左右考点线性回
2、归分析题点回归直线的应用答案D 解析根据回归模型,估计值是145.83 cm左右3下表显示出样本中变量y随变量x变化的一组数据,由此判断它最可能是()x45678910y14181920232528A.线性函数模型 B二次函数模型C指数函数模型 D对数函数模型考点回归分析题点建立回归模型的基本步骤答案A解析画出散点图(图略)可以得到这些样本点在某一条直线上或该直线附近,故最可能是线性函数模型4为了探究患慢性气管炎与吸烟有无关系,调查了339名50岁以上的人,结果如下表所示,则认为50岁以上的人患慢性气管炎与吸烟习惯有关系的把握大约为()患慢性气管炎未患慢性气管炎总计吸烟43162205不吸烟1
3、3121134总计56283339A.98% B99.5%C99% D90%考点独立性检验思想的应用题点独立性检验在分类变量中的应用答案C 解析设患慢性气管炎与吸烟无关a43,b162,c13,d121,ab205,cd134,ac56,bd283,n339.所以K2的观测值为k7.469.因此k6.635,故有99%的把握认为患慢性气管炎与吸烟有关5下表是性别与是否喜欢足球的统计列联表,依据表中的数据,可得到()喜欢足球不喜欢足球总计男402868女51217总计454085A.观测值k9.564 B观测值k3.564C观测值k3.841考点分类变量与列联表题点求观测值答案D解析由题意可得K
4、2的观测值k4.7223.841,故选D.6为了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机抽取60名高中生做问卷调查,得到以下数据:()作文成绩优秀作文成绩一般总计课外阅读量较大221032课外阅读量一般82028总计303060则下列说法正确的是()A在样本数据中没有发现足够证据支持结论“作文成绩优秀与课外阅读量大有关”B在犯错误的概率不超过0.001的前提下认为“作文成绩优秀与课外阅读量大有关”C在犯错误的概率不超过0.05的前提下认为“作文成绩优秀与课外阅读量大有关”D在犯错误的概率不超过0.005的前提下认为“作文成绩优秀与课外阅读量大有关”考点独立性检验思想的应用题点独立
5、性检验在分类变量中的应用答案D解析由题意可得K2的观测值k9.6437.879,故在犯错误的概率不超过0.005的前提下认为作文成绩优秀与课外阅读量大有关故选D.7某个服装店经营某种服装,在某周内获纯利y(元),与该周每天销售这种服装件数x之间的一组数据关系见表:x(件)3456789y(元)66697381899091已知280,45 309,iyi3 487,纯利y与每天销售件数x之间线性相关,则线性回归方程为()A.4.75x51.36 B.4.57x52.08C.4.57x52.08 D.4.57x5.08考点线性回归方程题点求线性回归方程答案A 解析据题意,得6,79.86.因为y与
6、x有线性相关关系,设线性回归方程为x,则4.75,79.8664.7551.36.所以线性回归方程为4.75x51.36,故选A.8根据如下样本数据x345678y4.02.50.50.52.03.0得到的回归方程为x,则()A.0,0 B.0,0C.0 D.0,0考点线性回归分析题点线性回归方程的应用答案B解析作出散点图如下:观察图象可知,回归直线x的斜率0.故0,2.10高三某班学生每周用于数学学习的时间x(单位:小时)与数学成绩y(单位:分)之间有如下数据:x24152319161120161713y92799789644783687159根据上表可得回归方程的系数3.53.若某学生每周
7、用于数学学习的时间为18小时,则可预测该学生的数学成绩(结果保留整数)是()A71分 B80分 C74分 D77分考点线性回归分析题点线性回归方程的应用答案D解析学生每周用于数学学习的时间的平均值17.4(小时),数学成绩的平均值74.9(分),所以74.93.5317.413.478.当x18时,3.531813.47877.01877,所以预测该学生的数学成绩为77分11某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是()表1成绩性别不及格及格总计男61420女102232总计163652表2
8、视力性别好差总计男41620女122032总计163652表3智商性别偏高正常总计男81220女82432总计163652表4阅读量性别丰富不丰富总计男14620女23032总计163652A成绩 B视力C智商 D阅读量考点独立性检验及其基本思想题点独立性检验的方法答案D解析结合各列联表中数据,得K2的观测值分别为k1,k2,k3,k4.因为k1,k2,k3,k4,则k4k2k3k1,所以阅读量与性别有关联的可能性最大12.设(x1,y1),(x2,y2),(xn,yn)是变量x和y的n个样本点,直线l是由这些样本点通过最小二乘法得到的回归直线(如图所示),以下结论中正确的是()Ax和y的相关
9、系数为直线l的斜率Bx和y的相关系数在0到1之间C当n为偶数时,分布在l两侧的样本点的个数一定相同D直线l过点(,)考点线性回归分析题点线性回归方程的应用答案D解析两个变量的相关系数不是直线的斜率,有专门的计算公式,所以A错误;两个变量的相关系数在1到0之间,所以B错误;C中n为偶数时,分布在l两侧的样本点的个数可以不相同,所以C错误;根据线性回归方程一定经过样本点中心可知D正确二、填空题(本大题共4小题,每小题5分,共20分)13调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的线性回归方程为0.
10、254x0.321.由线性回归方程可知,家庭年收入每增加1万元,年饮食支出平均增加_万元考点线性回归分析题点回归直线的应用答案0.254解析线性回归方程x中字母的意义为随着自变量增加或减少1个单位的函数值的变化量,即函数的平均变化率本题中年收入每增加1万元,年饮食支出平均增加0.254万元14统计推断,当_时,有95%的把握认为事件A与B有关;当_时,认为没有充分的证据显示事件A与B是有关的考点分类变量与列联表题点求观测值答案k3.841k2.706解析当k3.841时,就有95%的把握认为事件A与B有关,当k2.706时认为没有充分的证据显示事件A与B是有关的15若一组观测值(x1,y1),
11、(x2,y2),(xn,yn)之间满足yibxiaei(i1,2,n)若ei恒为0,则R2为_考点残差分析与相关指数题点残差及相关指数的运算答案1 解析ei恒为0,说明随机误差对yi贡献为0.16已知x,y之间的一组数据如下表:x23456y34689对于表中数据,现给出如下拟合直线:yx1;y2x1;yx;yx.其中拟和效果最好的是_考点两个模型拟合效果的比较题点两个模型拟合效果的比较答案解析根据最小二乘法得变量x与y间的线性回归方程必过点(,),则4,6,拟合直线不过点(4,6)对于,yx,当x4时,y6,当x6 时,y9.2,对于,yx,当x4时,y6,当x6时,y9.综上可知,拟合效果
12、最好的直线是.三、解答题(本大题共6小题,共70分)17(10分)为了调查某大学学生在某天上网的时间,随机对100名男生和100名女生进行了不记名的问卷调查,得到了如下的统计结果:表1:男生上网时间与频数分布表上网时间(分)30,40)40,50)50,60)60,70)70,80人数525302515表2:女生上网时间与频数分布表上网时间(分)30,40)40,50)50,60)60,70)70,80人数1020402010(1)若该大学共有女生750人,试估计其中上网时间不少于60分钟的人数;(2)完成下面的22列联表,并回答能否有90%的把握认为“大学生上网时间与性别有关”.上网时间少于
13、60分钟上网时间不少于60分钟总计男生女生总计附:K2,其中nabcd为样本容量.P(K2k0)0.500.400.250.150.10k00.4550.7081.3232.0722.706P(K2k0)0.050.0250.0100.0050.001k03.8415.0246.6357.87910.828考点独立性检验及其基本思想题点独立性检验的方法解(1)设上网时间不少于60分钟的人数为x,依题意有,解得x225,所以估计其中上网时间不少于60分钟的人数是225.(2)22列联表如下:上网时间少于60分钟上网时间不少于60分钟总计男生6040100女生7030100总计13070200由表
14、中数据可得到K22.200.75,因此,y与x之间具有很强的线性相关关系于是由公式,得0.729,0.863,那么y与x之间的线性回归方程为0.729x0.863,由0.729x0.86310,得x14.90115,即每小时有缺点的物件数不超过10时,机器的速度每秒不得超过15转19(12分)有人发现了一个有趣的现象,中国人的邮箱名称里含有数字的比较多,而外国人的邮箱名称里含有数字的比较少为了研究国籍和邮箱名称里是否含有数字的关系,他收集了124个邮箱名称,其中中国人的70个,外国人的54个,中国人的邮箱中有43个含数字,外国人的邮箱中有21个含数字(1)根据以上数据建立一个22列联表;(2)
15、他发现在这组数据中,外国人的邮箱名称里含数字的也不少,他不能断定国籍和邮箱名称里含有数字是否有关,你能帮他判断一下吗?考点独立性检验及其基本思想题点独立性检验的方法解(1)22列联表如下:中国人外国人总计有数字432164无数字273360总计7054124(2)假设“国籍和邮箱名称里是否含有数字无关”由表中数据得k6.201,因为k5.024,所以有理由认为假设“国籍和邮箱名称里是否含有数字无关”是不合理的,即有97.5%的把握认为“国籍和邮箱名称里是否含有数字有关”20(12分)针对时下的“韩剧热”,某校团委对“学生性别和是否喜欢韩剧是否有关”作了一次调查,其中女生人数是男生人数的,男生喜
16、欢韩剧的人数占男生人数的,女生喜欢韩剧的人数占女生人数的.(1)若有95%的把握认为是否喜欢韩剧和性别有关,则男生至少有多少人;(2)若没有充分的证据显示是否喜欢韩剧和性别有关,则男生至多有多少人考点独立性检验及其基本思想题点独立性检验的方法解设男生人数为x,依题意可得列联表如下:喜欢韩剧不喜欢韩剧总计男生x女生总计x(1)若有95%的把握认为是否喜欢韩剧和性别有关,则k3.841,由K23.841,解得x10.24,为正整数,若有95%的把握认为是否喜欢韩剧和性别有关,则男生至少有12人(2)若没有充分的证据显示是否喜欢韩剧和性别有关,则k2.706,由K22.706,解得x7.216,为正
17、整数,若没有充分的证据显示是否喜欢韩剧和性别有关,则男生至多有6人21(12分)关于某设备的使用年限x和所支出的维修费用y(万元)有如下的统计资料:x1234y0.511.53(1)试用最小二乘法求出y关于x的线性回归方程;(2)求相关指数R2,并说明使用年限对维修费用的影响占百分之几?考点残差分析与相关指数题点残差及相关指数的应用解(1),30,iyi19,.线性回归方程为x,(2)依据题意,得yi0.511.53i0.31.11.92.7i0.20.10.40.3R2110.914,故使用年限对维修费用的影响占91.4%.22(12分)为了解中学生课余观看热门综艺节目“爸爸去哪儿”是否与性
18、别有关,某中学一研究性学习小组从该校学生中随机抽取了n人进行问卷调查调查结果表明:女生中喜欢观看该节目的占女生总人数的,男生喜欢看该节目的占男生总人数的.随后,该小组采用分层抽样的方法从这n份问卷中继续抽取了5份进行重点分析,知道其中喜欢看该节目的有3人(1)现从重点分析的5人中随机抽取了2人进行现场调查,求这两人都喜欢看该节目的概率;(2)若有99%的把握认为“爱看该节目与性别有关”,则参与调查的总人数n至少为多少?参考数据:P(K2k0)0.0500.0250.0100.0050.001k03.8415.0246.6357.87910.828K2,其中nabcd.考点独立性检验思想的应用题
19、点分类变量与统计、概率的综合性问题解(1)记重点分析的5人中喜欢看该节目的为a,b,c,不喜欢看的为d,e,从5人中随机抽取2人,所有可能的结果有(a,b),(a,c),(a,d),(a,e),(b,c),(b,d),(b,e),(c,d),(c,e),(d,e),共10种,则这两人都喜欢看该节目的有3种,P,即这两人都喜欢看该节目的概率为.(2)进行重点分析的5份中,喜欢看该节目的有3人,故喜欢看该节目的总人数为n,不喜欢看该节目的总人数为n.设这次调查问卷中女生总人数为a,男生总人数为b,a,bN*,则由题意可得22列联表如下:喜欢看该节目的人数不喜欢看该节目的人数总计女生aaa男生bbb总计nnn 解得an,bn,正整数n是25的倍数,设n25k,kN*,则a12k,a4k,b3k,b6k,则K2k.由题意得k6.635,解得k1.59,kN*,k2,故n50.