1、单元素养评价(一) (第一章)(120分钟150分)一、选择题(本大题共12小题,每小题5分,共60分,在每小题给出的四个选项中,只有一项是符合题目要求的)1.在对两个变量x,y进行线性回归分析时,有下列步骤:对所求出的回归直线方程作出解释;收集数据(xi,yi),i=1,2,n;求线性回归方程;求相关系数;根据所搜集的数据绘制散点图.如果根据可行性要求能够作出变量x,y具有线性相关的结论,则在下列操作顺序中正确的是()A.B.C.D.【解析】选D.对两个变量进行回归分析时,首先收集数据(xi,yi),i=1,2,n;根据所搜集的数据绘制散点图.观察散点图的形状,判断线性相关关系的强弱,求相关
2、系数,写出线性回归方程,最后依据所求出的回归直线方程作出解释.故正确顺序是.2.下列变量是相关关系的是()A.正方体的棱长和体积B.角的弧度数和它的正弦值C.日照时间与水稻的亩产量D.人的身高与视力【解析】选C.A、B均为一种确定性关系(函数关系),而D为互不相关的.3.调查男女学生购买食品时是否看出厂日期与性别有无关系时,最有说服力的是()A.期望B.方差C.正态分布D.独立性检验【解析】选D.要判断两个事件是否相关时,用独立性检验.4.下表显示出样本中变量y随变量x变化的一组数据,由此判断它最可能是 ()x45678910y14181920232528A.线性函数模型B.二次函数模型C.指
3、数函数模型D.对数函数模型【解析】选A.画出散点图(图略)可以得到这些样本点在某一条直线上或该直线附近,故最可能是线性函数模型.5.某高校统计课程的教师随机给出了选修该课程的一些情况,具体数据如表:选修该课程未选修该课程总计男131023女72027总计203050为了判断选修该课程是否与性别有关,根据表中数据,得k4.844.因为k3.841,所以可以判断选修该课程与性别有关.那么这种判断出错的可能性不超过()A.5%B.95%C.1%D.99%【解析】选A.若k3.841,说明在犯错误的概率不超过0.05的前提下认为选修该课程与性别有关,也就是选修该课程与性别有关出错的可能性不超过5%.6
4、.以下关于线性回归的判断,正确的个数是()若散点图中所有点都在一条直线附近,则这条直线为回归直线;散点图中绝大多数点都线性相关,个别特殊点不影响线性回归,如图中的A,B,C点;已知直线方程为=0.50x-0.81,则x=25时,y的估计值为11.69;回归直线方程的意义是它反映了样本整体的变化趋势.A.0B.1C.2D.3【解析】选D.能使所有数据点都在它附近的直线不止一条,而根据回归直线的定义知,只有按最小二乘法求得回归系数,得到的直线=x+才是回归直线,所以不对;正确;将x=25代入=0.50x-0.81,得=11.69,所以正确;正确.7.为了评价某个电视栏目的改革效果,某机构在改革前后
5、分别从居民点抽取了100位居民进行调查,经过计算K20.99,根据这一数据分析,下列说法正确的是 ()A.有99%的人认为该电视栏目优秀B.有99%的人认为该电视栏目是否优秀与改革有关系C.在犯错误的概率不超过0.01的前提下认为该电视栏目是否优秀与改革有关系D.没有理由认为该电视栏目是否优秀与改革有关系【解析】选D.只有K26.635时才能在犯错误的概率不超过0.01的前提下认为该电视栏目是否优秀与改革有关系,而即使K26.635也只是对“该电视栏目是否优秀与改革有关系”这个论断成立的可能性大小的推论,与是否有99%的人等无关.8.某考察团对全国10大城市进行职工人均工资水平x(单位:千元)
6、与居民人均消费水平y(单位:千元)统计调查,y与x具有线性相关关系,回归方程为=0.66x+1.562.若某城市居民人均消费水平为7.675千元,估计该城市人均消费额占人均工资收入的百分比约为()A.83%B.72%C.67%D.66%【解析】选A.将y=7.675代入回归方程,可计算得x9.26,所以该城市人均消费额占人均工资收入的百分比约为7.6759.260.83,即约为83%.9.2018年,国际权威机构IDC发布的全球手机销售报告显示:华为突破2亿台出货量超越苹果的出货量,首次成为全球第二.华为业务CEO余承东明确表示,华为的目标,就是在2021年前,成为全球最大的手机厂商.为了解华
7、为手机和苹果手机使用的情况是否和消费者的性别有关,对100名华为手机使用者和苹果手机使用者进行统计,统计结果如表:手机品牌性别华为苹果合计男301545女451055合计7525100根据表格判断能否在犯错误的概率不超过0.05的前提下认为使用哪种品牌手机与性别有关系,则下列结论正确的是()附:K2=P(K2k0)0.100.050.0100.001k02.7063.8416.63510.828A.不能在犯错误的概率不超过0.05的前提下认为使用哪款手机与性别有关B.在犯错误的概率不超过0.05的前提下认为使用哪款手机与性别有关C.在犯错误的概率不超过0.05的前提下认为使用哪款手机与性别无关
8、D.以上都不对【解析】选A.由表可知:a=30,b=15,c=45,d=10,n=100,则K2的观测值k=3.030k2k3k1,所以阅读量与性别有关联的可能性最大.二、填空题(本大题共4小题,每小题5分,共20分,将答案填在题中的横线上)13.已知x与y的一组数据,x135y246则有以下结论:x与y正相关;x与y负相关;其回归方程为y=x+1;其相关系数r=1.其中正确的是_.(填序号)【解析】从数据看,随着x的增加,y增加,所以x与y正相关,对,错.答案:14.下列关于回归分析与独立性检验的说法正确的是_.(填序号)回归分析和独立性检验没有什么区别;回归分析是对两个变量准确关系的分析,
9、而独立性检验是分析两个变量之间的不确定性关系;回归分析研究两个变量之间的相关关系,独立性检验是对两个变量是否具有某种关系的一种检验;独立性检验可以100%确定两个变量之间是否具有某种关系.【解析】由回归分析、独立性检验的意义知,回归分析与独立性检验都是研究两个变量之间的相关性,但方法与手段有所不同,研究角度不同,由其意义知,正确.答案:15.为研究某新药的疗效,给50名患者服用此药,跟踪调查后得下表中的数据:无效有效总计男性患者153550女性患者64450总计2179100设H0:服用此药的效果与患者性别无关,则K2的观测值k_,从而得出结论:服用此药的效果与患者的性别有关,这种判断出错的可
10、能性为_.【解析】由公式计算得K2的观测值k4.882,因为k3.841,所以有95%的把握认为服用此药的效果与患者的性别有关,从而有5%的可能性出错.答案:4.8825%16.已知x,y之间的一组数据如表,对于表中数据,甲、乙两同学给出的拟合直线分别为l1:y=x+1与l2:y=x+,利用最小二乘法判断拟合程度更好的直线是_.x13678y12345【解析】用y=x+1作为拟合直线时,所得y的实际值与y的估计值的差的平方和为:S1=+(2-2)2+(3-3)2+=.用y=x+作为拟合直线时,所得y的实际值与y的估计值的差的平方和为:S2=(1-1)2+(2-2)2+(4-4)2+=.因为S2
11、S1,故用直线l2:y=x+,拟合程度更好.答案:y=x+三、解答题(本大题共6小题,共70分.解答应写出文字说明,证明过程或演算步骤)17.(10分)为考察某种药物治疗新冠病毒肺炎的效果,进行动物试验,得到如下的列联表:药物效果试验列联表患病未患病总计服用药104555没有服用药203050总计3075105试用图形判断服用药与患病之间是否有关系.【解析】相应的等高条形图如图所示:从图形可以看出,服用药的样本中患病的比例明显低于没有服用药的样本中患病的比例,因此可以认为:服用药和患病之间有关系.18.(12分)某农科所对冬季昼夜温差大小与某反季节大豆新品种发芽多少之间的关系进行分析研究,他们
12、分别记录了12月1日至12月5日的每天昼夜温差与实验室每天每100颗种子中的发芽数,得到如下资料:日期12月1日12月2日12月3日12月4日12月5日温差x/C101113128发芽数y/颗2325302616该农科所确定的研究方案是:先从这五组数据中选取2组,用剩下的3组数据求线性回归方程,再对被选取的2组数据进行检验. (1)求选取的2组数据恰好是不相邻2天数据的概率; (2)若选取的是12月1日与12月5日的两组数据,请根据12月2日至12月4日的数据,求出y关于x的线性回归方程=x+; (3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程
13、是可靠的,试问(2)中所得的线性回归方程是否可靠?(注:=,=-)【解析】(1)设抽到不相邻两组数据为事件A,因为从5组数据中选取2组数据共有10种情况,每种情况都是等可能出现的,其中抽到相邻两组数据的情况有4种.所以P(A)=1-=. 故选取的2组数据恰好是不相邻2天数据的概率是.(2)由数据,求得=(11+13+12)=12,=(25+30+26)=27,3=972.xiyi=1125+1330+1226=977,=112+132+122=434,3=432,由公式,求得=,=-b=27-12=-3,所以y关于x的线性回归方程为=x-3.(3)当x=10时,=10-3=22,|22-23|
14、2;同样,当x=8时,=8-3=17,|17-16|10.828,因此在犯错误的概率不超过0.001的前提下认为实施西部开发战略的公布对应届大学毕业生的选择产生了影响.20.(12分)某基地蔬菜大棚采用无土栽培方式种植各类蔬菜.根据过去50周的资料显示,该基地周光照量X(小时)都在30小时以上,其中不足50小时的有5周,不低于50小时且不超过70小时的有35周,超过70小时的有10周.根据统计,该基地的西红柿增加量y(千克)与使用某种液体肥料的质量x(千克)之间的关系如图所示.依据上图,是否可用线性回归模型拟合y与x的关系?请计算相关系数r并加以说明(精确到0.01).(若|r|0.75,则线
15、性相关程度很高,可用线性回归模型拟合)附:相关系数公式r=,参考数据:0.55,0.95.【解析】由已知数据可得=5,=4.因为(xi-)(yi-)=(-3)(-1)+0+0+0+31=6,=2,=.所以相关系数r= =0.95.因为r0.75,所以可用线性回归模型拟合y与x的关系.21.(12分)为了研究某种细菌随时间x变化的繁殖个数,收集数据如表:天数x123456繁殖个数y612254995190(1)作出这些数据的散点图;(2)选择恰当函数模型,求出y对x的回归方程.【解析】(1)作出散点图如图1所示.(2)由散点图看出样本点分布在一条指数型曲线y=cebx(c0)的周围,则ln y=
16、bx+ln c.令z=ln y,a=ln c,则z=bx+a.x123456z1.792.483.223.894.555.25相应的散点图如图2.从图2可以看出,变换后的样本点分布在一条直线附近,因此可以用线性回归方程来拟合.由表中数据得到线性回归方程为=0.69x+1.115.因此细菌的繁殖个数对温度的非线性回归方程为=e0.69x+1.115.22.(12分)为了调查某大学学生在某天上网的时间,随机对100名男生和100名女生进行了不记名的问卷调查,得到了如下的统计结果:表1:男生上网时间与频数分布表上网时间(分)30,40)40,50)50,60)60,70)70,80人数5253025
17、15表2:女生上网时间与频数分布表上网时间(分)30,40)40,50)50,60)60,70)70,80人数1020402010(1)若该大学共有女生750人,试估计其中上网时间不少于60分钟的人数.(2)完成下面的22列联表,并回答能否在犯错误的概率不超过0.1的前提下认为“大学生上网时间与性别有关”.上网时间少于60分钟上网时间不少于60分钟总计男生女生总计附:K2=.【解析】(1)设上网时间不少于60分钟的女生人数为x,依题意有=,解得x=225,所以估计上网时间不少于60分钟的女生有225人.(2)填22列联表如下:上网时间少于60分钟上网时间不少于60分钟总计男生6040100女生7030100总计13070200由表中数据可得到K2的观测值k=2.202.706,故不能在犯错误的概率不超过0.1的前提下认为“大学生上网时间与性别有关”.