1、第一章单元评估卷第卷(选择题共60分)一、选择题(本大题共12小题,每小题5分,共60分在每小题给出的四个选项中,只有一项是符合要求的)1下列结论正确的是()函数关系是一种确定性关系;相关关系是一种非确定性关系;回归分析是对具有函数关系的两个变量进行统计分析的一种方法;回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法A BC D2下表是函数值y随自变量x变化的一组数据,由此判断它最可能是()x45678910y15171921232527A.一次函数模型 B二次函数模型C指数函数模型 D对数函数模型3已知变量x与y正相关,且由观测数据算得样本平均数3,3.5,则由该观测数据算得的线
2、性回归方程可能是()A. 0.4x2.3 B. 2x2.4C. 2x9.5 D. 0.3x4.44下列说法不正确的是()A回归分析中,R2的值越大,说明残差平方和越小B若一组观测值(x1,y1),(x2,y2),(xn,yn)满足yibxiaei(i1,2,n),若ei恒为0,则R21C回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法D画残差图时,纵坐标为残差,横坐标一定是编号5某市政府在调查市民收入增减与旅游愿望的关系时,采用独立性检验法抽查了3 000人,计算发现K2的观测值k6.023,根据这一数据查阅表,市政府断言“市民收入增减与旅游愿望有关系”这一断言犯错误的概率不超过(
3、)P(K2k0)0.500.400.250.150.10k00.4550.7081.3232.0722.706P(K2k0)0.050.0250.0100.0050.001k03.8415.0246.6357.87910.828A.0.1 B0.05C0.025 D0.0056下表是某厂14月份用水量(单位:百吨)的一组数据:月份x1234用水量y4.5432.5由散点图可知,用水量y与月份x之间有较好的线性相关关系,其线性回归直线方程是 0.7xa,则a()A10.5 B5.15C5.2 D5.257一位母亲记录了儿子39岁的身高,数据略,由此建立的身高与年龄的回归模型为 7.19x73.9
4、3,用这个模型预测这个孩子10岁时的身高,则正确的叙述是()A身高一定是145.83 cmB身高在145.83 cm以上C身高在145.83 cm左右D身高在145.83 cm以下8“回归”一词是在研究子女的身高与父母的身高之间的遗传关系时,由高尔顿提出的,他的研究结果是子代的平均身高向中心回归,根据他的结论,在儿子的身高y与父亲的身高x的回归直线方程 x中, ()A在(1,0)内 B等于0C在(0,1)内 D在1,)内9为了研究性格和血型的关系,抽查80人做实验,血型和性格情况如下表:则有多大把握认为性格与血型有关系()O型或A型B型或AB型总计内向型181230外向型222850总计404
5、080A99%B95%C90%D没有充分的证据显示有关答案1C函数关系是一种确定性关系,而相关关系是一种非确定性关系;回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法因此正确,不正确,故选C.2A画出散点图可以得到7个样本点在一条直线附近,故最可能是一次函数模型3A由x与y正相关可排除选项C、D,又由回归直线经过点(3,3.5),知选项A正确,选项B不正确故选A.4D画残差图时,纵坐标为残差,横坐标可以是编号,也可以是原始数据,也可以是数据估计值5C因为K2的观测值k6.0235.024,对应犯错误概率的临界值为0.025,所以这一断言犯错误的概率不超过0.025,故选C.6D样本
6、点的中心为(2.5,3.5),将其代入回归直线方程可解得a5.25.7C只能预测,不能确定实际值8C子代平均身高向中心回归, 应为正的真分数,故选C.9D由题意,利用公式可得K21.920,则x增大时,y也相应增大;若r0.455,P(K20.455)0.5,故选B.134792888253解析:45E98,E53;E35C,C88;98D180,D82;A35D,A47;45AB,B92.14|r|1解析:当数据点(xi,yi)在一条直线上时,y只受x的影响,即数据点完全线性相关,此时|r|1.15. x1424解析:首先把两组值代入回归直线方程得所以回归直线方程是 x14.令x1438,可
7、得x24,即当x24时,y的估计值是38.16解析:查对临界值表知P(K23.841)0.05,故有95%的把握认为“这种血清能起到预防感冒的作用”;95%仅是指“血清能起到预防感冒的作用”的可信程度,但也有“在100个使用血清的人中一个患感冒的人也没有”的可能,故p真,其余都假结合复合命题的真值可知,选.17解:由题意可知(1813101)10,(24343864)40, 2.又回归方程 2x 过点(10,40),故 60.所以当x4时, 2(4)6068.故当气温为4 时,用电量的度数约为68度18.(12分)某5名学生的数学和化学成绩如下表: 学生学科成绩ABCDE数学成绩x887673
8、6663化学成绩y7865716461求化学成绩y对数学成绩x的回归直线方程19(12分)在日常生活中,我们发现多数老年人喜欢早睡早起,而年轻人则喜欢晚睡晚起,究竟年龄与休息时间有没有关系呢?某校研究性学习小组调查了200名小区居民,调查情况如下:年龄50岁以上的80人中,60人在晚上10点前休息,20人在10点以后休息;年龄在50岁以下的120人中,40人在晚上10点以前休息,80人在10点以后休息(1)作出22列联表;(2)试判断年龄与休息时间是否有关20(12分)高中流行这样一句话“文科就怕数学不好,理科就怕英语不好”如表是一次针对高三文科学生的调查所得的数据能否在犯错误的概率不超过0.
9、025的前提下认为文科学生总成绩不好与数学成绩不好有关系呢?总成绩好总成绩不好总计数学成绩好47812490数学成绩不好39924423总计87736913答案18解:73.2,67.8,iyi25 054,27 174,所以 0.625. 67.80.62573.222.05.所以y对x的回归直线方程为 0.625x22.05.19解:(1)列联表如下:10点前休息10点后休息总计50岁以上60208050岁以下4080120总计100100200(2)K233.33310.828,故年龄与休息时间有关20解:依题意,计算随机变量K2的观测值为k6.2335.024,因此,能在犯错误的概率不
10、超过0.025的前提下认为文科学生总成绩不好与数学成绩不好有关系21.(12分)甲、乙两个学校高三年级分别有1 200人、1 000人,为了了解两个学校全体高三年级学生在该地区六校联考中的数学成绩情况,采用分层抽样方法从两个学校一共抽取了110名学生的数学成绩,并作出了频数分布统计表:甲校:分组70,80)80,90)90,100)100,110)频数34815分组110,120)120,130)130,140)140,150频数15x32乙校:分组70,80)80,90)90,100)100,110)频数1289分组110,120)120,130)130,140)140,150频数1010y
11、3(1)计算x,y的值;(2)若规定考试成绩在120,150内为优秀,请分别估计两个学校数学成绩的优秀率;(3)由以上统计数据填写22列联表,并判断两个学校的数学成绩是否有差异.甲校乙校总计优秀非优秀总计参考公式:K2.22(12分)某兴趣小组欲研究昼夜温差大小与患感冒人数多少之间的关系,他们分别到气象局与某医院抄录了1至6月份每月10号的昼夜温差情况与因患感冒而就诊的人数,得到如下资料:日期1月10日2月10日3月10日4月10日5月10日6月10日昼夜温差x()1011131286就诊人数y222529261612该兴趣小组确定的研究方案是:先从这六组数据中选取2组,用剩下的4组数据求线性
12、回归方程,再用被选取的2组数据进行检测(1)求选取的2组数据恰好是相邻两个月数据的概率;(2)若选取的是1月与6月的两组数据,请根据2至5月份的数据求出y关于x的线性回归方程 x ;(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2人,则认为得到的线性回归方程是理想的,试问该小组所得线性回归方程是否理想?参考公式: , .答案21.解:(1)甲校抽取11060(人),乙校抽取11050(人),故x10,y7.(2)估计甲校优秀率为25%,乙校优秀率为40%.(3)甲校乙校总计优秀152035非优秀453075总计6050110k2.832.706.故在犯错误的概率不超过0.1的前提下,认为两个学校的数学成绩有差异22解:(1)设抽到相邻两个月的数据为事件A.从6组数据中选取2组数据,共有15种情况,每种情况都是等可能出现的其中,抽到相邻两个月的数据的情况有5种所以P(A).(2)由数据求得11,24,由公式求得 , ,所以y关于x的线性回归方程为 x.(3)当x10时, ,2;当x6时, ,2,所以该小组所得线性回归方程是理想的