1、第一章单元综合检测(时间120分钟满分150分)一、选择题(本大题共12小题,每小题5分,共60分)12013湖北高考四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直线方程,分别得到以下四个结论:y与x负相关且2.347x6.423;y与x负相关且3.476x5.648;y与x正相关且5.437x8.493;y与x正相关且4.326x4.578.其中一定不正确的结论的序号是()A B C D 解析:中y与x负相关而斜率为正,不正确;中y与x正相关而斜率为负,不正确故选D.答案:D2已知呈线性相关关系的变量x,y之间的关系如下表所示,则回归直线一定过点()x0.10.20.3
2、0.5y2.112.854.0810.15A.(0.1,2.11) B(0.2,2.85)C(0.3,4.08) D(0.275,4.7975)解析:回归直线一定过点(,),通过表格中的数据计算出和,易知选D.答案:D32014重庆高考已知变量x与y正相关,且由观测数据算得样本平均数3,3.5,则由该观测数据算得的线性回归方程可能是()A 0.4x2.3 B 2x2.4C 2x9.5 D 0.3x4.4解析:依题意知,相应的回归直线的斜率应为正,排除C、D. 且直线必过点(3,3.5),代入A、B得A正确答案:A4某工厂某产品单位成本y(元)与产量x(千件)满足线性回归方程 75.72.13x
3、,则以下说法中正确的是()A产量每增加1000件,单位成本下降2.13元B产量每减少1000件,单位成本下降2.13元C产量每增加1000件,单位成本上升75.7元D产量每减少1000件,单位成本上升75.7元解析:在线性回归方程 x 中, 2.13,是斜率的估计值,说明产量每增加1000件,单位成本下降2.13元答案:A5对两个变量y和x进行线性相关检验,已知n是观察值组数,r是相关系数,且已知:n10,r0.9533;n15,r0.3012;n17,r0.9991;n3,r0.9950.则变量y和x具有线性相关关系的是()A和 B和C和 D和解析:相关系数r的绝对值越接近1,变量x、y的线
4、性相关性越强中的r太小,中观察值组数太小答案:B6在建立两个变量y与x的回归模型中,分别选择了4个不同模型,它们的相关指数R2如下,其中拟合得最好的模型为()A模型1的相关指数R2为0.75B模型2的相关指数R2为0.90C模型3的相关指数R2为0.25D模型4的相关指数R2为0.55解析:相关指数R2的值越大,意味着残差平方和越小,也就是说模型的拟合效果越好,故选B.答案:B7下列说法中正确的有()若r0,则x增大时,y也相应增大;若r0,表示两个相关变量正相关,x增大时,y也相应增大,故正确rb, a B b, aC a D b, a解析:由两组数据(1,0)和(2,2)可求得直线方程为y
5、2x2,b2,a2.而利用线性回归方程的公式与已知表格中的数据,可求得 , ,所以 a.答案:C9下列说法中,正确的是()回归方程适用于一切样本和总体;回归方程一般都有时间性;样本取值的范围会影响回归方程的适用范围;回归方程得到的预报值是预报变量的精确值A BC D解析:回归方程只适用于我们所研究的样本总体,故错误;回归方程得到的预报值可能是取值的平均值,故是错误的答案:B10为考察数学成绩与物理成绩的关系,在高二随机抽取了300名学生,得到下面列联表:数学物理85100分85分以下合计85100分378512285分以下35143178合计72228300现判断数学成绩与物理成绩有关系,则判
6、断的出错率为()A0.5% B1%C2% D5%解析:代入公式得24.5143.841,所以在犯错误的概率不超过0.05的前提下认为数学成绩与物理成绩有关系,即判断的出错率为5%.答案:D11某考察团对全国10大城市进行职工人均工资水平x(千元)与居民人均消费水平y(千元)统计调查,y与x具有相关关系,回归方程为 0.66x1.562,若某城市居民人均消费水平为7.675千元,估计该城市人均消费额占人均工资收入的百分比约为()A 83% B 72%C 67% D 66%解析:将 7.675代入回归方程,可计算得x9.262,所以该城市人均消费额占人均工资收入的百分比约为7.6759.2620.
7、8383%,即约为83%.答案:A12有一组观测数据(x1,y1),(x2,y2),(x12,y12)得1.542,2.8475,29.808,99.208,iyi54.243,则回归直线方程为()A 1.218x0.969 B 1.218x0.969C 0.969x1.218 D 1.218x0.969解析:1.542,2.8475利用公式可得 1.218,又 0.969回归直线方程为 1.218x0.969.答案:D二、填空题(本大题共4小题,每小题5分,共20分)13下表为收集到的一组数据:x13579y48111720已知变量x、y呈线性相关关系,则二者对应的回归直线方程为_解析:xi
8、25,5,yi60,12,x165,xiyi382,2.05,122.0551.75.回归直线方程为1.752.05x.答案:1.752.05x14许多因素都会影响贫穷,教育也许是其中之一在研究这两个因素的关系时,收集了美国50个州的成年人受过9年或更少教育的百分比(x)和收入低于官方规定的贫困线的人数占本州人数的百分比(y)的数据,建立的回归直线方程为 0.8x4.6.斜率的估计值为0.8说明_答案:美国一个地区的成年人受过9年或更少教育的百分比每增加1%,收入低于官方规定的贫困线的人数占本州人数的百分比将增加0.8%左右15若一组观测值(x1,y1),(x2,y2),(xn,yn)之间满足
9、yiabxiei(i1,2,n),若ei恒为0,则R2为_解析:若ei恒为0,则残差平方和 (yi i)2e0,而R21101.答案:116某数学老师身高176 cm,他爷爷、父亲和儿子的身高分别是173 cm、170 cm和182 cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为_cm.解析:由题意知:设解释变量为x,预报变量为y,它们对应的取值如下表所示x173170176y170176182于是有173,176, 1, 17617313,得 x3,所以当x182时, 185.答案:185三、解答题(本大题共6小题,共70分)17(10分)某产品的广告费支出
10、x与销售额y(单位:百万元)之间有如下对应数据:x24568y3040605070请画出散点图并用散点图粗略地判断x、y是否线性相关解:散点图如下图从散点图可以看出散点呈条状分布,所以x、y具有较强的线性相关关系18(12分)假设关于某设备的使用年限x和所支出的维修费用y(万元),有如下的统计资料:使用年限x23456维修费用y2.23.85.56.57.0(1)y与x间是否有线性相关关系?若有,求出线性回归方程;(2)估计使用年限为10年时,维修费用是多少?解:(1)作散点图,如图:由散点图可知,y与x呈线性相关关系,4,5,所以 1.23, 51.2340.08.所以线性回归方程为 1.2
11、3x0.08.(2)当x10年时, 1.23100.0812.30.0812.38(万元),即估计使用10年时,维护费用是12.38万元19(12分)针对时下的“韩剧热”,某校团委对“学生性别和是否喜欢韩剧有关”作了一次调查,其中女生人数是男生人数的,男生喜欢韩剧的人数占男生人数的,女生喜欢韩剧的人数占女生人数的.若在犯错误的概率不超过0.05的前提下认为是否喜欢韩剧和性别有关,则男生至少有多少人?解:设男生人数为x,依题意可得列联表如下:喜欢韩剧不喜欢韩剧总计男生x女生总计xx若在犯错误的概率不超过0.05的前提下认为是否喜欢韩剧和性别有关,则23.841,由2x3.841,解得x10.24
12、,为整数,若在犯错误的概率不超过0.05的前提下认为是否喜欢韩剧和性别有关,则男生至少有12人20(12分)2014黑龙江鹤岗高二检测为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样的方法从该地区调查了500位老年人,结果如下:性别是否需要志愿者男女需要4030不需要160270(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例;(2)在犯错误的概率不超过0.01的前提下是否可认为该地区的老年人是否需要志愿者提供帮助与性别有关?(3)根据(2)的结论,能否提出更好的调查方法来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例?说明理由解:(1)调查的500位老人中有70位需
13、要志愿者提供帮助,因此该地区老年人中,需要帮助的老年人的比例的估算值为14%.(2)29.967,由于9.9676.635,因此,在犯错误的概率不超过0.01的前提下认为该地区的老年人是否需要志愿者提供帮助与性别有关(3)由(2)的结论知,该地区的老年人是否需要帮助与性别有关,并且从样本数据中能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、女两层并采用分层抽样方法比采用简单随机抽样的方法更好21(12分)2012课标全国卷某地区2007年至2013年农村居民家庭人均纯收入y(单位:千元)的数据如下表:年份20072
14、00820092010201120122013年份代号t1234567人均纯收入y2.93.33.64.44.85.25.9(1)求y关于t的线性回归方程;(2)利用(1)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入附:回归直线的斜率和截距的最小二乘估计公式分别为:, .解:(1)由所给数据计算得(1234567)4,(2.93.33.64.44.85.25.9)4.3, (ti)2941014928, (ti)(yi)(3)(1.4)(2)(1)(1)(0.7)00.110.520.931.614,0.5,4.3
15、0.542.3,所求回归方程为0.5t2.3.(2)由(1)知,0.50,故2007年至2013年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元将2015年的年份代号t9代入(1)中的回归方程,得 0.592.36.8,故预测该地区2015年农村居民家庭人均纯收入为6.8千元22(12分)某农科所对冬季昼夜温差大小与某反季节大豆新品种发芽多少之间的关系进行分析研究,他们分别记录了12月1日至12月5日的每天昼夜温差与实验室每天每100颗种子中的发芽数,得到如下资料:日期12月1日12月2日12月3日12月4日12月5日温差x()101113128发芽数y(颗)2325302616
16、该农科所确定的研究方案是:先从这五组数据中选取2组,用剩下的3组数据求线性回归方程,再对被选取的2组数据进行检验(1)求选取的2组数据恰好是不相邻2天数据的概率;(2)若选取的是12月1日与12月5日的两组数据,请根据12月2日至12月4日的数据,求出y关于x的线性回归方程 x ;(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(2)中所得到的线性回归方程是否可靠?解:(1)设抽到不相邻的两组数据为事件A,因为从5组数据中选取2组数据共有10种情况:(1,2)(1,3)(1,4)(1,5)(2,3)(2,4)(2,5)(3,4)(3,5)(4,5),其中数据为12月份的日期数每种情况都是可能出现的,事件A包括的基本事件有6种所以P(A).所以选取的2组数据恰好是不相邻2天数据的概率是.(2)由数据,求得12,27.由公式,求得 , 3.所以y关于x的线性回归方程为 x3.(3)当x10时, 10322,|2223|2;同样,当x8时, 8317,|1716|2;所以,该研究所得到的回归方程是可靠的