1、第三章检测(B)(时间:90分钟满分:120分)附:K2=P(K2k0)0.500.400.250.150.100.050.0250.0100.0050.001k00.4550.7081.3232.0722.7063.8415.0246.6357.87910.828一、选择题(本大题共10小题,每小题5分,共50分.在每小题给出的四个选项中,只有一项是符合题目要求的)1.下列说法中错误的是()A.如果变量x与y之间存在线性相关关系,那么我们根据试验数据得到的点(xi,yi)(i=1,2,n)将散布在某一条直线的附近B.如果两个变量x与y之间不存在线性关系,那么根据它们的一组数据(xi,yi)(
2、i=1,2,n)不能写出一个线性方程C.设x,y是具有相关关系的两个变量,且y关于x的线性回归方程为x+叫做回归系数D.为使求出的线性回归方程有意义,可用统计检验的方法来判断变量y与x之间是否存在线性相关关系解析:任何一组(xi,yi)(i=1,2,n)都能写出一个线性方程,只是有的无意义.答案:B2.设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,n),用最小二乘法建立的回归方程为=0.85x-85.71,则下列结论中不正确的是()A.y与x具有正的线性相关关系B.回归直线过样本点的中心()C.若该大学某女生身高增加1 c
3、m,则其体重约增加0.85 kgD.若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg解析:D选项中,若该大学某女生身高为170 cm,则可断定其体重约为0.85170-85.71=58.79(kg).故D选项不正确.答案:D3.为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:收入x/万元8.28.610.011.311.9支出y/万元6.27.58.08.59.8根据上表可得回归直线方程x+,其中=0.76,据此估计,该社区一户年收入为15万元家庭的年支出为()A.11.4万元B.11.8万元C.12.0万元D.12.2万元解析:=
4、10,=8,-0.76=8-0.7610=0.4.=0.76x+0.4.当x=15时,=0.7615+0.4=11.8.答案:B4.一位母亲记录了儿子39岁的身高,数据略,由此建立的身高y(单位:cm)与年龄x的回归模型为=7.19x+73.93,用这个模型预测这个孩子10岁时的身高,则正确的叙述是()A.身高一定是145.83 cmB.身高在145.83 cm以上C.身高在145.83 cm左右D.身高在145.83 cm以下解析:只能预测,不能确定实际值.答案:C5.为了调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了200位老年人,结构如下:性别是否需要志愿者男女
5、需要7040不需要3060参照附表,得到的正确结论是()A.在犯错误的概率不超过0.1%的前提下认为“该地区的老年人是否需要志愿者提供帮助与性别有关”B.在犯错误的概率不超过0.1%的前提下认为“该地区的老年人是否需要志愿者提供帮助与性别无关”C.最多有99%的把握认为“该地区的老年人是否需要志愿者提供帮助与性别有关”D.最多有99%的把握认为“该地区的老年人是否需要志愿者提供帮助与性别无关”解析:由公式可计算K2的观测值k=18.1810.828,则在犯错误的概率不超过0.1%的前提下认为“该地区的老年人是否需要志愿者提供帮助与性别有关”,故选A.答案:A6.根据下面的列联表得到如下几个判断
6、:没有充分的证据证明“患肝病与嗜酒有关”;在犯错误的概率不超过0.01的前提下,认为“患肝病与嗜酒有关”;在犯错误的概率不超过0.01的前提下,认为“患肝病与嗜酒无关”.嗜酒不嗜酒总计患肝病70060760未患肝病20032232总计90092992其中正确命题的个数为()A.0B.1C.2D.3解析:由列联表中数据可求得随机变量K2的观测值k=7.3496.635,所以在犯错误的概率不超过0.01的前提下,认为“患肝病与嗜酒有关系”,即正确,故选B.答案:B7.下列关于残差图的描述错误的是()A.残差图的横坐标可以是编号B.残差图的横坐标可以是解释变量和预报变量C.残差点分布的带状区域的宽度
7、越窄,相关指数越小D.残差点分布的带状区域的宽度越窄,残差平方和越小解析:残差图纵坐标为残差,横坐标可以选用样本编号或样本数据或估计值.残差点分布的带状区域的宽度越窄,说明模型的拟合精度越高,则相关指数越大,残差平方和越小.答案:C8.四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直线方程,分别得到以下四个结论:y与x负相关,且=2.347x-6.423;y与x负相关,且=-3.476x+5.648;y与x正相关,且=5.437x+8.493;y与x正相关,且=-4.326x-4.578.其中一定不正确的结论的序号是()A.B.C.D.解析:正相关指的是y随x的增大而增大,
8、负相关指的是y随x的增大而减小,故不正确的为,故选D.答案:D9.三点(3,10),(7,20),(11,24)确定的线性回归方程是()A=1.75x-5.75B=1.75x+5.75C=-1.75x+5.75D=-1.75x-5.75解析:设回归直线方程为x+,则由公式得=1.75,=5.75.答案:B10.某学校开展研究性学习活动,某同学获得一组实验数据如下表:x1.99345.16.12y1.54.047.51218.01对于表中数据,现给出以下拟合曲线,其中拟合程度最好的是()A.y=2x-2B.y=C.y=log2xD.y= (x2-1)解析:本题若用R2或残差来分析拟合效果,运算将
9、很烦琐,计算量太大,可以将各组数据代入检验,发现D最接近.故选D.答案:D二、填空题(本大题共5小题,每小题5分,共25分.把答案填在题中的横线上)11.调查某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元)显示,年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程=0.254x+0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加万元.答案:0.25412.已知x,y的取值如下表:x0134y2.24.34.86.7从散点图可以看出y与x线性相关,且回归直线方程为=0.95x+,则=.解析:=2,=4.5,故=4.5-0.952=
10、2.6.答案:2.613.由数据:(1,2),(3,4),(2,2),(4,4),(5,6),(3,3.6)得出的线性回归方程x必经过的定点是以上点中的.解析:易知,线性回归方程x必经过定点(),而根据计算可知这几个点中满足条件的是(3,3.6).答案:(3,3.6)14.某学校对校选课程“人与自然”的选修情况进行了统计,得到如下数据:选未选总计男40545450女230220450总计635265900那么,在犯错误的概率不超过的前提下认为选修“人与自然”与性别有关.解析:K2=,k163.810.828,即在犯错误的概率不超过0.001的前提下认为选修“人与自然”与性别有关.答案:0.00
11、115.某数学老师身高176 cm,他爷爷、父亲和儿子的身高分别是173 cm、170 cm和182 cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为 cm.解析:由题意父亲身高x cm与儿子身高y cm对应关系如下表:x173170176y170176182则=173,=176,(xi-)(yi-)=(173-173)(170-176)+(170-173)(176-176)+(176-173)(182-176)=18,(xi-)2=(173-173)2+(170-173)2+(176-173)2=18,=1,=176-173=3.线性回归直线方程 x+=x+3
12、.可估计孙子身高为182+3=185(cm).答案:185三、解答题(本大题共5小题,共45分.解答时应写出文字说明、证明过程或演算步骤)16.(8分)甲、乙两个学校高三年级分别有1 200人、1 000人,为了了解两个学校全体高三年级学生在该地区六校联考中的数学成绩情况,采用分层抽样方法从两个学校一共抽取了110名学生的数学成绩,并作出了频数分布统计表:甲校:分组70,80)80,90)90,100)100,110)频数34815分组110,120)120,130)130,140)140,150)频数15x32乙校:分组70,80)80,90)90,100)100,110)频数1289分组1
13、10,120)120,130)130,140)140,150)频数1010y3(1)计算x,y的值;(2)若规定考试成绩在120,150内为优秀,请分别估计两个学校数学成绩的优秀率;(3)由以上统计数据填写22列联表,并判断能否在犯错误的概率不超过0.1的前提下认为两个学校的数学成绩有差异.甲校乙校总计优秀非优秀总计解:(1)甲校抽取110=60(人),乙校抽取110=50(人),故x=10,y=7.(2)估计甲校优秀率为=25%,乙校优秀率为=40%.(3)甲校乙校总计优秀152035非优秀453075总计6050110由列联表可求得随机变量K2的观测值k=2.832.706.故在犯错误的概
14、率不超过0.1的前提下,认为两个学校的数学成绩有差异.17.(8分)某兴趣小组欲研究昼夜温差大小与患感冒人数多少之间的关系,他们分别到气象局与某医院抄录了1至6月份每月10号的昼夜温差情况与因患感冒而就诊的人数,得到如下资料:日期1月10日2月10日3月10日4月10日5月10日6月10日昼夜温差x/1011131286就诊人数y/个222529261612该兴趣小组确定的研究方案是:先从这六组数据中选取2组,用剩下的4组数据求线性回归方程,再用被选取的2组数据进行检验.(1)求选取的2组数据恰好是相邻两个月的概率;(2)若选取的是1月与6月的两组数据,请根据2至5月份的数据,求出y关于x的线
15、性回归方程x+;(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2人,则认为得到的线性回归方程是理想的,试问:该小组所得线性回归方程是否理想?解:(1)设抽到相邻两个月的数据为事件A,从6组数据中选取2组数据,共有=15(种)情况,每种情况都是等可能出现的,其中,抽到相邻两个月的数据的情况有5种,P(A)=(2)由数据求得=11,=24.由公式求得,再由,求得=-,y关于x的线性回归方程为x-(3)当x=10时,y=2,同样,当x=6时,y=0.75,所以y与x有线性相关关系.(2)由(1)得,=0.728 6,8.25-0.728 612.5=-0.857 5.故=0.7
16、28 6x-0.857 5.(3)要使y10,即0.728 6x-0.857 510,所以x14.901 9.所以机器的转速应控制在14.901 9转/秒以下.20.(10分)某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分成5组:50,60),60,70),70,80),80,90),90,100分别加以统计,得到如图所示的频率分布直方图.25周岁
17、以上组25周岁以下组(1)从样本中日平均生产件数不足60的工人中随机抽取2人,求至少抽到一名“25周岁以下组”工人的概率;(2)规定日平均生产件数不少于80者为“生产能手”,请你根据已知条件作出22列联表,并判断能否在犯错误的概率不超过0.1的前提下认为“生产能手与工人所在的年龄组有关”?解:(1)由已知得,样本中有25周岁以上组工人60名,25周岁以下组工人40名.所以,样本中日平均生产件数不足60件的工人中,25周岁以上组工人有600.05=3(人),记为A1,A2,A3;25周岁以下组工人有400.05=2(人),记为B1,B2.从中随机抽取2名工人,所有可能的结果共有10种,它们是:(
18、A1,A2),(A1,A3),(A2,A3),(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).其中,至少有1名“25周岁以下组”工人的可能结果共有7种,它们是:(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).故所求的概率P=(2)由频率分布直方图可知,在抽取的100名工人中,“25周岁以上组”中的生产能手600.25=15(人),“25周岁以下组”中的生产能手400.375=15(人),据此可得22列联表如下:生产能手非生产能手合计25周岁以上组15456025周岁以下组152540合计3070100所以得K2=1.79.因为1.792.706,所以没有充分的证据证明“生产能手与工人所在的年龄组有关”.