1、第3讲相关性、最小二乘估计与统计案例基础巩固题组(建议用时:40分钟)一、选择题1(2015湖北七市(州)联考)为研究语文成绩和英语成绩之间是否具有线性相关关系,统计两科成绩得到如图所示的散点图(两坐标轴单位长度相同),用回归直线ybxa近似地刻画其相关关系,根据图形,以下结论最有可能成立的是()A线性相关关系较强,b的值为3.25B线性相关关系较强,b的值为0.83C线性相关关系较强,b的值为0.87D线性相关关系太弱,无研究价值解析依题意,注意到题中的相关的点均集中在某条直线的附近,且该直线的斜率小于1,结合各选项知,故选B.答案B2. 设(x1,y1),(x2,y2),(xn,yn)是变
2、量x和y的n个样本点,直线l是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论正确的是 ()A直线l过点(,)Bx和y的相关系数为直线l的斜率Cx和y的相关系数在0到1之间D当n为偶数时,分布在l两侧的样本点的个数一定相同解析由样本的中心(,)落在回归直线上可知A正确;x和y的相关系数表示为x与y之间的线性相关程度,不表示直线l的斜率,故B错;x和y的相关系数应在1到0之间,故C错;分布在回归直线两侧的样本点的个数并不绝对平均,无论样本点个数是奇数还是偶数,故D错答案A3(2014石家庄模拟)登山族为了了解某山高y(km)与气温x()之间的关系,随机统计了4次山高与相应的气温,并
3、制作了对照表:气温()1813101山高(km)24343864由表中数据,得到线性回归方程y2xa(aR)由此请估计山高为72 km处气温的度数为()A10 B8 C4 D6解析由表中数据可得10,40,所以中心点(10,40)在线性回归直线y2xa上,所以4020a,解得a60,所以线性回归方程为y2x60,当y72时,x6,故选D.答案D4(2015郑州质量预测)通过随机询问110名性别不同的学生是否爱好某项运动,得到如下的列联表:男女总计爱好402060不爱好203050总计6050110附表:P(2k0)0.0500.0100.001k03.8416.63510.828若由2算得27
4、.8.参照附表,得到的正确结论是()A有99%以上的把握认为“爱好该项运动与性别有关”B有99%以上的把握认为“爱好该项运动与性别无关”C在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”D在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”解析依题意,因为P(7.86.635)0.010,因此有99%以上的把握认为“爱好该项运动与性别有关”,故选A.答案A5(2014宝鸡复习检测)下列说法:将一组数据中的每一个数据都加上或减去同一个常数后,方差不变;设有一个线性回归方程y35x,变量x增加1个单位时,y平均增加5个单位;设具有相关关系的两个变量x,y的相关系
5、数为r,则|r|越接近于0,x和y之间的线性相关程度越强;在一个22列联表中,由计算得2的值,则2的值越大,判断两个变量间有关联的把握就越大其中错误的个数是()A0 B1 C2 D3解析方差反映一组数据的波动大小,将一组数据中的每个数据都加上或减去同一个常数后,方差不变,故正确;在回归方程y35x中,变量x增加1个单位时,y平均减小5个单位,故不正确;根据线性回归分析中相关系数的定义:在线性回归分析中,相关系数为r,|r|越接近于1,相关程度越强,故不正确;对分类变量x与y的随机变量的值2来说,2越大,“x与y有关系”的可信程度越大,故正确综上所述,错误结论的个数为2,故选C.答案C二、填空题
6、6已知回归方程y4.4x838.19,则可估计x与y的增长速度之比约为_解析x每增长1个单位,y增长4.4个单位,故增长的速度之比约为14.4522.事实上所求的比值为回归直线方程斜率的倒数答案5227(2015嘉兴联考)为了判断高中三年级学生是否选修文科与性别的关系,现随机抽取50名学生,得到如下22列联表:理科文科男1310女720根据表中数据,得到24.844.则认为选修文科与性别有关系的可能性约为_解析24.844,根据假设检验的基本原理,应该断定“是否选修文科与性别之间有关系”成立,并且这种判断的可能性约为95%.答案95%8某数学老师身高176 cm,他爷爷、父亲和儿子的身高分别是
7、173 cm、170 cm和182 cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为_ cm.解析儿子和父亲的身高可列表如下:父亲身高173170176儿子身高170176182设线性回归方程为yabx,由表中的三组数据可求得b1,且过中心点(173,176),故ab1761733,故线性回归方程为y3x,将x182代入得孙子的身高为185 cm.答案185三、解答题9假设关于某设备的使用年限x(年)和所支出的维修费用y(万元)有如下表的统计资料:使用年限x(年)23456维修费用y(万元)2.23.85.56.57.0若由资料可知y对x呈线性相关关系,试求:(
8、1)线性回归直线方程;(2)根据回归直线方程,估计使用年限为12年时,维修费用是多少?解(1)列表i12345合计xi2345620yi2.23.85.56.57.025xiyi4.411.422.032.542.0112.3x49162536904,5;x90;xiyi112.3b1.23,于是ab51.2340.08.所以线性回归直线方程为y1.23x0.08.(2)当x12时,y1.23120.0814.84(万元),即估计使用12年时,维修费用是14.84万元10(2015深圳调研)某企业通过调查问卷(满分50分)的形式对本企业900名员工的工作满意度进行调查,并随机抽取了其中30名员
9、工(16名女员工,14名男员工)的得分,如下表:女47363248344443474641434250433549男3735344346363840393248334034(1)根据以上数据,估计该企业得分大于45分的员工人数;(2)现用计算器求得这30名员工的平均得分为40.5分,若规定大于平均得分为“满意”,否则为“不满意”,请完成下列表格:“满意”的人数“不满意”的人数合计女16男14合计30(3)根据上述表中数据,利用独立性检验的方法判断,能否有99%的把握认为该企业员工“性别”与“工作是否满意”有关?解(1)从表中可知,30名员工中有8名得分大于45分,所以任选一名员工,他(她)的得
10、分大于45分的概率是,所以估计此次调查中,该单位约有900240名员工的得分大于45分(2)完成下列表格:“满意”的人数“不满意”的人数合计女12416男31114合计151530(3)假设H0:性别与工作是否满意无关,根据表中数据,求得28.5716.635,有99%的把握认为性别与工作是否满意有关能力提升题组(建议用时:25分钟)11已知x与y之间的几组数据如下表:x123456y021334假设根据上表数据所得线性回归直线方程ybxa,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为ybxa,则以下结论正确的是()Abb,aa Bbb,aaCba Dbb,aa解析由题
11、意可知,b2,a2,b.ab,ba,选C.答案C12有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下非优秀统计成绩,得到如下所示的列联表:优秀非优秀总计甲班10b乙班c30合计已知在全部105人中随机抽取1人,成绩优秀的概率为,则下列说法正确的是()A列联表中c的值为30,b的值为35B列联表中c的值为15,b的值为50C根据列联表中的数据,若按95%的可靠性要求,能认为“成绩与班级有关系”D根据列联表中的数据,若按95%的可靠性要求,不能认为“成绩与班级有关系”解析由题意知,成绩优秀的学生数是30,成绩非优秀的学生数是75,所以c20,b45,选项A,B错误根据列联表中的数
12、据,得到26.63.841,因此有95%的把握认为“成绩与班级有关系”答案C13某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未用血清的人一年中的感冒记录作比较,提出假设H0:“这种血清不能起到预防感冒的作用”,利用22列联表计算得23.918.对此,四名同学得出了以下的判断:p:有95%的把握认为“这种血清能起到预防感冒的作用”;q:若某人未使用该血清,那么他在一年中有95%的可能性得感冒;r:这种血清预防感冒的有效率为95%;s:这种血清预防感冒的有效率为5%.则下列结论中,真命题的序号是_p且綈q;綈p且q;(綈p且綈q)且(r或s);(p或綈r)且(綈
13、q或s)解析23.9183.841,在犯错误的概率不超过0.05的前提下认为“这种血清能起到预防感冒的作用”,即命题p正确,命题q,r,s均不正确对依次进行判断,可知正确答案14某中学研究性学习小组,为了研究高中学生的作文水平是否与爱看课外书有关系,在本校高三年级随机调查了50名学生调查结果表明:在爱看课外书的25人中有18人作文水平好,另外7人作文水平一般;在不爱看课外书的25人中有6人作文水平好,另外19人作文水平一般(1)试根据以上数据完成以下22列联表,并运用独立性检验思想,指出有多大把握认为高中学生的作文水平与爱看课外书有关系;爱看课外书不爱看课外书总计作文水平好作文水平一般总计(2
14、)将其中某5名爱看课外书且作文水平好的学生分别编号为1,2,3,4,5,某5名爱看课外书且作文水平一般的学生也分别编号为1,2,3,4,5,从这两组学生中各任选1人进行学习交流,求被选取的2名学生的编号之和为3的倍数或4的倍数的概率参考公式:2,其中nabcd.参考数据:P(2k0)0.100.050.0250.0100.0050.001k02.7063.8415.0246.6357.87910.828解(1)22列联表如下:爱看课外书不爱看课外书总计作文水平好18624作文水平一般71926总计252550因为211.53810.828,由表知P(210.828)0.001,所以有99.9%
15、的把握认为高中学生的作文水平与爱看课外书有关系(2)设“被选取的2名学生的编号之和为3的倍数”为事件A,“被选取的2名学生的编号之和为4的倍数”为事件B.则基本事件为123451(1,1)(1,2)(1,3)(1,4)(1,5)2(2,1)(2,2)(2,3)(2,4)(2,5)3(3,1)(3,2)(3,3)(3,4)(3,5)4(4,1)(4,2)(4,3)(4,4)(4,5)5(5,1)(5,2)(5,3)(5,4)(5,5)共25个,因为事件A所包含的基本事件为(1,2),(1,5),(2,1),(2,4),(3,3),(4,2),(4,5),(5,1),(5,4),共9个,所以P(A);事件B所包含的基本事件为(1,3),(2,2),(3,1),(3,5),(4,4),(5,3),共6个,所以P(B).因为事件A、B互斥,所以P(AB)P(A)P(B),即被选取的2名学生的编号之和为3的倍数或4的倍数的概率为.