1、温馨提示: 此套题为Word版,请按住Ctrl,滑动鼠标滚轴,调节合适的观看比例,答案解析附后。关闭Word文档返回原板块。课时提升作业(五十三)变量间的相关关系与统计案例(25分钟60分)一、选择题(每小题5分,共25分)1.已知某车间加工零件的个数x与所花费时间y(h)之间的线性回归方程为=0.01x+0.5,则加工600个零件大约需要的时间为()A.6.5hB.5.5hC.3.5hD.0.5h【解析】选A.将x=600代入回归方程即得A.2.下列关于K2的说法中正确的是()A.K2在任何相互独立问题中都可以用来检验有关还是无关B.K2的值越大,两个事件的相关性就越大C.K2是用来判断两个
2、分类变量是否有关系的随机变量,只对于两个分类变量适合D.K2的观测值k的计算公式为k=【解析】选C.K2值是用来判断两个分类变量是否有关系的一个随机变量,并不是适应于任何独立问题的相关性检验.3.某卫生机构对366人进行健康体检,阳性家族史者糖尿病发病的有16人,不发病的有93人;阴性家族史者糖尿病发病的有17人,不发病的有240人,在犯错误的概率不超过的前提下认为糖尿病患者与遗传有关系.()附表:A.0.1%B.0.5%C.99.9%D.2.5%【解题提示】由K2公式求出观测值,然后结合附表判断.【解析】选D.可以先作出如下列联表(单位:人):糖尿病患者与遗传列联表根据列联表中的数据,得到K
3、2的观测值为6.0675.024.故我们在犯错误的概率不超过2.5%的前提下认为糖尿病患者与遗传有关系.4.(2015临川模拟)小乐与小波在学了变量的相关性之后,两人约定回家去利用各自记录的610岁的身高作为实验数据,进行回归分析,探讨年龄x(岁)与身高y(cm)之间的线性相关性.经计算小乐与小波求得的线性回归直线分别为l1,l2.在认真比较后,两人发现他们这五年身高的平均值都为110cm,而且小乐的五组实验数据均满足所求的直线方程,小波则只有两组实验数据满足所求的直线方程.下列说法错误的是()A.直线l1,l2一定有公共点(8,110)B.在两人的回归分析中,小乐求得的线性相关系数r=1,小
4、波求得的线性相关系数r(0,1)C.在小乐的回归分析中,他认为x与y之间完全线性相关,所以自己的身高y(cm)与年龄x(岁)成一次函数关系,利用l1可以准确预测自己20岁的身高D.在小波的回归分析中,他认为x与y之间不完全线性相关,所以自己的身高y(cm)与年龄x(岁)成相关关系,利用l2只可以估计预测自己20岁的身高【解析】选C.回归分析只能预测,得到估计值,不是准确值.5.(2015日照模拟)已知x,y的值如表所示如果y与x呈线性相关且回归直线方程为=x+,则=()【解析】选B.根据所给的三对数据,得到=3,=5,所以这组数据的样本中心点是(3,5).因为线性回归直线的方程一定过样本中心点
5、,所以5=3+,所以=,故选B.二、填空题(每小题5分,共15分)6.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未使用血清的人一年中的感冒记录作比较,提出假设H0:“这种血清不能起到预防感冒的作用”,利用22列联表计算得K23.918,经查临界值表知P(K23.841)0.05.则下列结论中,正确结论的序号是.在犯错误的概率不超过5%的前提下认为“这种血清能起到预防感冒的作用”;若某人未使用该血清,那么他在一年中有95%的可能性得感冒;这种血清预防感冒的有效率为95%;这种血清预防感冒的有效率为5%.【解析】K23.9183.841,而P(K23.841)
6、0.05,所以在犯错误的概率不超过5%的前提下认为“这种血清能起到预防感冒的作用”;但检验的是假设是否成立和该血清预防感冒的有效率是没有关系的,不是同一个问题,不要混淆,正确序号为.答案:7.考古学家通过始祖鸟化石标本发现:其股骨长度x(cm)与肱骨长度y(cm)的线性回归方程为=1.197x-3.660,由此估计,当股骨长度为50cm时,肱骨长度的估计值为cm.【解析】根据线性回归方程=1.197x-3.660,将x=50代入得y=56.19,则肱骨长度的估计值为56.19cm.答案:56.198.(2015芜湖模拟)某产品在某零售摊位上的零售价x(单位:元)与每天的销售量y(单位:个)的统
7、计资料如下表所示:由上表,可得回归直线方程=x+中的=-4,据此模型预计零售价定为15元时,每天的销售量为.【解析】=17.5,=39,因为=-4,=x+,所以=39+417.5=109,所以回归直线方程为=-4x+109,所以x=15时,=-415+109=49(件).答案:49三、解答题(每小题10分,共20分)9.(2015济南模拟)一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验,收集数据如下:试验顺序第一次第二次第三次第四次第五次零件数x(个)1020304050加工时间y(分钟)6267758089(1)在5次试验中任取2次,记加工时间分别为a,b,求时间
8、a,b均小于80分钟的概率.(2)请根据第二次、第三次、第四次试验的数据,求出y关于x的线性回归方程=x+,参考公式如下:=,=-,=,=【解析】(1)a,b构成的基本事件(a,b)有:(62,67),(62,75),(62,80),(62,89),(67,75),(67,80),(67,89),(75,80),(75,89),(80,89)共有10个.其中“a,b均小于80分钟”的有(62,67),(62,75),(67,75)共3个.所以事件“a,b均小于80分钟”的概率为.(2)=(20+30+40)=30,=(67+75+80)=74,所以=,所以=74-30=54.5,所以y关于x的
9、线性回归方程=x+54.5.10.某学生对其30位亲属的饮食习惯进行了一次调查,并用茎叶图表示30人的饮食指数.说明:如图中饮食指数低于70的人,饮食以蔬菜为主;饮食指数高于70的人,饮食以肉类为主.(1)根据茎叶图,帮助这位同学说明其亲属30人的饮食习惯.(2)根据以上数据完成22列联表:(3)能否在犯错误的概率不超过0.01的前提下认为其亲属的饮食习惯与年龄有关,并写出简要分析.【解题提示】(1)根据茎叶图的叶上数字的多少明确其亲属30人的饮食习惯.(2)根据茎叶图完成列联表.(3)由(2)得出的列联表计算K2得出观测值.【解析】(1)30位亲属中50岁以上的人多以食蔬菜为主,50岁以下的
10、人多以食肉为主.(2)如表所示:所以可以在犯错误的概率不超过0.01的前提下认为其亲属的饮食习惯与年龄有关.(20分钟40分)1.(5分)(2013福建高考)已知x与y之间的几组数据如下表:假设根据上表数据所得线性回归直线方程为=x+,若某同学根据上表中的前两组数据(1,0)和 (2,2)求得的直线方程为y=bx+a,则以下结论正确的是()A.b,aB.b,aC.aD.b,a.2.(5分)(2015阜阳模拟)某社区医院为了了解社区老人与儿童每月感冒的人数y(人)与月平均气温x()之间的关系,随机统计了某4个月的月患病(感冒)人数与当月平均气温,其数据如下表:由表中数据算出线性回归方程=x+中的
11、=-2,气象部门预测下个月的平均气温约为6,据此估计该社区下个月老年人与儿童患病人数约为()A.38B.40C.46D.58【解析】选C.由表格得(,)为(10,38),因为=x+中的=-2,所以38=10(-2)+,解得:=58,所以=-2x+58,当x=6时,=-26+58=46.故选C.【加固训练】某炼钢厂废品率x(%)与成本y(元/吨)的线性回归方程为=105.492+42.569x.当成本控制在176.5元/吨时,可以预计生产1000吨钢中,约有吨钢是废品.【解析】因为176.5=105.492+42.569x,所以x1.668,即成本控制在176.5元/吨时,废品率约为1.668%
12、.所以生产1000吨钢中,约有10001.668%=16.68(吨)钢是废品.答案:16.683.(5分)(2015淄博模拟)某研究小组为了研究中学生的身体发育情况,在某学校随机抽出20名15至16周岁的男生,将他们的身高和体重制成22的列联表,根据列联表的数据,判断该学校15至16周岁的男生的身高和体重之间在犯错误概率不超过的前提下有关系.附:独立性检验临界值表【解析】由表可得a+b=5,c+d=15,a+c=7,b+d=13,ad=48,bc=3,n=20,所以K2的观测值k=5.934,由于5.9345.024,所以在犯错误的概率不超过0.025的前提下认为该学校15至16周岁的男生的身
13、高和体重之间有关系.答案:0.025【方法技巧】两个分类变量是否有关的直观判断在列联表中,可以估计满足条件X=x1的个体中具有Y=y1的个体所占的比重,和满足条件X=x2的个体中具有Y=y1的个体所占的比重,若两个分类变量无关,则两个比重应差别不大,即,因此两个比重相差越大,两个分类变量有关的可能性就越大.4.(12分)(2015大庆模拟)2014年春晚过后,为了研究演员上春晚次数与受关注度的关系,某网站对其中一位经常上春晚的演员上春晚次数与受关注度进行了统计,得到如下数据:(1)若该演员的粉丝数量y与上春晚次数x满足线性回归方程,试求回归方程=x+,并就此分析,该演员上春晚12次时的粉丝数.
14、(2)若用(i=1,2,3,4,5)表示统计数据时粉丝的“即时均值”(精确到整数),求这5次统计数据时粉丝的“即时均值”的方差;从“即时均值”中任选3组,求这三组数据之和不超过20的概率.【解析】(1)由题意可知, =(2+4+6+8+10)=6,=(10+20+40+80+100)=50,所以=-=50-126=-22,所以=12x-22.当x=12时,=1212-22=122.即该演员上春晚12次时的粉丝数约为122万人.(2)经计算可知,这五组数据对应的“即时均值”分别为:5,5,7,10,10.这五组“即时均值”的平均数为:7.4,则方差为:s2=2(5-7.4)2+(7-7.4)2+
15、2(10-7.4)2=5.04.这五组“即时均值”可以记为A1,A2,B,C1,C2.从“即时均值”中任选3组,选法共有(A1,A2,B),(A1,A2,C1),(A1,A2,C2),(A1,B,C1),(A2,B,C1),(A2,B,C2),(A1,B,C2),(A1,C1,C2),(A2,C1,C2),(B,C1,C2)共10种情况,其中和不超过20的情况有(A1,A2,B),(A1,A2,C1),(A1,A2,C2)共3种情况.故所求概率为:P=.5.(13分) (能力挑战题)为调查某市学生百米运动成绩,从该市学生中按照男女生比例随机抽取50名学生进行百米测试,学生成绩全部介于13秒到1
16、8秒之间,将测试结果按如下方式分成五组,第一组13,14),第二组14,15)第五组17,18,如图是按上述分组方法得到的频率分布直方图.(1)设m,n表示样本中两个学生的百米测试成绩,已知m,n13,14)17,18,求事件“|m-n|2”的概率.(2)根据有关规定,成绩小于16秒为达标,如果男女生使用相同的达标标准,则男女生达标情况如附表:根据表中数据,能否有99%的把握认为“体育达标与性别有关”?若有,你能否提出一个更好的解决方法来?【解析】(1)成绩在13,14)的人数有:500.04=2人,设为a,b,成绩在17,18的人数有:500.06=3人,设为A,B,C,m,n13,14)时有ab一种情况.m,n17,18时有AB,AC,BC三种情况.m,n分别在13,14)和17,18时有aA,aB,aC,bA,bB,bC六种情况.基本事件总数为10,事件“|m-n|2”由6个基本事件组成.所以P(|m-n|2)=.(2)依据题意得相关的22列联表如下:故有99%的把握认为“体育达标与性别有关”.故可以根据男女生性别划分达标的标准.关闭Word文档返回原板块