1、考点规范练53变量间的相关关系、统计案例基础巩固1.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是()A.若K2的观测值为6.635,则在犯错误的概率不超过0.01的前提下认为吸烟与患肺病有关系,因此在100个吸烟的人中必有99个患有肺病B.由独立性检验知,在犯错误的概率不超过0.01的前提下认为吸烟与患肺病有关系时,我们说某人吸烟,则他有99%的可能患肺病C.若从统计量中求出在犯错误的概率不超过0.05的前提下认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误D.以上三种说法都不正确答案:C解析:独立性检验只表明两个分类变量的相关程度,而不是事件是否发生的概率估计.2.(20
2、20河北衡水模拟)某公司某型号无人机以其小巧轻便、高效机动、影像清晰、智能化、用途广等突出特点,得到广大用户的青睐,该型号无人机近5年销售量数据统计如表所示.年份20152016201720182019年份代码x01234年销量y/万件1015203035根据表中的数据用最小二乘法求得y关于x的线性回归方程为y=6.5x+t,则可以预测2020年该型号无人机的销量大约为()A.40万件B.41.5万件C.45万件D.48万件答案:B解析:x=0+1+2+3+45=2,y=10+15+20+30+355=22.又因为直线y=6.5x+t过点(2,22),故6.52+t=22,解得t=9.故预测2
3、020年该型号无人机的销量大约为y=6.55+9=41.5(万件).故选B.3.(2020河南安阳二模)2020年2月,全国掀起了“停课不停学”的热潮,各地教师通过网络直播、微课推送等多种方式来指导学生线上学习.为了调查学生对网络课程的热爱程度,研究人员随机调查了相同数量的男、女学生,发现有80%的男生喜欢网络课程,有40%的女生不喜欢网络课程,且有99%的把握但没有99.9%的把握认为是否喜欢网络课程与性别有关,则被调查的男、女学生总数量可能为()附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.P(K2k0)0.10.050.010.001k02
4、.7063.8416.63510.828A.130B.190C.240D.250答案:B解析:依题意,设男、女生的人数各为5x,建立22列联表如下所示:性别是否喜欢网络课程总计喜欢网络课程不喜欢网络课程男生4xx5x女生3x2x5x总计7x3x10x故K2=(8x2-3x2)210x5x5x3x7x=10x21,由题可知6.63510x2110.828,因此139.33510x10.828,所以在犯错误的概率不超过0.001的前提下认为X与Y之间有关系.6.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验,根据收集到的数据(如下表),由最小二乘法求得回归方程y=0.67
5、x+54.9,现发现表中有一个数据看不清,请你推断出该数据的值为.零件数x/个1020304050加工时间y/min62758189答案:68解析:由题意,得x=30,y=307+a5,代入回归直线方程y=0.67x+54.9,得307+a5=0.6730+54.9,解得a=68.7.科研人员在对人体脂肪含量和年龄之间关系的研究中,获得了一些年龄和脂肪含量的简单随机样本数据,如下表:x(年龄/岁)26273941495356586061y(脂肪含量/%)14.517.821.225.926.329.631.433.535.234.6根据上表的数据得到散点图如下图所示.(1)根据上表中的样本数据
6、及其散点图:求x;计算样本相关系数(精确到0.01),并刻画它们的相关程度.(2)若y关于x的线性回归方程为y=1.56+bx,求b的值(精确到0.01),并根据回归方程估计年龄为50岁时人体的脂肪含量.附:参考数据:y=27,i=110xiyi=13 527.8,i=110xi2=23 638,i=110yi2=7 759.6,436.56,293554.18.参考公式:相关系数r=i=1n(xi-x)(yi-y)i=1n(xi-x)2i=1n(yi-y)2=i=1nxiyi-nxyi=1nxi2-nx2i=1nyi2-ny2.回归方程y=a+bx中斜率和截距的最小二乘估计公式分别为b=i=
7、1n(xi-x)(yi-y)i=1n(xi-x)2,a=y-bx.解:(1)根据表中的样本数据及其散点图可知x=26+27+39+41+49+53+56+58+60+6110=47.r=i=110xiyi-10xyi=110xi2-10x2i=110yi2-10y2=13527.8-10472723638-104727759.6-10272=13527.8-1269023638-220907759.6-7290=837.81548469.6=837864342935.因为436.56,293554.18,所以r0.98.由样本相关系数r0.98,可以推断人体脂肪含量和年龄的相关程度很强.(2)
8、因为线性回归方程为y=1.56+bx,即a=1.56.所以b=y-ax=27-1.56470.54.所以y关于x的线性回归方程为y=0.54x+1.56.将x=50代入线性回归方程得y=0.5450+1.56=28.56.所以根据线性回归方程预测年龄为50岁时人体的脂肪含量为28.56%.能力提升8.某青少年成长关爱机构为了调研所在地区青少年的年龄与身高状况,随机抽取6岁、9岁、12岁、15岁、18岁的青少年身高数据各1 000个,根据各年龄段平均身高作出散点图和回归直线l如图所示.根据图中数据,下列对该样本描述错误的是()A.根据样本数据估计,该地区青少年身高与年龄成正相关B.所抽取数据中,
9、5 000名青少年平均身高约为145 cmC.直线l的斜率的值近似等于样本中青少年平均身高每年的增量D.从这5种年龄的青少年中各取一人的身高数据,由这5人的平均年龄和平均身高数据作出的点一定在直线l上答案:D解析:在给定范围内,随着年龄的增加,年龄越大,身高越高,该地区青少年身高与年龄成正相关,故A正确;用样本数据估计总体可得平均身高约是145cm,故B正确;根据直线斜率的意义可知斜率的值近似等于样本中青少年平均身高每年的增量,故C正确;各取一人具有随机性,根据数据作出的点只能在直线附近,不一定在直线上,故D错误,故选D.9.已知x与y之间的几组数据如下表:x123456y021334假设根据
10、上表数据所得线性回归直线方程y=bx+a,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y=bx+a,则以下结论正确的是()A.bb,aaB.bb,aaC.baD.bb,aa答案:C解析:由题意可知,b=2,a=-2,b=i=16(xi-x)(yi-y)i=16(xi-x)2=57.a=y-bx=136-5772=-13,则ba,故选C.10.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到列联表如下表所示:班级是否优秀总计优秀非优秀甲班10b乙班c30总计已知在全部105人中随机抽取1人,成绩优秀的概率为27,则下列说法正确的是.
11、(填序号)列联表中c的值为30,b的值为35列联表中c的值为15,b的值为50根据列联表中的数据,若在犯错误的概率不超过 0.025的前提下,能认为“成绩与班级有关系”根据列联表中的数据,若在犯错误的概率不超过 0.025的前提下,不能认为“成绩与班级有关系”答案:解析:由题意知,成绩优秀的学生人数是30,成绩非优秀的学生人数是75,所以c=20,b=45,错误.根据列联表中的数据,得到K2=105(1030-2045)2555030756.1095.024,因此在犯错误的概率不超过0.025的前提下认为“成绩与班级有关系”.故正确,错误.高考预测11.(2020广西桂林一模)某学校在学期结束
12、,为了解家长对学校工作的满意度,对A,B两个班的100位家长进行满意度调查,调查结果如下:班级是否满意总计非常满意满意A301545B451055总计7525100(1)根据表格判断是否有95%的把握认为家长的满意程度与所在班级有关系?(2)用分层抽样的方法从非常满意的家长中抽取5人进行问卷调查,并在这5人中随机选出2人进行座谈,求这2人都来自同一班级的概率.附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d).P(K2k0)0.0500.0100.001k03.8416.63510.828解:(1)由已知表格中的数据求得K2=100(3010-4515)245557525=100333.033.841.故没有95%的把握认为家长的满意程度与所在班级有关系.(2)记A班抽取的非常满意的家长为a,b;B班抽取的非常满意的家长为1,2,3.则从5人中任选2人有(a,b),(a,1),(a,2),(a,3),(b,1),(b,2),(b,3),(1,2),(1,3),(2,3)共10种可能.其中来自同一个班级的有(a,b),(1,2),(1,3),(2,3)共4种可能.故这2人都来自同一班级的概率P=410=25.