1、考点规范练56变量间的相关关系、统计案例考点规范练B册第41页基础巩固1.(2019云南昆明一中一模)若对于变量x的取值为3,4,5,6,7时,变量y对应的值依次分别为4.0,2.5,-0.5,-1,-2;若对于变量u的取值为1,2,3,4时,变量v对应的值依次分别为2,3,4,6,则变量x和y,变量u和v的相关关系是()A.变量x和y是正相关,变量u和v是正相关B.变量x和y是正相关,变量u和v是负相关C.变量x和y是负相关,变量u和v是负相关D.变量x和y是负相关,变量u和v是正相关答案:D解析:变量x增加,变量y减少,所以变量x和y是负相关;变量u增加,变量v增加,所以变量u和v是正相关
2、.故选D.2.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是()A.若K2的观测值为6.635,则在犯错误的概率不超过0.01的前提下认为吸烟与患肺病有关系,因此在100个吸烟的人中必有99个患有肺病B.由独立性检验知,在犯错误的概率不超过0.01的前提下认为吸烟与患肺病有关系时,我们说某人吸烟,则他有99%的可能患肺病C.若在统计量中求出在犯错误的概率不超过0.05的前提下认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误D.以上三种说法都不正确答案:C解析:独立性检验只表明两个分类变量的相关程度,而不是事件是否发生的概率估计.3.两个随机变量x,y的取值如下表:x0134y
3、2.24.34.86.7若x,y具有线性相关关系,且y=bx+2.6,则下列四个结论错误的是()A.x与y是正相关B.当x=6时,y的估计值为8.3C.x每增加一个单位,y大约增加0.95个单位D.样本点(3,4.8)的残差为0.56答案:D解析:由表格中的数据可知选项A正确;x=14(0+1+3+4)=2,y=14(2.2+4.3+4.8+6.7)=4.5,4.5=2b+2.6,即b=0.95,y=0.95x+2.6.当x=6时,y=0.956+2.6=8.3,故选项B正确;由y=0.95x+2.6可知选项C正确;当x=3时,y=0.953+2.6=5.45,残差是5.45-4.8=0.65
4、,故选项D错误.4.“厉行节约,反对浪费”之风悄然吹开,某市通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:做不到“光盘”能做到“光盘”男4510女3015则下面的正确结论是()A.在犯错误的概率不超过0.1的前提下,认为“该市居民能否做到光盘与性别有关”B.在犯错误的概率不超过0.01的前提下,认为“该市居民能否做到光盘与性别无关”C.在犯错误的概率不超过0.01的前提下,认为“该市居民能否做到光盘与性别有关”D.在犯错误的概率不超过0.1的前提下,认为“该市居民能否做到光盘与性别无关”答案:A解析:由22列联表得到a=45,b=10,c=30,d=15,则a+b
5、=55,c+d=45,a+c=75,b+d=25,ad=675,bc=300,n=100,计算得K2的观测值k=100(675-300)2554575253.030.因为2.70610.828,所以在犯错误的概率不超过0.001的前提下认为X与Y之间有关系.6.(2019广东广州高三二模)科研人员在对人体脂肪含量和年龄之间关系的研究中,获得了一些年龄和脂肪含量的简单随机样本数据,如下表:x(年龄/岁)26273941495356586061y(脂肪含量/%)14.517.821.225.926.329.631.433.535.234.6根据上表的数据得到如下的散点图.(1)根据上表中的样本数据
6、及其散点图:求x;计算样本相关系数(精确到0.01),并刻画它们的相关程度.(2)若y关于x的线性回归方程为y=1.56+bx,求b的值(精确到0.01),并根据回归方程估计年龄为50岁时人体的脂肪含量.附:参考数据:y=27,i=110xiyi=13 527.8,i=110xi2=23 638,i=110yi2=7 759.6,436.56,293554.18.参考公式:相关系数r=i=1n(xi-x)(yi-y)i=1n(xi-x)2i=1n(yi-y)2=i=1nxiyi-nxyi=1nxi2-nx2i=1nyi2-ny2,回归方程y=a+bx中斜率和截距的最小二乘估计公式分别为b=i=
7、1n(xi-x)(yi-y)i=1n(xi-x)2,a=y-bx.解:(1)根据表中的样本数据及其散点图可知x=26+27+39+41+49+53+56+58+60+6110=47.r=i=110xiyi-10xyi=110xi2-10x2i=110yi2-10y2=13527.8-10472723638-104727759.6-10272=13527.8-1269023638-220907759.6-7290=837.81548469.6=837864342935.因为436.56,293554.18,所以r0.98.由样本相关系数r0.98,可以推断人体脂肪含量和年龄的相关程度很强.(2)
8、因为线性回归方程为y=1.56+bx,即a=1.56.所以b=y-ax27-1.5647=0.54.所以y关于x的线性回归方程为y=0.54x+1.56.将x=50代入线性回归方程得y=0.5450+1.56=28.56.所以根据线性回归方程预测年龄为50岁时人体的脂肪含量为28.56%.能力提升7.某青少年成长关爱机构为了调研所在地区青少年的年龄与身高状况,随机抽取6岁、9岁、12岁、15岁、18岁的青少年身高数据各1 000个,根据各年龄段平均身高作出如图所示的散点图和回归直线l.根据图中数据,下列对该样本描述错误的是()A.根据样本数据,估计该地区青少年身高与年龄成正相关B.所抽取数据中
9、,5 000名青少年平均身高约为145 cmC.直线l的斜率的值近似等于样本中青少年平均身高每年的增量D.从这5种年龄的青少年中各取一人的身高数据,由这5人的平均年龄和平均身高数据作出的点一定在直线l上答案:D解析:在给定范围内,随着年龄的增加,年龄越大,身高越高,该地区青少年身高与年龄成正相关,故A正确;用样本数据估计总体可得平均身高约是145cm,故B正确;根据直线斜率的意义可知斜率的值近似等于样本中青少年平均身高每年的增量,故C正确;各取一人具有随机性,根据数据作出的点只能在直线附近,不一定在直线上,故D错误,故选D.8.已知x与y之间的几组数据如下表:x123456y021334假设根
10、据上表数据所得线性回归直线方程y=bx+a,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y=bx+a,则以下结论正确的是()A.bb,aaB.bb,aaC.baD.bb,aa答案:C解析:由题意可知,b=2,a=-2,b=i=16(xi-x)(yi-y)i=16(xi-x)2=57.a=y-bx=136-5772=-13,则ba,故选C.9.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如下的列联表:优秀非优秀总计甲班10b乙班c30总计已知在全部105人中随机抽取1人,成绩优秀的概率为27,则下列说法正确的是.(填序号)列联表
11、中c的值为30,b的值为35;列联表中c的值为15,b的值为50;根据列联表中的数据,若在犯错误的概率不超过0.025的前提下,能认为“成绩与班级有关系”;根据列联表中的数据,若在犯错误的概率不超过0.025的前提下,不能认为“成绩与班级有关系”.答案:解析:由题意知,成绩优秀的学生人数是30,成绩非优秀的学生人数是75,所以c=20,b=45,错误.根据列联表中的数据,得到K2的观测值k=105(1030-2045)2555030756.65.024,因此在犯错误的概率不超过0.025的前提下认为“成绩与班级有关系”.故正确,错误.高考预测10.国内某知名大学有男生14 000人,女生10
12、000人.该校体育学院想了解本校学生的运动状况,根据性别采取分层抽样的方法从全校学生中抽取120人,统计他们平均每天运动的时间,如下表.(平均每天运动的时间单位:h,该校学生平均每天运动的时间范围是0,3)男生平均每天运动的时间分布情况:平均每天运动的时间0,0.5)0.5,1)1,1.5)1.5,2)2,2.5)2.5,3人数212231810x女生平均每天运动的时间分布情况:平均每天运动的时间0,0.5)0.5,1)1,1.5)1.5,2)2,2.5)2.5,3人数51218103y(1)请根据样本估算该校男生平均每天运动的时间(结果精确到0.1);(2)若规定平均每天运动的时间不少于2
13、h的学生为“运动达人”,低于2 h的学生为“非运动达人”.请根据样本估算该校“运动达人”的数量;请根据上述表格中的统计数据填写下面22列联表,并通过计算判断能否在犯错误的概率不超过 0.05 的前提下认为“运动达人”与性别有关?运动达人非运动达人总计男生女生总计参考公式:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.参考数据:P(K2k0)0.100.050.0250.0100.0050.001k02.7063.8415.0246.6357.87910.828解:(1)由分层抽样可知,抽取的男生人数为1201400014000+10000=70,抽取的女生人数为120-70=50,故x=5,y=2.则该校男生平均每天运动的时间为0.252+0.7512+1.2523+1.7518+2.2510+2.755701.5(h),故该校男生平均每天运动的时间约为1.5h.(2)样本中“运动达人”所占比例是20120=16,故估计该校“运动达人”有16(14000+10000)=4000(人).由表格可知:运动达人非运动达人总计男生155570女生54550总计20100120故K2的观测值k=120(1545-555)2201005070=96352.7433.841.故在犯错误的概率不超过0.05的前提下不能认为“运动达人”与性别有关.