1、 高考资源网() 您身边的高考专家概率与统计(7)变量间的相关关系1、设某大学的女生体重y (单位:)与身高x (单位:)具有线性相关关系,根据一组样本数据,用最小二乘法建立的回归方程为,则下列结论中不正确的是( )A.y与x具有正的线性相关关系B.回归直线过样本点的中心C.若该大学某女生身高增加,则其体重约增加D.若该大学某女生身高为,则可断定其体重必为2、唐代诗人李颀的诗古从军行开头两句说:“白日登山望烽火,黄昏饮马傍交河.”诗中隐含着一个有趣的数学问题“将军饮马”问题,即将军在观望烽火之后从山脚下某处出发,先到河边饮马后再回到军营,怎样走才能使总路程最短?在平面直角坐标系中,设军营所在区
2、域为,若将军从点处出发,河岸线所在直线方程为,并假定将军只要到达军营所在区域即回到军营,则“将军饮马”的最短总路程为( )A B C D3、登山族为了了解某山高与气温之间的关系,随机统计了4次山高与相应的气温,并制作了对照表如下:气温()181310-1山高()24343864由表中数据得到线性回归方程,由此估计山高为处气温的度数是( )A.-10B.-8C.-6D.-44、某同学将收集到的6组数据对,制作成如图所示的散点图(各点旁的数据为该点坐标),并由这6组数据对计算得到回归直线的相关系数r.现给出以下3个结论:直线恰过点D,其中正确结论的序号是( )A.B. C.D.5、甲、乙、丙、丁四
3、位同学在建立变量的回归模型时,分别选择了4种不同的模型,计算得如下表:甲乙丙丁0.960.630.400.75则建立的回归模型拟合效果最好的同学是( )A.甲B.乙C.丙D.丁6、下列说法错误的是( )A.在统计学中,独立性检验是检验两个分类变量是否有关系的一种统计方法B.在残差图中,残差分布的带状区域的宽度越狭窄,其模拟的效果越好C.线性回归方程对应的直线至少经过其样本数据点中的一个点D.在回归分析中,相关指数越大,模拟的效果越好7、在吸烟与患肺病这两个分类变量的计算中,下说法正确的是( )A. 若K2的观测值为k=6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人
4、中必有99人患有肺病B. 从独立性检验可知有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病C. 若从统计量中求出有95% 的把握认为吸烟与患肺病有关系,是指有5% 的可能性使得推判出现错误D. 以上三种说法都不正确8、利用独立性检验来考查两个分类变量是否有关系,当随机变量的值( )A.越大,“X与Y有关系”成立的可能性越大B.越大,“X与Y有关系”成立的可能性越小C.越小,“X与Y有关系”成立的可能性越大D.与“X与Y有关系”成立的可能性无关9、为考察数学成绩与物理成绩的关系,在高二随机抽取了300名学生得到下面列联表:数学物理85100分85分以下总计85
5、100分378512285分以下35143178总计72228300现判断数学成绩与物理成绩有关系,则判断的出错率约为()附:0.0500.0100.001k3.8416.63510.828A B C D10、某班主任对全班50名学生进行了作业量多少的调查,数据如下表:认为作业多认为作业不多合计喜欢玩电脑游戏18927不喜欢玩电脑游戏81523合计262450则认为喜欢玩电脑游戏与认为作业量的多少有关系的把握大约为( )A.B.C.D.无充分根据11、一个车间为了规定工作原理,需要确定加工零件所花费的时间,为此进行了5次试验,收集数据如下:零件数x(个)1020304050加工时间y(分钟)6
6、469758290由表中数据,求得线性回归方程,根据回归方程,预测加工个零件所花费的时间为_分钟12、某产品的广告费用x与销售额y的统计数据如下表:广告费用x (万元)3456销售额y (万元)25304045根据上表可得回归方程中的为7.根据此模型预测广告费用为万元时销售额为_万元.13、为了解学案的使用是否对学生的学习成绩有影响,随机抽取100名学生进行调查,得到列联表,经计算的观测值,则可以得到结论:在犯错误的概率不超过_的前提下,认为学生的学习成绩与使用学案有关.参考数据:0.1000.0500.0250.0100.0050.0012.7063.8415.0246.6357.87910
7、.82814、下列说法:线性回归方程必过;命题“”的否定是“”相关系数r越小,表明两个变量相关性越弱;在一个列联表中,由计算得,则有的把握认为这两个变量间有关系;其中正确的说法是.(把你认为正确的结论都写在横线上)本题可参考独立性检验临界值表:0.1000.0500.0250.0100.0012.7063.8415.0246.63510.82815、某中学为研究学生的身体素质与体育锻炼时间的关系,对该校200名高三学生平均每天体育锻炼时间进行调查,如表:(平均每天锻炼的时间单位:分钟)平均每天锻炼的时间/分钟总人数203644504010将学生日均体育锻炼时间在的学生评价为“锻炼达标”.1.请
8、根据上述表格中的统计数据填写下面的列联表;锻炼不达标锻炼达标合计男女20110合计并通过计算判断,是否能在犯错误的概率不超过0.025的前提下认为“锻炼达标”与性别有关?2.在“锻炼达标”的学生中,按男女用分层抽样方法抽出5人,进行体育锻炼体会交流,再从这5人中选出2人作重点发言,求作重点发言的2人中,至少1人是女生的概率.参考公式:,其中.临界值表:0.100.050.0250.0102.7063.8415.0246.635 答案以及解析1答案及解析:答案:D解析:由线性回归方程知,所以y与x具有正的线性相关关系的,故选项A正确;由回归直线方程恒过样本点的中心知,选项B正确;若该大学某女生身
9、高增加,则由知其体重约增加,因此C选项正确;若该大学某女生身高为,则可预测或估计其体重为,并不一定为,因此选项D不正确.故答案为D. 2答案及解析:答案:A解析: 3答案及解析:答案:C解析:由题意得,代入线性回归方程,可得,.由,可得. 4答案及解析:答案:A解析:结合散点图可知回归直线的斜率大于0,是正相关,故正确;由题中数据可得回归直线过样本点中心则直线恰过点D,正确;由于的斜率均小于1,而为回归直线斜率的估计值,错误,故选A. 5答案及解析:答案:A解析:越大,表示回归模型的拟合效果越好.故选A. 6答案及解析:答案:C解析:对于A,统计学中,独立性检验是检验两个分类变量是否有关系的一
10、种统计方法,正确;对于B,残差图中,残差分布的带状区域的宽度越狭窄,其模拟的效果越好,正确;对于C,线性回归方程对应的直线过样本中心点,不一定过样本数据中的点,故C错误;对于D,回归分析中,相关指数越大,其模拟的效果就越好,正确故选:C 7答案及解析:答案:C解析: 8答案及解析:答案:A解析:由得意义可知,越大,说明X与Y有关系的可能性越大,故选A. 9答案及解析:答案:D解析: 10答案及解析:答案:C解析:根据表中数据得到,因为,所以认为喜欢玩电脑游戏与认为作业量的多少有关系的把握大约为.故选C 11答案及解析:答案:102解析: 12答案及解析:答案:73.5解析:由题表可知, ,代入
11、回归方程,得,所以回归方程为,所以当时, (万元). 13答案及解析:答案:0.010解析:由的观测值,与表中数据比较可知,所以在犯错误的概率不超过0.010的前提下,认为学生的学习成绩与使用学案有关. 14答案及解析:答案:解析: 15答案及解析:答案:1.锻炼不达标锻炼达标合计男603090女9020110合计15050200由列联表中数据,计算得到的观测值为.所以在犯错误的概率不超过的前提下能判断“锻炼达标”与性别有关.2. “锻炼达标”的学生有50人,男、女生人数比为,故用分层抽样方法从中抽取5人,有3人是男生,记为,有2人是女生,记为,则从这5人中选出2人,选法有共10种,设事件表示“作重点发言的2人中,至少有1人是女生”,则事件发生的情况为,共7种.所以所求概率为.解析: 高考资源网版权所有,侵权必究!