1、变量间的关系与统计案例一、选择题1.设(x1,y1),(x2,y2),(xn,yn)是变量x和y的n个样本点,直线l是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论正确的是()Ax和y的相关系数为直线l的斜率Bx和y的相关系数在0到1之间C当n为偶数时,分布在l两侧的样本点的个数一定相同D直线l过点(,)解析:回归直线过样本中心(,)答案:D2通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:男女总计爱好402060不爱好203050总计6050110由K2算得,K27.8.附表:P(K2k)0.0500.0100.001k3.8416.63510.828
2、参照附表,得到的正确结论是()A有99%以上的把握认为“爱好该项运动与性别有关”B有99%以上的把握认为“爱好该项运动与性别无关”C在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”D在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”解析:根据独立性检验的思想方法,正确选项为A.答案:A3一位母亲记录了自己儿子39岁的身高数据(略),由此建立的身高与年龄的回归模型为7.19x73.93,用这个模型预测这个孩子10岁时的身高,则正确的叙述是()A身高一定是145.83 cmB身高在145.83 cm以上C身高在145.83 cm左右D身高在145.83 cm以
3、下解析:用回归模型7.19x73.93,只能作预测,其结果不一定是一个确定值答案:C4如图5个(x,y)数据,去掉D(3,10)后,下列说法错误的是()A相关系数r变大B残差平方和变大C相关指数R2变大D解释变量x与预报变量y的相关性变强解析:相关系数r越接近1,R2越大,残差平方和越小,拟合效果越好答案:B5某商品销售量y(件)与销售价格x(元/件)负相关,则其回归方程可能是()A.10x200 B.10x200C.10x200 D.10x200解析:由图象可知,选项B、D为正相关,选项C不符合实际意义,只有A项符合要求答案:A 6下列四个命题正确的是()线性相关系数r越大,两个变量的线性相
4、关性越强;反之,线性相关性越弱;残差平方和越小的模型,拟合的效果越好;用相关指数R2来刻画回归效果,R2越小,说明模型的拟合效果越好;随机误差e是衡量预报精确度的一个量,它满足E(e)0.A BC D解析:线性相关系数r满足|r|1,并且|r|越接近1,线性相关程度越强;|r|越接近0,线性相关程度越弱,故错误;相关指数是度量模型拟合效果的一种指标相关指数越大,模型拟合效果越好故正确答案:B二、填空题7调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程:0.254x0.321.由回归方程
5、可知,家庭年收入每增加1万元,年饮食支出平均增加_万元解析:以x1代x,得0.254(x1)0.321,与0.254x0.321相减可得,年饮食支出平均增加0.254万元答案:0.2548某数学老师身高176 cm,他爷爷、父亲和儿子的身高分别是173 cm、170 cm和182 cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为_cm.解析:设父亲身高为x cm,儿子身高为y cm,则x173170176y170176182173,176,1,17611733,x3,当x182时,185.答案:1859第二十届世界石油大会将于2011年12月4日8日在卡塔尔首都
6、多哈举行,能源问题已经成为全球关注的焦点某工厂经过技术改造后,降低了能源消耗,经统计该厂某种产品的产量x (单位:吨)与相应的生产能耗y(单位:吨)有如下几组样本数据:x3456y2.5344.5根据相关性检验,这组样本数据具有线性相关关系,通过线性回归分析,求得回归直线的斜率为0.7.已知该产品的年产量为10吨,则该工厂每年大约消耗的汽油为_吨解析:由题知,4.5,3.5,故样本数据的中心点为A(4.5,3.5)设回归方程为y0.7xb,将中心点坐标代入得:3.50.74.5b,解得b0.35,故回归方程为y0.7x0.35,所以当x10时,y0.7100.357.35,即该工厂每年大约消耗
7、的汽油为7.35吨答案:7.35三、解答题10已知x,y的一组数据如下表:x13678y12345(1)从x,y中各取一个数,求xy10的概率;(2)对于表中数据,甲、乙两同学给出的拟合直线分别为yx1与yx,试利用“最小平方法(也称最小二乘法)”判断哪条直线拟合程度更好解:(1)从x,y中各取一个数组成数对(x,y),共有25对,其中满足xy10的有(6,4),(6,5),(7,3),(7,4),(7,5),(8,2),(8,3),(8,4),(8,5),共9对故所求概率P.(2)用yx1作为拟合直线时,所得y值与y的实际值的差的平方和为S1(1)2(22)2(33)2(4)2(5)2.用y
8、x作为拟合直线时,所得y值与y的实际值的差的平方和为S2(11)2(22)2(3)2(44)2(5)2.S2s,该生的物理成绩更稳定(2)由于x 与y之间具有线性相关关系,0.5,1000.510050,线性回归方程为0.5x50.当y115时,x130.建议:进一步加强对数学的学习,提高数学成绩的稳定性,这将有助于物理成绩的进一步提高12某学生对其亲属30人的饮食习惯进行了一次调查,并用如图所示的茎叶图表示30人的饮食指数(说明:图中饮食指数低于70的人,饮食以蔬菜为主;饮食指数高于70的人,饮食以肉类为主)甲(50岁以下)乙(50岁以上)15386784532023456789015676
9、237964528158(1)根据茎叶图,帮助这位学生说明其亲属30人的饮食习惯;(2)根据以上数据完成下列22的列联表:主食蔬菜主食肉类合计50岁以下50岁以上合计(3)能否有99%的把握认为其亲属的饮食习惯与年龄有关,并写出简要分析附:K2.P(K2k0)0.250.150.100.050.0250.0100.0050.001k01.3232.0722.7063.8415.0246.6357.87910.828解:(1)在30位亲属中,50岁以上的人多以食蔬菜为主,50岁以下的人多以食肉为主(2)22的列联表如下:主食蔬菜主食肉类合计50岁以下481250岁以上16218合计201030(3)因为K2106.635,所以有99%的把握认为其亲属的饮食习惯与年龄有关