1、1两个变量间的相关关系:变量间确实存在关系,但又不具备函数所要求的_,它们的关系是带有_的2散点图:将 n 个数据点(xj,yj)(j1,2,n)描在平面直角坐标系中,以表示具有_的两个变量的一组数据的图形确定性随机性相关关系3正(负)相关:从散点图可以看到点散布的位置是从_到_,这种相关称为正相关;反之,如果两个变量的散点图点散布的位置是从_到_的区域,则为负相关4回归直线:观察散点图的特征,发现各点大致分布_,这条直线叫回归直线左下角右上角 左上角右下角在一条直线的附近5回归方程:如果具有相关关系的两个变量的回归方程是_,其中 bi1nxiyin xyi1nx2in x2,a y b x.
2、ybxa6相关系数的性质:|r|1 且|r|越接近 1,相关程度_;|r|越接近 0,相关程度_7独立性检验:假设两个分类变量 x 和 y,它们的值域分别是x1,x2和y1,y2,其样本频数列联表(称为 22 列联表)为y1y2总计x1ab_x2cd_总计_K2nadbc2abcdacbd越大越小abcdacbdabcd考点一 变量间的线性关系示范1 某种产品的广告费支出 x 与销售额 y(单位:百万元)之间有如下表的对应数据,x24568y3040506070(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出 y 关于 x 的线性回归方程ybxa;(3)要使这种产品的
3、销售额突破一亿元(含一亿元),则广告费支出至少为多少百万元?(精确到 0.1)参考公式:bi1nxiyin x yi1nx2in x2,a y b x.分析 直接由公式求出回归直线方程的系数即可解析(1)散点图如下图所示:(2)由题中数据,算出x 5,y 50,i15x2i145,i15y2i13 500,i15xiyi1 390,bi15xiyi5 x yi15x2in x21 39055501455527.0,a y b x 507515,所求的回归直线方程是y7x15.(3)依题意有 7x15100,x12.2,广告费投入至少需要 12.2 百万元【点评】要明确公式中字母应代入的数据,就
4、能顺利求解.展示1 某 5 名学生的数学和化学成绩如下表,(1)画出散点图;(2)求化学成绩 y 对数学成绩 x 的回归直线方程【解析】(1)(2)序号xyx2xy188787 7446 864276655 7764 940373715 3295 183466644 3564 224563613 9693 843z36633927 17425 054bi1nxiyin xyi1nx2in x225 054573.267.827 174573.220.624,a yb x67.80.62473.222.05,所以 y 对 x 的回归直线方程为y0.624x22.05.方法点拨:对一组数据进行分析
5、,应先画出散点图,看是否呈直线形,只有线性相关的两个变量之间才存在回归方程.考点二 独立性检验示范2(2011 湖南)随机询问 110 名性别不同的大学生是否爱好某项运动,得到如下列联表,男女总计爱好402060 不爱好203050总计6050110由K2nadbc2abcdacbd,算得K27.8附表:P(K2k)0.050 0.010 0.001k3.841 6.635 10.828参照附表,得正确结论是()A有 99%以上的把握认为“爱好该项运动与性别有关”B有 99%以上的把握认为“爱好该项运动与性别无关”C在犯错误的概率不超过 0.1%的前提下,认为“爱好该项运动与性别有关”D在犯错
6、误的概率不超过 0.1%的前提下,认为“该项运动与性别无关”解析 由 K27.86.635,可知有 99%以上的把握认为“爱好该项运动与性别无关”,故选 C.答案 C【点评】经过统计量分布的研究,已得两临界值:3.841 与6.635,当 k3.841 时,认为事件是无关的.当 k6.635 时,有 99%把握说事件有关.展示2 某医院因患心脏病而住院的 665 名男性病人中,有214 人秃顶,而另外 772 名不是患心脏病而住院的男病人中有175 人秃顶,利用独立性检验方法判断秃顶与心脏病是否有关?【解析】数据如下表所示,患心脏病患其他病总计秃顶214175389不秃顶4515971 048
7、总计6657721 437knadbc2abacbdcd16.3756.635,有 99%的把握认为秃顶与患心脏病有关线性回归直线方程、独立性检验,难度按课本要求即可主要考查基本概念、原理,注意实际应用1(2011 陕西)设(x1,y1),(x2,y2),(xn,yn)是变量 x和 y 的 n 个样本点通过最小二乘法得到回归直线(如下图所示),以下结论正确的是()A直线过点(x,y)Bx 和 y 的相关系数为直线 l 的斜率Cx 和 y 的相关系数在 0 到 1 之间D当 n 为偶数时,分布在直线 l 两侧的样本点的个数一定相同【答案】A【解析】回归直线方程一定经过样本中心点2(2011 山东)某产品广告费用 x 与销售额 y 的统计数据如下表,广告费用 x(万元)4235销售额 y(万元)49263954根据上表可得回归方程ybxa 中的 b 为 9.4,据此模型预报广告费用为 6 万元时,销售额为()A63.6 万元B65.5 万元C67.7 万元D72.0 万元【答案】B【解析】x 4235472,y 49263954442,ybxa 过点72,42.a9.1,方程y9.4x9.1.当 x6 时,y65.5.