1、回归分析【例1】下表是一位母亲给儿子作的成长记录:年龄/周岁3456789身高/cm90.897.6104.2110.9115.6122.0128.5年龄/周岁10111213141516身高/cm134.2140.8147.6154.2160.9167.5173.0(1)年龄和身高之间具有怎样的相关关系?(2)如果年龄(3周岁16周岁之间)相差5岁,其身高有多大差异?(3)如果身高相差20 cm,其年龄相差多少?思路点拨:本例考查对两个变量进行回归分析首先求出相关系数,根据相关系数的大小判断其是否线性相关,由此展开运算解(1)设年龄为x,身高为y,则(341516)9.5,(90.897.6
2、167.5173.0)131.985 7,x1 491,y252 958.2,xiyi18 990.6,14 17 554.1,x14()2227.5,y14()29 075.05,xiyi14 1 436.5,r0.999 7.因此,年龄和身高之间具有较强的线性相关关系(2)由(1)得b6.314,ab131.985 76.3149.572,x与y的线性回归方程为y6.314x72.因此,如果年龄相差5岁,那么身高相差6.314531.57(cm)(3)如果身高相差20 cm,年龄相差3.1683(岁)分析两个变量线性相关的常用方法1散点图法,该法主要是用来直观地分析两变量间是否存在相关关系
3、2相关系数法,该法主要是从量上分析两个变量间相互联系的密切程度,|r|越接近于1,相关程度越大;|r|越接近于0,相关程度越小1某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,提到如下数据:单价x(元)88.28.48.68.89销量y(件)908483807568(1)求回归直线方程ybxa,其中b20,ab;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润销售收入成本)解(1)由于(x1x2x3x4x5x6)8.5,(y1y2y3y4y5y6)80.所以ab80208.5
4、250,从而回归直线方程为y20x250.(2)设工厂获得的利润为L元,依题意得Lx(20x250)4(20x250)20x2330x1 000202361.25.当且仅当x8.25时,l取得最大值故当单价定为8.25元时,工厂可获得最大利润条件概率【例2】盒子里装有16个球,其中6个是玻璃球,10个是木质球,玻璃球中有2个是红球,4个是蓝球;木质球中有3个是红球,7个是蓝球现从中任取一个(假设每个球被取到是等可能的)是蓝球,问该球是玻璃球的概率是多少?思路点拨: 要注意B发生时A发生的概率与A,B同时发生的概率的区别解 设事件A:“任取一球,是玻璃球”;事件B:“任取一球,是蓝球”由题中数据
5、可列表如下:红球 蓝球 总计玻璃球 2 4 6木质球 3 7 10总计 5 11 16 由表知,P(B),P(AB),故所求事件的概率为P(A|B).条件概率的内容与注意的项1条件概率公式揭示了条件概率P(A|B)与事件概率P(B)、 P(AB)三者之间的关系下列两种情况可利用条件概率公式:一种情况是已知P(B)和P(AB)时去求出P(A|B);另一种情况是已知P(B)和P(A|B)时去求出P(AB)对于后一种情况,为了方便也常将条件概率公式改写为如下的乘法公式:若P(A)0,有P(AB)P(A)P(B|A)2乘法公式与条件概率公式实际上是一个公式,要求 P(AB)时,必须知道P(A|B)或P
6、(B|A);反之,要求P(A|B)时,必须知道积事件AB的概率P(AB),在解决实际问题时,不要把求P(AB)的问题误认为是求P(A|B)的问题2有外形相同的球分装三个盒子,每盒10个其中,第一个盒子中有7个球标有字母A,3个球标有字母B;第二个盒子中有红球和白球各5个;第三个盒子中则有红球8个,白球2个试验按如下规则进行:先在第一个盒子中任取一个球,若取得标有字母A的球,则在第二个盒子中任取一个球;若第一次取得标有字母B的球,则在第三个盒子中任取一个球如果第二次取出的是红球,则称试验为成功求试验成功的概率解 设A从第一个盒子中取得标有字母A的球B从第一个盒子中取得标有字母B的球,C从第二个盒
7、子中取一个红球,D从第三个盒子中取一个红球,则容易求得P(A),P(B),则P(C),P(D).显然,事件AC与事件BD互斥,且事件A与C是相互独立的,所以试验成功的概率为PP(AC)P(BD)P(A)P(C)P(B)P(D),所以本次试验成功的概率为.独立性检验【例3】考察黄烟经过药物处理跟发生青花病的关系,得到如下数据:在试验的470株黄烟中,经过药物处理的黄烟有25株发生青花病,60株没有发生青花病;未经过药物处理的有185株发生青花病,200株没有发生青花病试推断经过药物处理跟发生青花病是否有关系思路点拨:提出假设,根据22列联表求出2,从而进行判断解由已知得到下表:药物处理未经过药物
8、处理总计青花病25185210无青花病60200260总计85385470假设经过药物处理跟发生青花病无关根据22列联表中的数据,可以求得29.788.因为26.635,所以我们有99%的把握认为经过药物处理跟发生青花病是有关系的独立性检验问题的基本步骤1找相关数据,作列联表2求统计量2.3判断可能性,注意与临界值做比较,得出事件有关的可信度3某学校高三年级有学生1 000名,经调查研究,其中750名同学经常参加体育锻炼(称为A类同学),另外250名同学不经常参加体育锻炼(称为B类同学)现用分层抽样方法(按A类、B类分两层)从该年级的学生中共抽查100名同学,如果以身高达165 cm作为达标的标准,对抽取的100名学生,得到以下列联表:体育锻炼与身高达标22列联表:身高达标身高不达标总计积极参加体育锻炼40不积极参加体育锻炼15总计100(1)完成上表;(2)请问体育锻炼与身高达标是否有关系?(2值精确到0.01)参考公式:2.解(1)身高达标身高不达标总计积极参加体育锻炼403575不积极参加体育锻炼101525总计5050100(2)根据列联表得21.332.706,所以没有充分的理由说明体育锻炼与身高达标有关系