1、第九章 统计、统计案例、算法初步第三节变量间的相关关系 统计案例第九章 统计、统计案例、算法初步主干知识梳理一、变量间的相关关系1常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种关系2从散点图上看,点分布在从左下角到右上角的区域内,两个变量的这种相关关系称为,点分布在左上角到右下角的区域内,两个变量的相关关系为非确定性正相关负相关第九章 统计、统计案例、算法初步二、两个变量的线性相关1从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有,这条直线叫线性相关关系回归直线第九章 统计、统计案例、算法初步第九章 统
2、计、统计案例、算法初步第九章 统计、统计案例、算法初步当r0时,表明两个变量;当r0时,表明两个变量r的绝对值越接近于1,表明两个变量的线性相关性r的绝对值越接近于0时,表明两个变量之间通常|r|大于时,认为两个变量有很强的线性相关性正相关负相关越强几乎不存在线性相关关系0.75第九章 统计、统计案例、算法初步y1y2合计x1ababx2cdcd总计acbdabcd第九章 统计、统计案例、算法初步第九章 统计、统计案例、算法初步2用K2的大小可以决定是否拒绝原来的统计假设H0,若K2值较大,就拒绝H0,即拒绝事件A与B无关3当K23.841时,则有95%的把握说事件A与B有关;当K26.635
3、时,则有99%的把握说事件A与B有关;当K22.706时,则有90%的把握说事件A与B有关第九章 统计、统计案例、算法初步基础自测自评1(教材习题改编)观察下列各图形第九章 统计、统计案例、算法初步其中两个变量x、y具有相关关系的图是()ABCDC由散点图知具有相关关系第九章 统计、统计案例、算法初步第九章 统计、统计案例、算法初步第九章 统计、统计案例、算法初步3在一次对性别与说谎是否相关的调查中,得到如下数据:说谎不说谎合计男6713女8917合计141630第九章 统计、统计案例、算法初步第九章 统计、统计案例、算法初步4某考察团对全国10大城市的居民人均工资收入x(万元/年)与居民人均
4、消费y(万元/年)进行统计调查,发现y与x具有相关关系,且y对x的回归方程为0.66x1.562.若某城市居民人均消费为7.675(万元/年),估计该城市人均消费占人均工资收入的百分比约为_第九章 统计、统计案例、算法初步第九章 统计、统计案例、算法初步5已知x,y之间的数据如表所示,则回归直线过点_.x 12345y 1.21.82.53.23.8第九章 统计、统计案例、算法初步第九章 统计、统计案例、算法初步关键要点点拨1回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的线性回归方程才有实际意义,否则,求出的线性回归方程毫无意义2由回归方程进行预报,仅是
5、一个预报值,而不是真实发生的值3使用K2统计量作22列联表的独立性检验时,要求表中的4个数据都要大于5,在选取样本容量时一定要注意第九章 统计、统计案例、算法初步相关关系的判断第九章 统计、统计案例、算法初步第九章 统计、统计案例、算法初步规律方法1相关关系的判断方法一是利用散点图直观判断,二是利用相关系数作出判断2对于由散点图作出相关性判断时,若散点图呈带状且区域较窄,说明两个变量有一定的线性相关性,若呈曲线型也是有相关性3由相关系数r判断时|r|越趋近于1相关性越强第九章 统计、统计案例、算法初步第九章 统计、统计案例、算法初步第九章 统计、统计案例、算法初步典题导入某电脑公词有6名产品推
6、销员,其工作年限与年推销金额的数据如下表:回归方程的求法及回归分析推销员编号12345工作年限x/年35679推销金额y/万元23345第九章 统计、统计案例、算法初步(1)以工作年限为自变量x,推销金额为因变量y,作出散点图;(2)求年推销金额y关于工作年限x的线性回归方程第九章 统计、统计案例、算法初步第九章 统计、统计案例、算法初步第九章 统计、统计案例、算法初步跟踪训练2(1)已知x、y取值如下表:x 014568y 1.31.85.66.17.49.3第九章 统计、统计案例、算法初步第九章 统计、统计案例、算法初步(2)(2013东北四校联考)某超市为了了解热茶的销售量y(单位:杯)
7、与气温x(单位:)之间的关系,随机统计了某4天卖出的热茶的杯数与当天气温,并制作了对照表:气温()1813101杯数24343864第九章 统计、统计案例、算法初步第九章 统计、统计案例、算法初步第九章 统计、统计案例、算法初步典题导入 (2014东北三省四市第三次联考)为了研究玉米品种对产量的影响,某农科院对一块试验田种植的一批玉米共10 000株的生长情况进行研究,现采用分层抽样方法抽取50株作为样本,统计结果如下:独立性检验高茎矮茎合计圆粒111930皱粒13720合计242650第九章 统计、统计案例、算法初步(1)现采用分层抽样的方法,从该样本所含的圆粒玉米中取出6株玉米,再从这6株
8、玉米中随机选出2株,求这2株之中既有高茎玉米又有矮茎玉米的概率;(2)根据对玉米生长情况作出的统计,是否能在犯错误的概率不超过0.050的前提下认为玉米的圆粒与玉米的高茎有关?下面的临界值表和公式可供参考:P(K2k)0.150.100.050.0250.0100.0050.001k2.0722.7063.8415.0246.6357.87910.828第九章 统计、统计案例、算法初步第九章 统计、统计案例、算法初步(2)根据已知列联表:高茎矮茎合计圆粒 11 19 30皱粒 13720合计 24 26 50第九章 统计、统计案例、算法初步第九章 统计、统计案例、算法初步第九章 统计、统计案例
9、、算法初步跟踪训练3(2014沈阳市二测)为了研究“教学方式”对教学质量的影响,某高中数学老师分别用两种不同的教学方式对入学数学平均分数和优秀率都相同的甲、乙两个高一新班进行教学(勤奋程度和自觉性都一样)以下茎叶图为甲、乙两班(每班均为20人)学生的数学期末考试成绩第九章 统计、统计案例、算法初步(1)现从甲班数学成绩不低于80分的同学中随机抽取两名同学,求成绩为87分的同学至少有一名被抽中的概率;(2)学校规定:成绩不低于75分的为优秀请填写下面的22列联表,并判断有多大把握认为“成绩优秀与教学方式有关”.甲班乙班合计优秀不优秀合计第九章 统计、统计案例、算法初步下面临界值表仅供参考:P(2
10、k)0.150.100.050.0250.0100.0050.001k2.0722.7063.8415.0246.6357.87910.828第九章 统计、统计案例、算法初步第九章 统计、统计案例、算法初步(2)甲班乙班合计优秀61420不优秀14620合计202040第九章 统计、统计案例、算法初步【创新探究】线性回归方程解答题(2012福建高考)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单位x(元)8 8.28.48.68.89销量y(件)908483807568第九章 统计、统计案例、算法初步第九章 统计、统计案例、算法初步第九章 统计、统
11、计案例、算法初步第九章 统计、统计案例、算法初步第九章 统计、统计案例、算法初步第九章 统计、统计案例、算法初步体验高考1(2013福建高考)已知x与y之间的几组数据如下表:x123456y021334第九章 统计、统计案例、算法初步第九章 统计、统计案例、算法初步第九章 统计、统计案例、算法初步2(2013福建高考)某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的
12、日平均生产件数分成5组:50,60),60,70),70,80),80,90),90,100分别加以统计,得到如图所示的频率分布直方图第九章 统计、统计案例、算法初步第九章 统计、统计案例、算法初步(1)从样本中日平均生产件数不足60件的工人中随机抽取2人,求至少抽到一名“25周岁以下组”工人的概率;(2)规定日平均生产件数不少于80件者为“生产能手”,请你根据已知条件完成22列联表,并判断是否有90%的把握认为“生产能手与工人所在的年龄组有关”?第九章 统计、统计案例、算法初步P(2k)0.1000.0500.0100.001k2.7063.8416.63510.828第九章 统计、统计案例
13、、算法初步解析(1)由已知得,样本中有25周岁以上组工人60名,25周岁以下组工人40名所以,样本中日平均生产件数不足60件的工人中,25周岁以上组工人有600.053(人),记为A1,A2,A3;25周岁以下组工人有400.052(人),记为B1,B2.从中随机抽取2名工人,所有的可能结果共有10种,它们是:(A1,A2),(A1,A3),(A2,A3),(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2)第九章 统计、统计案例、算法初步第九章 统计、统计案例、算法初步(2)由频率分布直方图可知,在抽取的100名工人中,“25周岁以上组”中的生产能手有600.2515(人),“25周岁以下组”中的生产能手有400.37515(人),据此可得22列联表如下:生产能手非生产能手合计25周岁以上组15456025周岁以下组152540合计3070100第九章 统计、统计案例、算法初步第九章 统计、统计案例、算法初步课时作业