1、第三章统计案例1回归分析11回归分析(教师用书独具)三维目标1知识与技能(1)了解回归分析的基本思想,会对两个变量进行回归分析(2)明确建立回归模型的基本步骤,并对具体问题进行回归分析(3)会解决实际问题2过程与方法(1)通过实际问题去理解回归分析的必要性,明确回归分析的基本思想(2)从散点图中的点的分布上,发现直接求回归直线方程存在明显不足,从中引导学生去发现解决问题的新思路进行回归分析3情感、态度与价值观(1)培养学生用整体的观点和互相联系的观点,来分析问题(2)进一步加强数学的应用意识,培养学生学好数学、用好数学的信心(3)加强与现实生活中的联系,以科学的态度评价两个变量的相关关系重点难
2、点重点:掌握回归分析的步骤、相关系数、建立回归模型的步骤;体会有些非线性模型通过变换,可以转化为线性回归模型;在解决实际问题的过程中寻找更好的建型方法难点:求线性回归方程的系数a,b;相关系数;选择不同的模型建模回归分析主要是研究两个变量间的关系,是在必修三的基础上学习,教材的1.1回归分析是复习必修三的内容,为了使建立回归方程有意义,提出了相关系数,这与回归直线中b的系数有关联,教师可通过实例,让学生了解相关系数的大小与线性相关的关系;在现实中又有一种非线性的相关性,如何解决引导学生转化为线性关系,主要通过数形结合思想、函数思想,使问题化归为线性关系,教学中可通过提醒、猜想、练习等方法,使学
3、生掌握本节的重点内容(教师用书独具)教学建议 建议本节课用3课时讲解完成教学中通过组织学生自己动手操作计算、观察、分析、交流、讨论、归纳让他们在探究学习中经历知识形成的全过程,从而形成“自主探究、合作交流”的数学学习方法教师在课堂上可以用计算机软件进行参数的估计、相关系数的计数,让学生掌握利用计算器进行线性回归方程的求解和评价教学流程第1课时以实际问题作为课题引入回顾建立回归直线方程的基本步骤通过实例巩固、体验线性回归直线方程的求法及应用第2课时提出新问题,如何用其他方法刻画变量之间的线性相关师生共同探究,得出相关系的概念及相关系数的大小与线性相关之间的关系通过例题,巩固验证相关系数刻画变量之
4、间的线性相关的特点第3课时引导学生探究如果不是线性回归模型,如何估计参数,能否利用线性回归模型对数据进行分析变换后,对新数据建立线性模型转化为原来变量模型,得出结论,总结建模思想,补充拓展课堂小结并完成当堂双基达标,巩固本节所学知识.课标解读1.通过实例掌握回归分析的基本思想方法2利用最小二乘法会求线性回归直线方程,并能用线性回归直线方程进行预报.变量之间的相关关系【问题导思】1正方形的面积S与其边长a是什么关系?圆的周长l与半径r是什么关系?【提示】Sa2,l2r,它们都是确定的函数关系2父亲的身高与儿子的身高之间有何关系?耕种深度与水稻产量之间有何关系?【提示】非确定关系1变量之间有一定的
5、联系,但不能完全用函数来表达如人的体重y与身高x.一般来说,身高越高,体重越重,但不能用一个函数来严格地表示身高与体重之间的关系相关关系是非确定性关系,因变量的取值具有一定的随机性2在考虑两个变量的关系时,为了对变量之间的关系有一个大致的了解,人们通常将变量所对应的点描出来,这些点就组成了变量之间的一个图,通常把这种图叫作变量之间的散点图线性回归方程【问题导思】1确定线性回归方程,只需得出哪两个量?【提示】确定线性回归直线方程,只需确定a,b两个量即可2在线性回归方程yabx中,当一次项系数b为正数时,说明两个变量有何相关关系?在散点图上如何反映?【提示】说明两个变量正相关,在散点图上自左向右
6、看这些点呈上升趋势假设样本点为(x1,y1),(x2,y2),(xn,yn),设线性回归方程为yabx,要使这n个点与直线yabx的“距离”平方之和最小,即使得Q(a,b)(y1abx1)2(y2abx2)2(ynabxn)2达到最小,a,b需满足b,ab.由数据求线性回归方程已知x,y之间一组数据:x0123y1357(1)分别计算:、x1y1x4y4,xxx;(2)求出线性回归方程ybxa.【思路探究】可利用表格的数直接计算,然后把这些结果代入线性回归方程系数公式,分别求得a,b,再求出线性回归方程【自主解答】(1)1.5,4,x1y1x4y40113253734,xxx021222321
7、4;(2)b2;ab421.51.故y2x1.答:(1)所求的值分别为:1.5,4,34,14;(2)所求的线性回归方程是:y2x1.求线性回归方程的步骤:(1)列表求出,x,xiyi;(2)利用公式b,ab,求出b,a;(3)写出线性回归方程观察两相关量得如下数据:x1234553421y9753115379求两变量间的回归方程【解】列表i12345678910xi1234553421yi9753115379x14916252591641xiyi9141512551512149由此可得0,0,x110,xiyi110,b1,ab0,所求回归方程为yx.求实际问题的回归方程某企业想通过做广告来
8、提高自己的知名度,经预测可知本企业产品的广告费支出x与销售额y(单位:百万元)之间有如下对应数据:x24568y3040605070(1)判断y与x是否具有线性相关关系;(2)求回归直线方程【思路探究】先画出散点图,即可判断y与x是否具有相关关系,如果y与x具有相关关系可将有关数据代入公式求得回归直线方程【自主解答】(1)散点图如图所示:根据散点图可知,所给的数据点都在一条直线的附近,所以y与x具有线性相关关系(2)列出下表,并且科学地的进行有关计算i12345xi24568yi3040605070xiyi601603003005605,50,x145,y135 000,xiyi1 380于是
9、可得,b6.5,ab506.5517.5,于是所求的回归直线方程是y6.5x17.5.对一级数据进行线性回归分析时,应先画出其散点图,看其是否呈直线形,再依系数a、b的计算公式,算出a、b.由于计算量较大,所以在计算时应借助技术手段,认真细致,谨防计算中产生错误某医院用光电比色计检验尿汞时,得尿汞含量(毫克/升)与消光系数如下表:汞含量x246810消光系数y64138205285360(1)作散点图;(2)如果y与x之间具有线性相关关系,求线性回归方程【解】(1)散点图如图(2)由散点图可知,y与x呈相关关系,设线性回归方程为:ybxa.经计算:得6,210.4,x220,xiyi7 790
10、.b36.95,a210.436.95611.3.线性回归方程为y36.95x11.3.利用回归直线方程进行统计某商场经营一批进价是30元/台的小商品,在市场试验中发现,此商品的销售单价x(x取整数)元与日销售量y台之间有如下关系:x35404550y56412811(1)画出散点图,并判断y与x是否具有线性相关关系;(2)求日销售量y对销售单价x的线性回归方程;(3)设经营此商品的日销售利润为P元,根据(2)写出P关于x的函数关系式,并预测当销售单价x为多少元时,才能获得最大日销售利润【思路探究】两个变量呈现近似的线性关系,可通过公式计算出其线性回归方程,并根据方程求出其预测值【自主解答】(
11、1)散点图如图所示,从图中可以看出这些点大致分布在一条直线附近,因此两个变量线性相关(2)(35404550)42.5,(56412811)34,xiyi35564041452850115 410,x3524024525027 350,b2.96.ab34(2.96)42.5159.8.y2.96x159.8.(3)依题意有P(2.96x159.8)(x30)2.96x2248.6x4 794,当x42时,P有最大值,约为426,即预测销售单价为42元时,能获得最大日销售利润1b2.96是斜率的估计值,说明单价每增加一个单位,日销售量就减少2.96.2借助于回归方程对实际问题的估计值是个近似值
12、,不是一个准确值假设关于某设备的使用年限x和所支出的维修费y(万元)有如下的统计资料:x23456y2.23.85.56.57.0若由资料可知y对x呈线性相关关系(1)求线性回归方程;(2)估计使用年限为10年时,维修费用是多少万元?【解】(1)列表如下:ixiyixxiyi122.244.4233.8911.4345.51622.0456.52532.5567.03642.0202590112.3由此可得:4,5.进而可以求得b1.23,ab0.08.线性回归方程为y0.081.23x.(2)当x10时,y0.081.231012.38(万元),即估计使用10年时维修费用是12.38万元.数
13、形结合思想在回归分析中的应用(12分)下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨标准煤)与相应的生产能耗y(吨标准煤)的几组对照数据x3456y2.5344.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程ybxa;(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?(参考数值:32.5435464.566.5)【思路点拨】(1)可直接由表格提供的点,列出散点图;(2)可利用线性回归方程中a,b公式直接求解;(3)直接用方程来估
14、计所求值【规范解答】(1)图形如图所示3分(2)4.5;3.5;xiyi32.5435464.566.5.x3242526286. 6分b0.7, 8分ab3.50.74.50.35. 9分y0.7x0.35. 10分(3)现在生产100吨甲产品用煤y0.71000.3570.35,降低9070.3519.65吨标准煤. 12分线性回归方程的应用(1)描述两变量间的依存关系;(2)利用回归方程可进行预测;(3)利用回归方程还可以进行统计控制1作回归分析要有实际意义2回归分析前,最好先做出散点图3应用回归分析预测时,最好先作出散点图1下列说法正确的是()A任何两个变量都具有相关关系B球的体积与该
15、球的半径具有相关关系C农作物的产量与施化肥量之间是一种确定性的关系D某商品的生产量与该商品的销售价格之间是一种非确定性的关系【解析】两个变量之间的关系有两种,即函数关系与相关关系,故A错误B中球的体积与该球的半径是函数关系C中农作物的产量与施化肥量之间不是严格的函数关系,但是具有相关关系,因而是非确定性的关系D中商品的生产量还和市场需求有关,故商品的生产量与该商品的销售价格之间是非确定性的关系故选D.【答案】D2一位母亲记录了儿子3岁9岁的身高(数据略),由此建立的身高y(单位:cm)与年龄x(单位:岁)的回归模型为y7.19x73.93.用这个模型预测这个孩子10岁时的身高,则下列叙述正确的
16、是()A身高一定是145.83 cmB身高在145.83 cm以上C身高在145.83 cm以下D身高在145.83 cm左右【解析】x10时,y7.191073.93145.83,但这是预测值而不是精确值,所以只能选D.【答案】D3在一次实验中,测得(x,y)的四组值分别是A(1,2),B(2,3),C(3,4),D(4,5),则y与x之间的线性回归方程为_【解析】通过检验A,B,C,D四点共线,都在直线yx1上【答案】yx14已知一个回归直线方程为y1.5x45,x1,7,5,13,19,求.【解】由已知可知:9.又回归直线过点(,),1.545,即1.594558.5.一、选择题1对具有
17、线性相关关系的两个变量建立的线性回归方程yabx中,回归系数b()A可以小于0B只能大于0C可能等于0D只能小于0【解析】b可能大于0,也可能小于0,但当b0时,x,y不具有线性相关关系【答案】A2下列两个变量间的关系不是函数关系的是()A正方体的棱长与体积B角的弧度数与它的正弦值C单产为常数时,土地面积与粮食总产量D日照时间与水稻亩产量【解析】A、B、C都可以得出一个函数关系式,而D不能写出确定的函数关系式,它只是一个不确定关系【答案】D3某产品的广告费用x与销售额y的统计数据如下表:广告费用x(万元)4235销售额y(万元)49263954根据上表可得回归方程ybxa中的b为9.4,据此模
18、型预报广告费用为6万元时销售额为()A63.36万元B65.5万元C67.7万元D72.0万元【解析】3.5,42,ab429.43.59.1,回归方程为y9.4x9.1,当x6时,y9.469.165.5,故选B.【答案】B4由一组样本数据(x1,y1),(x2,y2),(xn,yn)得到回归直线方程ybxa,那么下列说法中不正确的是()A直线ybxa必经过点(,)B直线ybxa至少经过点(x1,y1)(x2,y2),(xn,bn)中的一个点C直线ybxa的斜率为D直线ybxa的纵截距为b【解析】回归直线可以不经过任何一个点其中A:由ab代入回归直线方程ybxa,即yb(x)过点(,)B错误
19、【答案】B5已知两个变量x和y之间具有线性相关性,甲、乙两个同学各自独立地做了10次和15次试验,并且利用线性回归的方法求得回归直线分别为l1和l2,已知两个人在试验中发现对变量x的观测数据的平均数都为s,对变量y的观测数据的平均数都是t,则下列说法正确的是()Al1与l2一定有公共点(s,t)Bl1与l2相交,但交点一定不是(s,t)Cl1与l2必定平行Dl1与l2必定重合【解析】由于回归直线ybxa恒过(,)点,又两人对变量x的观测数据的平均值为s,对变量y的观测数据的平均值为t,所以l1和l2恒过点(s,t)【答案】A二、填空题6从某大学随机选取8名女大学生,其身高x(cm)和体重y(k
20、g)的线性回归方程为y0.849x85.712,则身高172 cm的女大学生,由线性回归方程可以预测其体重约为_【解析】将x172代入线性回归方程y0.849x85.712,有y0.84917285.71260.316(kg)【答案】60.316 kg7面对竞争日益激烈的消费市场,众多商家不断扩大自己的销售市场,以降低生产成本某白酒酿造企业市场部对该企业9月份的产品销量(单位:千箱)与单位成本的资料进行线性回归分析,结果如下:,71,x79,xiyi1 481.b1.818 2,a71(1.818 2)77.36,则销量每增加1 000箱,单位成本下降_元【解析】由上表可得,y1.818 2x
21、77.36,销量每增加1千箱,则单位成本下降1.818 2元【答案】1.818 28调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程:y0.254x0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加_万元【解析】由题意知0.254(x1)0.321(0.254x0.321)0.254.【答案】0.254三、解答题9某电脑公司有6名产品推销员,其工作年限与年推销金额数据如下表:推销员编号12345工作年限x/年35679推销金额y/万元23345(1)求年推销金额
22、y关于工作年限x的线性回归方程;(2)若第6名推销员的工作年限为11年,试估计他的年推销金额【解】(1)设所求的线性回归方程为ybxa,则b0.5,ab0.4.所以年推销金额y关于工作年限x的线性回归方程为y0.5x0.4.(2)当x11时,y0.5x0.40.5110.45.9(万元)所以可以估计第6名推销员的年推销金额为5.9万元10一种机器可以按各种不同速度运转,其生产物件中有一些含有缺点,每小时生产有缺点物件的多少随机器运转速度而变化,用x表示转速(单位:转/秒),用y表示每小时生产的有缺点物件个数现观测得到(x,y)的4组值为(8,5),(12,8),(14,9),(16,11)(1
23、)假设y与x之间存在线性相关关系,求y与x之间的线性回归方程(2)若实际生产中所容许的每小时最大有缺点物件数为10,则机器的速度不得超过多少转/秒?(精确到1)【解】(1)设回归方程为yabx,则12.5,8.25,x660,xiyi438,b0.73,ab8.250.7312.50.875,所以所求回归方程为y0.8750.73x.(2)由y10,即0.8750.73x10,得x15,即机器速度不得超过15转/秒11高二(3)班学生每周用于数学学习的时间x(单位:小时)与数学成绩y(单位:分)之间有如下数据:x24152319161120161713y92799789644783687159
24、若某同学每周用于数学学习的时间为18小时,试预测该同学的数学成绩【解】显然学习时间与学习成绩间具有相关关系,可以列出下表,并用科学计算器进行计算i12345678910xi24152319161120161713yi92799789644783687159xiyi2 2081 1852 2311 6911 0245171 6601 0881 207767x3 182,xiyi13 578于是可得b3.53,ab74.93.5317.413.5.因此可求得回归直线方程为y3.53x13.5.当x18时,y3.531813.577.故该同学预计可得77分左右.(教师用书独具)在一段时间内,某种商品
25、的价格x(万元)和需求量y(t)之间的一组数据如下表所示:价格x1.41.61.822.2需求量y1210753(1)画出散点图;(2)求出y对x的回归直线方程;(3)如价格定为1.9万元,预测需求量大约是多少(精确到0.01 t)【思路探究】先根据所给数据画出散点图,判断y与x是否具有线性相关关系,在此基础上利用回归方程系数的有关公式,求出相应的系数,然后结合函数知识预测需求量【自主解答】(1)散点图如图所示(2)采用列表的方法计算a与回归系数b.序号xiyixxiyi11.4121.9616.821.6102.561631.873.2412.642541052.234.846.693716
26、.66291.8,377.4,b11.5,a7.411.51.828.1.所以y对x的回归直线方程为yabx28.111.5x.(3)当x1.9时,y28.111.51.96.25,所以价格定为1.9万元时,需求量大约是6.25 t.解答本类题目的关键首先应先通过散点图来分析两变量间的关系是否相关,然后再利用求回归方程的公式求解回归方程,在此基础上,借助回归方程对实际问题进行预测已知10只狗的血球体积x(单位:mm3)及红血球数y(单位:百万)的测量值如下:x45424648423558403950y6.536.309.257.506.995.909.496.206.557.72(1)画出散点
27、图;(2)求出y对x的回归线性方程;(3)若血球体积为49 mm3,预测红血球数大约是多少?【解】(1)散点图如图(2)设线性回归方程为ybxa,由表中数据代入公式,得b0.16,ab0.12.所以所求线性回归方程为y0.16x0.12.(3)把x49代入线性回归方程得:y0.16490.127.96(百万),计算结果表明,当血球体积为49 mm3时,红血球数大约为7.96百万拓展阅读GDDS和SDDS随着世界经济一体化的加快,各国间的交流与合作越来越频繁,为加强国际组织对各国经济运行状况的监督,国际社会在各领域纷纷建立了国际通行标准,其中国际货币基金组织(简称IMF)制定的数据公布通用系统(
28、简称GDDS)和数据公布特殊标准(简称SDDS)GDDS的主要内容和要求:在统计范围内,它将国民经济活动划分为5大经济部门,对每一部门各选定一组能够反映其活动实绩和政策以及可以帮助理解经济发展和结构变化的最为重要的数据系统提出了五大部门综合框架和相关的数据类别和指标编制、公布的目标选定的数据类别和指标中规定为主要部分SDDS将国民经济活动划分为4大经济部门选定的数据类别分为:必须的、受鼓励的和“视相关程度”三类必须的数据类别包括:综合统计框架、跟踪性数据、与部门有关的其他数据. IMF为什么制定GDDS和SDDS呢?进入20世纪90年代以来,世界一些地区金融危机频繁爆发.1994年墨西哥的金融
29、危机、1997年东南亚金融危机都导致国际金融市场剧烈动荡两次金融危机给IMF一个深刻的教训,也对其职能提出了挑战,在总结经验教训的基础上,IMF认为,在新的国际经济、金融形势下,必须制定统一的数据发布标准,使各成员国按照统一程序提供全面、准确的经济金融信息,从而可以有效及时地对各国的经济进行正确的分析预测,从宏观上来作出调控,减少金融危机的发生和影响12相关系数课标解读1.了解两个随机变量间的线性相关系数r,并能利用公式求出相关系数r;了解正相关、负相关、不相关的概念2能利用相关系数r判断两个随机变量间线性相关程度的大小,从而判断回归直线拟合的效果.相关系数【问题导思】1有什么办法判断两个变量
30、是否具有线性相关关系?【提示】作出散点图,看这些点是否在某一直线的附近,计算线性相关系数2线性相关系数与最小误差有何关系?【提示】Q(误差)lyy(1r2)3相关系数r的绝对值的大小对相关性有何影响?【提示】|r|越大,变量之间的相关程度越高;|r|越小,变量间线性相关程度越低;当r0时,两个变量线性不相关4r的正负对相关性的影响【提示】r0,b0两变量正相关;r0,b0,因此施化肥量和水稻产量近似成线性正相关关系线性回归分析的综合应用“阿曼德匹萨”是一个制作和外卖意大利匹萨的餐饮连锁店,其主要客户群是在校大学生,为研究各店铺的销售额与店铺附近地区大学生人数的关系,随机抽取十个分店的样本,得到
31、数据如下:店铺编号区内大学生数(万人)季度销售额(万元)10.25.820.610.530.88.840.811.851.211.761.613.77215.78216.992.214.9102.620.2(1)试对区内大学生人数与店铺的销售额的关系进行相关性检验;(2)试根据这些数据建立回归模型,然后再进一步根据回归方程预测一个区内大学生人数1万人店铺的季度销售额;(3)若店铺的季度销售额低于10万元则亏损,试求建店区内大学生人数至少约多少人?【思路探究】先根据表中的数据作相关检验,然后判断是否具有相关关系,再根据所给的数据解出线性回归方程,最后进行预测【自主解答】(1)根据数据我们对区内大
32、学生人数x与店铺季度销售额y作相关检验根据数据可知:(0.20.62.6)1.4;(5.810.520.2)13,x1025.68,xiyi1028.4,y102157.3,因此r0.95;|r|接近1,因此有把握认为区内大学生人数x与店铺季度销售额y具有线性相关关系,求y对x的回归直线方程有意义(2)回归系数b5,a1351.46.因此回归直线方程是ybxa5x6.当x1时,y51611,即区内大学生人数1万元店铺的季度销售额约11万元(3)由回归直线方程是y5x6.令y10,解得x0.8,所以当建店区内大学生人数至少8 000人时才适合建店进行相关性检验主要有两种常用方法,一是作散点图,观
33、察所给的数据点是否在一条直线的附近,作散点图的优点是既直观又方便,是解决相关性检验问题比较常用的方法;缺点是作图总是存在误差,有时很难判断这些点是不是分布在一条直线的附近二是利用样本相关系数对其进行相关性检验,优点是判断准确,缺点是计算繁琐,但可以借助计算器进行处理在我国某地的一个县城,近期发现了好几个癌症村政府部门十分震惊,马上组成调查组调查病因,经调查发现致癌的罪魁祸首是水源中的金属砷,它们来自附近的几家化工厂,化工厂排出的废水中含有金属砷,废水污染了水源,人食用了这种水就会致癌下面就是调查组对几个癌症村水源中的砷超标的倍数和患癌症的人数统计的数据:砷超标的倍数x345.54.25.863
34、.5患癌症人数y15202824354434(1)画出表中数据的散点图;(2)求y对x的回归方程;(3)若一个村的水源中砷超标的倍数为7,试估计这个村的患癌症的人数【解】(1)散点图如图所示:(2)观察散点图,可知x、y成线性相关关系计算得,根据求b公式代入数据计算得b6.065,a6.0650.846.所以患癌症人数y对水源中砷超标的倍数x的回归直线方程为y6.065x0.846.(3)根据上面求得的回归直线方程,当水源中砷超标的倍数为7时,y6.06570.84643.301.即该村患癌症的人数约为43人对误差的大小与变量相关关系的理解有误对两个变量y和x进行回归分析,得到一组样本数据:(
35、x1,y1),(x2,y2),(xn,yn),则下列说法中不正确的是()A由样本数据得到的回归方程ybxa必过样本点的中心(,)B在回归分析中,误差Q越小,变量之间的线性相关程度越高C相关系数r越小,说明变量之间的线性相关程度越小D在散点图中,若n个点在一条直线上,说明变量之间的相关性强【错解】B【错因分析】对误差Q与变量间的相关关系理解错误【防范措施】正确理解回归方程、相关系数r、误差Q、散点图等概念是解决概念题的基础【正解】误差Q越小,|r|越大,变量之间的线性相关程度越高,而相关系数r的范围为1r1,C错误【答案】C1相关系数是用来刻画两个变量相关关系的强与弱的2相关系数的计算公式r1在
36、对变量y和x进行线性相关检验时,已知n是观测值组数,r是相关系数,且已知:n7,r0.953 3;n15,r0.301 2;n17,r0.499 1;n3,r0.9950.则变量y和x具有较高线性相关程度的是()A和B和C和D和【解析】相关系数r的绝对值越大,变量x,y的线性相关程度越高,故选B.【答案】B2对相关系数r,下列说法正确的是()A|r|越大,相关程度越大B|r|越小,相关程度越大C|r|越大,相关程度越小,|r|越小,相关程度越大D|r|1且|r|越接近于1,相关程度越大,|r|越接近0,相关程度越小【解析】由两个变量相关系数公式r,可知,|r|越接近于1,相关程度越大,|r|越
37、接近于0,相关程度越小,故选D.【答案】D3在回归分析中,相关系数|r|越大,则误差Q(a,b)应_【解析】Qlxy(1r2)0,|r|越大,Q越小【答案】越小4一唱片公司欲知打歌费用x(十万元)与唱片销售量y(千张)之间的关系,从其所发行的唱片中随机抽取了10张,得到如下的资料:xi28,x303.4,yi75,y598.5,xiyi237,求y与x的相关系数r的值【解】由题中数据可知r0.3.一、选择题1对变量x,y有观测数据(xi,yi)(i1,2,10),得散点图;对变量u,v有观测数据(ui,vi)(i1,2,10),得散点图.由这两个散点图可以判断()A变量x与y正相关,u与v正相
38、关B变量x与y正相关,u与v负相关C变量x与y负相关,u与v正相关D变量x与y负相关,u与v负相关【解析】由题图可知,各点整体呈递减趋势,x与y负相关,由题图可知,各点整体呈递增趋势,u与v正相关【答案】C2设(x1,y1),(x2,y2),(xn,yn)是变量x和y的n个样本点,直线l是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论正确的是()图311A直线l过点(,)Bx和y的相关系数为直线l的斜率Cx和y相关系数在0到1之间D当n为偶数时,分布在l两侧的样本点的个数一定相同【解析】回归直线方程yabx中ayb,ybbx,当x时,y,直线l过定点(,)【答案】A3某医学科研
39、所对人体脂肪含量与年龄这两个变量研究得到一组随机样本数据,经计算得y0.577x0.448(x为人的年龄,y为人体脂肪含量)对年龄为37岁的人来说,下面说法正确的是()A年龄为37岁的人体内脂肪含量都为20.90%B年龄为37岁的人体内脂肪含量为21.01%C年龄为37岁的人群中的大部分人的体内脂肪含量为20.90%D年龄为37岁的大部分的人体内脂肪含量为31.5%【解析】x37时,y0.577370.44820.90,因为回归方程得到的y值只是近似的,故选C.【答案】C4若回归直线方程中的回归系数b0,则相关系数为()Ar1Br1Cr0D无法确定【解析】因为b0时,有(xi)(yi)0,故相
40、关关系r0.【答案】C5两个变量满足如下表关系x510152025y103105110111114则两个变量线性相关程度()A较高B较低C不相关D不确定【解析】xi75,yi543,x1 375,xiyi8 285,y59 051,15,108.6.r0.982 6.故两个变量间的线性相关程度较高【答案】A二、填空题6甲、乙、丙、丁四位同学各自对A、B两变量的线性相关性做试验,并用回归分析方法分别求得相关系数r与误差平方和m如下表:甲乙丙丁r0.820.780.690.85m106115124103则_同学的试验结果体现A、B两变量更强的线性相关性【解析】由表可知,丁同学的相关系数r最大且误差
41、平方和m最小,故丁同学的试验结果体现A、B两变量更强的线性相关性【答案】丁7许多因素都会影响贫穷,教育也许是其中之一,在研究这两个因素之间的关系时收集了美国50个州的成年人受过9年或更少教育的百分比(x)和收入低于官方规定的贫困线的人数占本州人数的百分比(y)的数据,建立的回归直线方程如下:y0.8x4.6,斜率的估计值等于0.8,说明_;成年人受过9年或更少教育的百分比(x)和收入低于官方的贫困线的人数占本州人数的百分比(y)之间的相关系数_(填“大于0”或“小于0”)【答案】一个地区受过9年或更少教育的百分比每增加1%,收入低于官方规定的贫困线的人数占本州人数的百分比将增加0.8%左右大于
42、08设变量x与y的相关系数为0.857,现在设y1100y,x11 000x,将单位由y的cm变为y1的m,x的ms变为x1的s,则y1与x1的相关系数为_【解析】新变量是原变量的线性函数(系数大于0)时,样本的相关系数不变【答案】0.857三、解答题9高三一班学生每周用于数学学习的时间x(单位:h)与数学平均成绩y(单位:分)之间有如下数据:x24152319161120161713y92799789644783687169根据这些数据计算相关系数r判断x与y之间是否具有相关关系【解】由表中数据可得17.4,75.9,所以相关系数r0.892.所以x与y具有线性相关关系10在钢铁碳含量对于电
43、阻的效应研究中,得到如下数据表:碳含量x(%)0.100.300.400.550.700.800.9520 时电阻()1518192122.623.626求y与x的线性回归方程,并检验钢铁碳含量与电阻之间的相关关系的显著性【解】由已知数据得xi0.543,145.220.74,x2.595,y3 094.72,xiyi85.45.b12.46,a20.7412.460.54313.97.回归直线方程为y13.9712.46x.下面利用相关系数检验是否显著xiyi785.4570.54320.746.62,x722.5957(0.543)20.531,y723 094.727(20.74)283
44、.687.r0.993.由于r比较接近于1,故钢铁碳含量与电阻之间的线性相关关系较为显著11下面的数据是年龄在40到60岁的男子中随机抽出的6个样本,分别测定了心脏的功能水平y(满分100),以及每天花在看电视上的平均时间x(小时)看电视的平均时间x4.44.62.75.80.24.6心脏功能水平y525369578965(1)求心脏功能水平y与每天花在看电视上的平均时间x之间的相关系数r;(2)求心脏功能水平y与每天花在看电视上的平均时间x的线性回归方程,并讨论方程是否有意义;(3)估计平均每天看电视3小时的男子的心脏功能水平【解】n6,(4.44.64.6)3.716,(525365)64
45、.166 7,x62(4.424.624.62)63.716219.968 3,y62(522532652)664.166 72964.833 3,xiyi6(4.4524.6534.665)63.71664.166 7124.360 7.(1)心脏功能水平y与每天花在看电视上的平均时间x之间的相关系数:r0.896.(2)b6.227 9,ab87.309 6,心脏功能水平y与每天花在看电视上的平均时间x的线性回归方程为y6.227 9x87.309 6.因为|r|0.896,所以有相当大的把握认为y与x之间有线性关系,这个方程是有意义的(3)将x3代入线性回归方程y6.227 9x87.3
46、09 6,可得y68.6,即平均每天看电视3小时,心脏功能水平约为68.6.(教师用书独具)对于x与y有如下观测数据:x1825303941424952y356788910(1)作出散点图;(2)根据数据判断x与y是否具有相关关系;(3)求x与y的回归直线方程;(4)根据回归直线方程,预测y20时x的值【思路探究】解决有关线性回归问题的一般步骤是:散点图相关系数回归方程【自主解答】(1)作出散点图,如图(2)(1825303941424952)37,(356788910)7,18225230239241242249252211 920,32526272828292102428,iyi18325
47、530639741842849952102 257,iyi82 2578377185,8211 9208372968,8242887236,r0.991.由于r0.991接近于1,因此,认为两个变量有很强的相关关系(3)回归系数b0.191,ab70.191370.067,所以y对x的回归直线方程是y0.191x0.067.(4)当y20时,有200.191x0.067,有x105.因此在y的值为20时,x的值约为105.1本题没有说明y对x呈线性相关关系,故需根据散点图先确定变量是否线性相关2相关系数用来检验线性相关性的强弱10名同学在高一和高二的数学成绩如下表:x7471726876736
48、7706574y76757170767965776272其中x为高一数学成绩,y为高二数学成绩(1)y与x是否具有相关关系;(2)如果y与x是相关关系,求回归直线方程;(3)如果某同学在高一时的数学成绩为90分,试估计其在高二时的数学成绩【解】(1)由已知表格中的数据,计算得i710,i723,71,72.3,iyi51 467,50 520,52 541.r0.780 297.由于r0.780 297,可认为x与y之间具有线性相关关系(2)y与x具有线性相关关系,设回归直线方程yabx,则b1.22,ab72.31.227114.32,所以y关于x的回归直线方程为y14.321.22x.(3
49、)y14.321.229095(分)教学拓展如何利用残差图进行残差分析?在回归模型中,残差变量是一个不能被观测的量,即在实际问题中我们无法得到残差变量的观测值因此,我们不能希望有某方法获取残差变量的值以提高预报变量的估计精度,但却可以估计预报变量观测值中所包含的残差变量,这种估计对于查找样本数据中的错误和模型的评价极为有用残差分析是回归诊断的一种方法最简单的残差分析是通过观测残差图,以发现观测数据中可能出现的错误以及所选用的回归模型是否恰当利用残差图进行残差分析的具体步骤如下:计算每组观测数据的残差,iyii(i1,2,n),即残差等于观测值减预测值画残差图残差图的纵坐标为残差,横坐标通常可以
50、是观测样本的序号、自变量x或因变量的预测值等,残差图是一种散点图分析残差图几种常见的残差图如下:图1图2图3图4我们以横坐标为观测样本的序号为例,说明每张图的含义图1:残差散点图中的点分布在以0为中心的水平带形区域上,并且沿水平方向散点的分布的规律相同,说明残差是随机的,所选择的回归模型建模是合理的图2:残差散点图中的点分布在一条倾斜的带形区域上,并且沿带形区域方向散点的分布的规律相同,说明残差与横坐标有线性关系,此时所选用的回归模型的效果不是最好的,有改进的余地. 图3:残差散点图中的点分布在一条二次曲线形的弯曲带形区域上,说明残差与坐标横轴变量有二次关系,此时所选用的回归模型的效果不是最好
51、的,有改进的余地图4:残差散点图中的点的分布范围随着横坐标的增 加而增加,说明残差的方差与坐标横轴变量有关,不是一个常数,此时所选用的回归模型的效果不是最好的,有改进的余地,找异常值根据计算的残差值和残差图,观察残差是否有特别大的那些点,即远离横坐标轴的点如果存在远离坐标轴的点,就要研究它出现的原因,是否在数据收集和录入中出现错误,如果有错误,改正后重新建立回归模型13可线性化的回归分析,(教师用书独具)三维目标1知识与技能2过程与方法3情感、态度与价值观重点难点重点:难点:(教师用书独具)教学建议 教学流程创设问题情境,提出3个问题引导学生解答问题,引出数列的有关概念通过例1及变式训练,使学
52、生进一步认识数列的有关概念通过例2及变式训练,使学生掌握数列的通项公式的求法通过例3及互动探究,让学生掌握利用通项公式确定数列的项的问题完成当堂双基达标,巩固所学知识并进行反馈矫正归纳整理,进行课堂小结,整体认识所学知识课标解读1.通过对典型案例的探究,进一步了解回归分析的基本思想、方法和初步应用2结合具体的实际问题,了解可线性化回归分析问题的解题思路3体会回归分析在生产实际和日常生活中的广泛应用.常见曲线的线性化【问题导思】1函数yaxb两边取自然对数,结果如何?【提示】ln yln abln x.2对上述问题作适当变换,得出一个线性函数【提示】令uln y,vln x,cln a,则ucb
53、v.3作变换,将函数yaebx线性化【提示】yaebx,ln yln abx,作变换:uln y,cln a,则ucbx.4作变换,将函数yae线性化【提示】yae,ln yln a,作变换uln y,cln a,v,则ucbv.5作变换,将函数yabln x线性化【提示】yabln x,作变换vln x,则yabv.对于非线性回归模型一般可转化为线性回归模型,从而得到相应的回归方程常见的有:(1)幂函数曲线yaxb,则作变换uln_y,vln_x,cln_a,得线性函数ucbv.(2)指数曲线yaebx,则作变换uln y,cln a,得线性函数ucbv.(3)倒指数曲线yae,则作变换ul
54、n y,cln a,v,得线性函数ucbv.(4)对数曲线yabln x,则作变换vln x,得线性函数yabv.已知模拟函数求其解析式某地今年上半年患某种传染病人数y与月份x之间满足的函数关系模型为yaebx,确定这个函数解析式月份x123456人数y526168747883【思路探究】函数模型为指数型函数,可转化为线性函数,从而求出【自主解答】设uln y,cln a,则ucbx.由已知得下表:x123456uln y3.951 24.110 94.219 54.3044.356 74.418 8xi21,ui25.361 1,x91,u107.346 7,xiui90.343 8,3.5
55、,4.226 9,b0.090 2,cb4.226 90.090 23.53.911 2,u3.911 20.090 2x,ye3.911 2e0.090 2x.基础函数模型为指数函数型,可两边取对数转化为线性函数关系式,求出回归方程在彩显影中,由经验可知:形成染料光学密度y与析出银的光学密度x由公式yAe(b0)表示现测得试验数据如下:xi0.050.060.250.310.070.100.380.430.140.200.47yi0.100.141.001.120.230.371.191.250.590.791.29试求y对x的回归方程【解】由题意知,对于给定的公式yAe(b1.2,此男子偏
56、胖1在实际问题中,当变量之间的相关关系不是线性相关关系时,不能用线性回归方程描述它们之间的相关关系,需要进行非线性回归分析2可线性化的回归分析:非线性回归问题的非线性回归方程一般很难求,因此把非线性回归化线性回归是解决问题的好方法;把非线性回归化为线性回归,再利用线性回归的方法确定参数a及b的估计值寒假中,某同学为组织一次爱心捐款,于2013年2月1日在网上给网友发了张帖子,并号召网友转发,下表是发帖后一段时间的收到帖子的人数统计天数x1234567人数y711212466115325(1)作出散点图,并猜测x与y之间的关系;(2)建立x与y的关系,预报回归模型;(3)如果此人打算在2013年
57、2月12日(即帖子传播时间共10天)进行募捐活动,根据上述回归模型,估计可去多少人【解】(1)散点图略从散点图可以看出x与y不具有线性相关关系,同时可发现样本点分布在某一个指数函数曲线ykemx的周围,其中k、m是参数(2)对ykemx两边取对数,把指数关系变成线性关系令zln y,则变换后的样本点分布在直线zbxa(aln k,bm)的周围,这样就可以利用线性回归模型来建立x与y之间的非线性回归方程了,数据可以转化为天数x1234567人数y1.9462.3983.0453.1784.1904.7455.784求得回归直线方程为z0.620x1.133,ye0.620x1.133.(3)截止
58、到2013年2月12日,x10,此时ye0.620101.1331 530(人)估计可去1 530人.转化与化归思想在可线性化的回归分析中的应用下表为收集到的一组数据:x21232527293235y711212466115325(1)作出x与y的散点图,并猜测x与y之间的关系;(2)建立x与y的关系,预报回归模型;(3)利用所得模型,预报x40时y的值【思路点拨】(1)可直接依据表中数据画出散点图;(2)可利用换元法,将两个变量转化为两个新的变量且成线性关系;得出关系式,再转化为x,y的关系式;(3)利用(2)中的式子,即可求出【规范解答】(1)作出散点图如图,从散点图可以看出x与y不具有线
59、性相关关系,根据已有知识可以发现样本点分布在某一条指数函数曲线yc1ec2x的周围,其中c1、c2为待定的参数(2)对两边取对数把指数关系变为线性关系,令zln y,则有变换后的样本点应分布在直线zbxa,aln c1,bc2的周围,这样就可以利用线性回归模型来建立y与x之间的非线性回归方程了,数据可以转化为:x21232527293235z1.9462.3983.0453.1784.1904.7455.784求得回归直线方程为z0.272x3.849,ye0.272x3.849.(3)当x40时,ye0.272x3.8491 131.在寻找两变量之间的关系时,通过散点图先确定其关系满足的函数
60、模型,如果不满足线性关系,则通过换元转化为线性关系,求出新元的关系式,再转化为原来的两个变量的关系可化为线性回归的几种常用曲线(1)幂函数曲线yaxb;(2)指数函数曲线yakbx;(3)倒指数曲线yae;(4)对数曲线yabln x.1对于指数曲线yaebx方程,令uln y,cln a经过非线性化回归分析之后,可以转化成的形式为()AucbxBubcxCybcxDycbx【解析】对指数曲线yaebx方程两边同时取对数,然后将uln y,cln a代入,不难得出ucbx.【答案】A2指数曲线yaebx的图像可以是()【解析】yaebx为指数曲线,y0恒成立,排除选项C.又xR,A、D错误【答
61、案】B3x,y的取值如下表:x0.20.61.01.21.41.61.82.02.2y0.040.3611.41.92.53.23.984.82则x、y之间的关系可以选用函数_进行拟合【解析】作出散点图从图中可以看出,可选用yx2来进行拟合【答案】yx24在试验中得到变量y与x数据如下表:x0.066 70.038 80.033 30.027 30.022 5y39.442.941.043.149.2由试验知,y与之间具有线性相关关系,试求y与x之间的回归曲线方程,并预测当x00.038时y0的值【解】令u,由题目所给数据可得下表所示的数据:iuiyiuyuiyi115.039.42251 5
62、52.36591225.842.9665.641 840.411 106.82330.041.09001 6811 230436.643.11 339.561 857.611 577.46544.449.21 971.362 420.642 184.48151.8215.65 101.569 352.026 689.76计算得b0.29,a34.32,所以y34.320.29u.所求曲线方程为y34.32.当x00.038时,y034.3241.95.一、选择题1倒指数曲线yae的图像为()【解析】yae,当a0,b0时,图像为A.【答案】A2有下列说法:线性回归分析就是由样本点去寻找一条直线
63、贴近这些样本点的数学方法;利用样本点的散点图可以直观地判断两个变量之间的关系是否是线性相关关系;通过回归方程ybxa及其回归系数b,可以估计和观测变量的取值和变化趋势;因为由任何一组观测值都可以求得一个回归直线方程,所以没有必要进行相关性检验其中正确命题的个数是()A1个B2个C3个D4个【解析】由线性回归分析的意义知、正确,错误【答案】C3幂函数曲线yxb,当b1时的图像为()【解析】当b1时,图像为选项A,当0b1时为选项B,当b0,c20)附近,则将函数两边取对数得ln yc2xln c1 ,则令uln y,得uc2xln c1,根据数据可得x和u的数据表:x123456u1.792.4
64、83.223.894.555.25由上面x和u的数据表可得x和u的散点图,如下图所示从图中可以发现x和u之间有很强的线性相关关系,因此可以用线性回归模型来拟合它们之间的关系根据公式得到线性回归方程为:u1.1120.690 9x,即ln y1.1120.690 9x,则得ye0.690 9x1.112.故我们可以利用ye0.690 9x1.112来描述天数x与繁殖个数y之间的关系.(教师用书独具)(12分)在一化学反应过程中某化学物质的反应速度y(单位:g/分)与一种催化剂的量x(单位:g)有关,现收集了8组数据列于表中,试建立y与x之间回归方程催化剂量x/(g)151821242730333
65、6化学物质反应速度y(g/分)6830277020565350【思路探究】(1)由表中数据可作出散点图,并通过散点图来分析两个变量间的关系;(2)两个变量间的关系是非线性的,要结合函数模型的应用来选择函数,然后利用变量代换化为直线型,从而解决问题【自主解答】根据收集的数据作散点图:2分根据x与y的散点图也可以认为样本点集中在某一条指数型函数曲线yc1ec2x的周围. 4分令zln y,则zc2xln c1,即变换后样本点应该分布在直线zbxa(aln c1,bc2)的周围,由y与x数据表可得z与x的数据表:x1518212427303336z1.7922.0793.4013.2964.2485
66、.3234.1745.858作出z与x的散点图8分由散点图可观察到样本数据点大致在一条直线上,所以可用线性回归方程来拟合它由z与x数据表,得到线性回归方程,z0.181 2x0.848 5, 10分所以非线性回归方程为ye0.181 2x0.848 5. 11分因此,该化学物质反应速度对催化剂的量的非线性回归方程为ye0.181 2x0.848 5. 12分1解决非线性回归分析的关键是根据散点图选择正确的函数模型2解决非线性回归分析问题的方法步骤(1)确定变量:确定变量x,y;(2)画散点图:通过观察散点图并与学过的函数(幂函数、指数函数、对数函数、二次函数)作比较,选取拟合效果好的函数模型;
67、(3)变量置换:通过变量置换把非线性问题转化为线性回归问题;(4)写出非线性回归方程为了研究某种细菌繁殖的个数y(个)与时间x(天)的关系,收集数据如下:天数x/天123456繁殖个数y/个612254995190(1)作时间和细菌繁殖个数的散点图,根据该图猜想它们之间的关系是什么形式;(2)建立时间与细菌繁殖个数之间的回归方程【解】(1)以时间为横轴,细菌繁殖个数为纵轴绘制散点图如下由图猜想样本点分布在一条指数函数曲线ycebx的周围(2)令zlny,alnc,则zbxa且变换后的样本数据表如下:x123456z1.792.483.223.894.555.25计算得z0.69x1.112,从
68、而得回归模型ye0.69x1.112.拓展阅读脚印与统计在这个逐步实现现代化的社会里,统计信息越来越多,这促使人们去探索对一些统计信息进行分析、推断的方法在福尔摩斯探案集中著名的一个探案故事血字的研究有这样的情节:福尔摩斯应英格兰探长的求助,帮忙侦破一起杀人案一到案发现场,福尔摩斯就开始仔细地搜寻罪犯的脚印,其理由是他可以根据一个人的脚印长度来估计他的身高这里就用到了统计的有关知识因为,统计学家经过对大量数据的统计分析得出这样的结论:一个人的身高大约是其脚印长度的7倍另外步幅长度与身高也有一定关系人的脚印与人的体形、性别也有一定的关系人脚的大小和手臂前臂的长度差不多,如果知道一个人的身高,就可
69、以算出他脚印的长度;如果不知道一个人的身高,可以通过他脚印的长度推算出他的身高血字的研究是柯南道尔于1886年写成,可见有关根据人的脚印长度估计其身高的方法在那时已经初步成型由于这一方法对于破案起着至关重要的作用,所以在犯罪率不断升高的今天,刑警到达案发现场的第一件事情也是仔细地搜寻罪犯的脚印2独立性检验(教师用书独具)三维目标1知识与技能(1)了解独立性检验的基本思想、方法和初步应用(2)会从列联表、柱形图、条形图直观分析两个分类变量是否有关(3)会用2公式判断两个分类变量在某种可信度上的相关性2过程与方法运用数形结合思想,借助对典型案例的探究,来了解独立性检验的基本思想,总结独立性检验的基
70、本步骤3情感、态度与价值观(1)通过本节课的学习,让学生感受数学与现实生活的联系,体会独立性检验的基本思想在解决日常生活问题中的作用(2)培养学生运用所学知识,依据独立性检验的思想作出合理推断的实事求是的好习惯重点难点重点:独立性检验的基本方法及应用难点:独立性检验的基本思想的领会及应用独立性检验相当于建立一个判断“两个分类变量之间有关系”这一结论是否成立的规则,并且给出该规则把“两个分类变量之间没有关系”错判成“两个分类变量之间有关系”的概率因此在数学中首先要教会学生的是了解并初步理解这个规则,然后是会用这个规律解决问题独立性检验难于理解的一个主要之处在于凭空出现一个2,这个变量是怎样构造出
71、来的?为什么如此构造?学生对这一内容会有所怀疑,不一定十分认同为了突破这一难点,可采用先入为主的思想,先讲解,让学生接受统计学上的知识,而后在应用过程中进一步理解,这样学生对独立性检验的思想可能更容易接受(教师用书独具)教学建议 1.在本节课的教学中,要把重点放在独立性检验的统计学原理上,理解独立性检验的基本思想,明确独立性检验的基本步骤所以在教学过程中不应忽略统计学原理的讲解,在讲解的过程中涉及到统计学家时可以适时的引入数学史的介绍,提高学生学习统计学的兴趣2.在独立性检验中,通过典型案例的研究,介绍了独立性检验的基本思想、方法和初步应用独立性检验的基本思想和反证法类似,它们都是假设结论不成
72、立反证法是在假设结论不成立基础上推出矛盾从而证得结论成立,而独立性检验是在假设结论不成立基础上推出有利于结论成立的小概率事件发生,于是认为结论在很大程度上是成立的因为小概率事件在一次试验中通常是不会发生的,所以有利于结论成立的小概率事件的发生为否定假设提供了有力的证据这种教学方法可以使学生更好的理解统计结论的原因,培养学生的随机思想 3.应引入一些计算机基本应用,从而解决计算繁琐问题为了回避繁琐的计算过程,在此介绍电子表格的用法,使学生树立利用现有的技术手段和所学统计知识解决实际问题的意识,打破学生认为统计即为大量运算的思想,统计更重要的在于思想,计算可以交给计算机来做让学生更直观的看到生活中
73、统计快捷的应用 4.在作业环节可设计实习作业,让学生对感兴趣的问题进行调查,从统计调查到分析判断完成一个完整地案例分析,这对学生在今后的工作和生活中有意识的使用统计思想是非常有意义的,体现了新课标题提倡的理念教学流程创设情境,提出问题利用吸烟与患肺癌是否有联系的问题入手,引出今天的课题探究归纳,解决问题通过启发探究,引出随机变量2的部分结构adbc;再通过新知解决,分组讨论总结提升,得出独立性检验的思想通过例1例2及变式训练,引导学生总结独立性检验的步骤假设,列联表,求2,作判断成果展示,巩固提升通过例3及变式训练两个题目的解决加深学生对独立性检验思想的理解,提高学生的参与兴趣小结引伸,建构体
74、系由学生谈本节的收获,并对所学知识进行归纳完成当堂双基达标,巩固本节所学知识.课标解读1.通过对典型案例的探究,了解独立性检验(只要求22列联表)的基本思想、方法及初步应用2知道独立性检验在生物统计、医学统计、企业单位等方面的应用,养成实事求是的科学态度.22列联表与独立性检验【问题导思】1列出两类分类变量的频数表称为什么?【提示】称为列联表,又称为22列联表2设nabcd,用估计P(A1B1),用估计P(A1),用估计P(B1),在什么情况下,A1与B1独立?【提示】若成立3在进行列联表的独立性检验中,使用的是频率、还是概率?【提示】是频率1设A,B为两个变量,每一个变量都可以取两个值,变量
75、A:A1,A2;变量B:B1,B2.通过观察得到下表所示数据:BAB1B2总计A1ababA2cdcd总计acbdnabcd其中,a表示变量A取A1,且变量B取B1时的数据;b表示变量A取A1,且变量B取B2时的数据;c表示变量A取A2,且变量B取B1时的数据;d表示变量A取A2,且变量B取B2时的数据设nabcd,用估计P(A1B1),估计P(A1),估计P(B1)若有式子,则可以认为A1与B1独立同理,若,则可以认为A1与B2独立;若,则可以认为A2与B1独立;若,则可以认为A1与B2独立;但是,在中,由于,表示的是频率,不同于概率即使变量之间独立,式子两边也不一定恰好相等但是当两边相差很
76、大时,变量之间就不独立2选取2作统计量,用它的大小来判断变量之间的独立性2当数据量较大时,在统计中,用以下结果对变量的独立性进行判断(1)当22.706时,没有充分的证据判定变量A,B有关联,可以认为变量A,B是没有关联的;(2)当22.706时,有90%的把握判定变量A,B有关联;(3)当23.841时,有95%的把握判定变量A,B有关联;(4)当26.635时,有99%的把握判定变量A,B有关联.两个变量的独立性检验某防疫站对屠宰场及肉食零售点的猪肉检查沙门氏菌带菌情况,结果如下表,试检验屠宰场与零售点猪肉带菌率有无差异带菌情况检验地点带菌头数不带菌头数合计屠宰场83240零售点14183
77、2合计225072【思路探究】这是一个22列联表,可以用2来检验屠宰场与零售点猪肉带菌率有无差异【自主解答】24.726.因为4.7263.841,所以我们有95%的把握说,屠宰场与零售点猪肉带菌率有差异1解题时应注意准确带数与计算,不可错用公式,要准确进行比较与判断2根据观测数据计算由公式给出的检验统计量2的值,其值越大,说明“x与y有关”成立的可能性越大打鼾不仅影响别人休息,而且可能与患某种疾病有关下表是一次调查所得的数据,试问:每一晚都打鼾与患心脏病有关吗?患心脏病情况打鼾情况患心脏病未患心脏病每一晚都打鼾30224每一晚都不打鼾241 355【解】22列联表为:患心脏病情况打鼾情况患心
78、脏病未患心脏病合计每一晚都打鼾30224254每一晚都不打鼾241 3551 379合计541 5791 633根据列联表中的数据,得到268.033.68.0336.635,有99%的把握认为每一晚都打鼾与患心脏病有关独立性检验的简单应用动物园对某种动物进行接种试验,预防传染病,经试验得到如下数据:传染情况接种情况发生传染病未发生传染病接种680未接种1868问进行接种试验是否能有效预防传染病?【思路探究】判断接种与未接种能否有效预防传染病,只需计算2的值,然后与临界值比较即可【自主解答】由已知数据得22列联表如下:传染情况接种情况发生传染病未发生传染病总计接种68086未接种186886总
79、计24148172则26.973,6.9736.635,有99%的把握认为“接种”与“染病”有关又设A为接种未染病,B为未接种未染病,则由数据得P(A)0.930 2,P(B)0.790 7.我们有99%的把握认为接种能够更有效地预防传染病1这类问题的解决方法为先确定a、b、c、d、n的值并求出2的值,并与临界值相比较,注意正确运用公式,准确代入数据2当23.841时,有95%的把握认为两个变量有关;当26.635时,有99%的把握认为两个变量有关3当22.706时,一般认为没有充分证据显示两个变量有关在调查的480名男人中有38名患有色盲,520名女人中有6名患有色盲,用独立性检验的方法来判
80、断色盲与性别是否有关?【解】根据题目所给的数据作出如下的列联表;色盲情况性别色盲不色盲合计男38442480女6514520合计449561 000根据列联表中所给的数据可知a38,b442,c6,d514,ab480,cd520,ac44,bd956,n1 000,代入公式2,得227.1,由于227.16.635,所以我们有99%的把握认为色盲与性别有关系独立性检验的综合应用为了调查某生产线上质量监督员甲对产品质量好坏有无影响,现统计数据如下:质量监督员甲在生产现场时,990件产品中合格品有982件,次品有8件;甲不在生产现场时,510件产品中合格品有493件,次品有17件试分别用列联表、
81、独立性检验的方法分析监督员甲对产品质量好坏有无影响?【思路探究】根据题目中给出的相关数据,列出22列联表求解【自主解答】(1)22列联表如下:合格情况在生产现场情况合格品数次品数总计甲在生产现场9828990甲不在生产现场49317510总计1 475251 500由列联表可得|acbd|982174938|12 750,相差较大,可在某种程度上认为“质量监督员甲是否在生产现场与产品质量有关系”(2)由22列联表中数据,计算得到2的观测值为213.0976.635,所以有99%的把握认为“质量监督员甲是否在生产现场与产品质量有关系”解独立性检验问题的基本步骤:(1)认真读题,指出相关数据,得出
82、22列联表;(2)根据22列联表中的数据,计算统计量2;(3)通过统计量2与已知临界值的比较判断;(4)“X与Y有关系”的把握的大小某市对该市一重点中学2013年高考上线情况进行统计,随机抽查情况进行统计,随机抽查244名学生,得到表格:语文数学英语综合科目上线不上线上线不上线上线不上线上线不上线总分上线201人17427178231762517526总分不上线43人3013232024192617合计20440201432204420143试求各科上线与总分上线之间的关系,并求出哪一科与总分上线的关系最大?【解】对于上述四个科目,分别构造四个随机变量、.由表中数据,得语文:7.2946.63
83、5.数学:30.0086.635.英语:24.1556.635.综合科目:17.2646.635.因为30.00824.15517.2647.294,所以有99%的把握认为语文、数学、英语、综合科目上线与总分上线有关系,其中数学上线与总分上线的关系最大.对独立性检验思想理解不透致误若两个分类变量x和y的列联表为:yxy1y2x1515x24010则x与y之间有关系的概率约为_【错解】计算2的观测值得218.822,18.8226.635,P0.01.【答案】0.01【错因分析】没有理解好独立性检验的基本思想【防范措施】解决独立性检验问题,一定要明确独立性检验思想,只有在理解的基础上才能不出错【
84、正解】218.822.18.8226.635,x与y之间有关系的概率约为10.010.99.【答案】0.991熟记公式2.2熟悉临界值与相关程度的关系,一般情况下,当22.706时,说明“变量A与B有关联”的可信程度为90%;当23.841时,说明“变量A与B有关联”的可信程度为95%;当26.635时,说明“变量A与B有关联”的可信程度为99%;当22.706时,可认为变量A与B无关联.1下面关于2的说法正确的是()A2在任何相互独立的问题中都可以用于检验有关还是无关B2的值越大,两个事件的相关性就越大C2是用来判断两个分类变量是否相关的随机变量,当2的值很小时可以推定两类变量不相关D2的计
85、算公式是2【解析】2只适用于22列联表问题,且2只能推定两个分类变量相关,但不能推定两个变量不相关选项D中2公式错误,分子上少了平方【答案】B2若变量X和Y的列联表如下:YXY1Y2总计X1ababX2cdcd总计acbdabcd则下列说法正确的是()Aadbc越小,说明X与Y的相关联程度越弱Badbc越大,说明X与Y的相关联程度越强C(adbc)2越大,说明X与Y的相关联程度越强D(adbc)2越接近于0,说明X与Y的相关联程度越强【解析】2,当(adbc)2越大时,2越大,说明X与Y的相关性越强【答案】C3某高校统计初步课程的教师随机调查了选该课程的学生的一些情况,具体数据如下表:专业性别
86、非统计专业统计专业男3320女1726则2_,有_的把握判定主修统计专业与性别有关【解析】依题意知:24.9144.9143.841,有95%的把握判定主修统计专业与性别有关【答案】4.91495%4为了考察某种新药的副作用,给50位患者服用此新药,另外50位患者服用安慰剂(一种和新药外形完全相同,但无任何药效的东西),得到如下观测数据副作用药物有无合计新药153550安慰剂64450合计2179100由以上数据,你认为服用新药会产生副作用吗?【解】由公式得24.882.4.8823.841,可以有95%的把握认为新药会产生副作用.一、选择题1在吸烟与患肺病这两个分类变量的计算中,下列说法中正
87、确的是()A若随机变量26.635,我们有99%以上的把握说吸烟与患肺病有关,则某人吸烟,那么他有99%的可能患有肺病B若从统计量中求出有99%以上的把握说吸烟与患肺病有关,则在100个吸烟者中必有99人患有肺病C若从统计量中求出有95%以上的把握说吸烟与患肺病有关,是指有5%的可能性使得推断错误D以上说法均错误【解析】由随机变量2的意义可知答案C正确【答案】C2下面是两个分类变量的列联表:YXy1y2总计x1a2173x222527总计b46则表中a,b处的值分别为()A94,96B52,50C52,54D54,52【解析】根据列联表的特点可以发现:7321a,ba2,解之得a52,b54,
88、故选C.【答案】C3下列选项中,哪一个2的值可以有95%以上的把握认为“A与B有关系”()A22.700B22.710C23.765D25.014【解析】5.0143.841,故D正确【答案】D4以下关于独立性检验的说法中,错误的是()A独立性检验依据小概率原理B独立性检验得到的结论一定正确C样本不同,独立性检验的结论可能有差异D独立性检验不是判断两分类变量是否相关的唯一方法【解析】独立性检验得到的结论不一定正确,如我们得出有90%的把握认为A与B有关,只是说这种判断的正确性为90%,具体问题中A与B可能有关,也可能无关【答案】B5下列说法正确的个数为()对事件A与B的检验无关时,即两个事件互
89、不影响事件A与B关系越密切,则2就越大2的大小是判定事件A与B是否有关的唯一根据若判定两事件A与B有关,则A发生B一定发生A1B2 C3D4【解析】充分利用独立性检验的意义来分析符合事件独立的意义,故正确;中的关系密切不等于相关,所以不对;不是唯一根据,还有独立事件的判断、假设检验等方法;独立性检验推断的是相关的把握,有犯错误的可能【答案】A二、填空题6为了考查长头发与女性头晕是否有关系,随机抽查301名女性,得到如下列联表,试根据表格中已有数据填空头晕情况发型经常头晕很少头晕合计长发35121短发37143合计72则空格中的数据应分别为:_;_;_;_.【解析】最右侧的合计是对应的行上的两个
90、数据的和,由此可求出和;而最下面的合计是相应的列上两个数据的和,由刚才的结果可求得.【答案】861802293017某大学在研究性别与职称(分正教授、副教授)之间是否有关系,你认为应该收集的数据是_【解析】由研究的问题可知,需收集的数据应为男正教授人数,女正教授人数,男副教授人数,女副教授人数【答案】男正教授,女正教授,男副教授,女副教授8吃零食是中学生中普遍存在的现象吃零食对学生身体发育有诸多不利影响,影响学生的健康成长下表给出性别与吃零食的列联表:性别吃零食情况男女合计喜欢吃零食51217不喜欢吃零食402868合计454085试回答吃零食与性别有关系吗?_.(填“有”或“没有”)【解析】
91、24.7223.841.所以有95%以上的把握认为“吃零食与性别”有关【答案】有三、解答题9在对人们饮食习惯的一次调查中,共调查了124人,其中六十岁以上的70人,六十岁以下的54人,六十岁以上的人中有43人的饮食以蔬菜为主,另外27人则以肉类为主;六十岁以下的人中有21人饮食以蔬菜为主,另外33人则以肉类为主判断人的饮食习惯是否与年龄有关?【解】22列联表如下:饮食习惯年龄主食蔬菜主食肉类总计六十岁以下213354六十岁以上432770总计6460124计算得26.201.因为23.841,所以我们有95%的把握认为“人的饮食习惯与年龄有关”10为了研究患慢性气管炎与吸烟量的关系,调查了22
92、8人,其中每天的吸烟支数在10支以上的20支以下的调查者中,患者人数有98人,非患者人数有89人,每天的吸烟支数在20支以上的调查者中,患者人数有25人,非患者人数有16人(1)根据以上数据建立两个分类变量的列联表;(2)试问患慢性气管炎是否与吸烟量相互独立?【解】(1)根据已知数据建立的列联表如下:患病情况吸烟情况患病者未患病者总计10支以上20支以下988918720支以上251641总计123105228(2)20.994,因为20.9946.635,至少有99%的把握认为性别与对午睡的看法有关(3)年龄、职业、季节等(教师用书独具)研究人员选取170名青年男女大学生的样本,对他们进行一
93、种心理测验,发现有60名女生对该心理测验中的最后一个题目的反应是:作肯定的18名,否定的42名;110名男生在相同的题目上作肯定的有22名,否定的有88名问:性别与态度之间是否存在某种关系?用独立性检验的方法判断【思路探究】解答本题可先列出表格,然后计算2,再与临界值比较,判断两个变量是否相互独立【自主解答】根据题目所给数据列出下列表格:态度性别肯定否定总计男生2288110女生184260总计40130170根据表中的数据得22.1582.706.所以没有充分的理由说明性别与态度有关即我们可以认为性别与态度无关要得到两个变量之间有关或无关的精确的可信程度,需作独立性检验的有关计算,2越小,变
94、量间的关系越弱,当22.706时,我们认为两个变量无关调查在23级风时的海上航行中男女乘客的晕船情况,共调查了71人,其中女性34人,男性37人女性中有10人晕船,另外24人不晕船;男性中有12人晕船,另外25人不晕船(1)根据以上数据建立22列联表;(2)判断晕船是否与性别有关系【解】(1)22列联表:晕船情况性别晕船不晕船总计女102434男122537总计224971(2)计算20.08.因为23.841,则有95%的把握认为“X与Y有关系”;若22.706,则有90%的把握认为“X与Y有关系”;如果22.706,就认为没有充分的证据显示“X与Y有关系”某县对在职的71名高中数学教师就支
95、持新的数学教材还是支持旧的数学教材做了调查,结果如下表所示:支持新教材情况教龄支持新教材支持旧教材合计教龄在15年以上的教师122537教龄在15年以下的教师102434合计224971根据此资料,你是否认为教龄的长短与支持新的数学教材有关?【思路点拨】根据独立性检验思想,由公式计算出2,然后与临界值比较得出结论【规范解答】由公式得20.08.由23.841,由2x3.841,解得x10.24.,为整数,若有95%的把握认为是否喜欢韩剧和性别有关,则男生至少有12人(2)没有充分的证据显示是否喜欢韩剧和性别有关,则22.706,由2x2.706,解得x7.216,为整数,若没有充分的证剧显示是
96、否喜欢韩剧和性别有关,则男生至多有6人综合检测(三)第三章统计案例(时间120分钟,满分150分)一、选择题(本大题共10小题,每小题5分,共50分,在每小题给出的四个选项中,只有一项是符合题目要求的)1下列说法中若r0,则x增大时,y也相应增大;若r6.635.故有99%的把握认为获取学位类别与性别有关【答案】A10下面是两个变量的一组样本数据:x23456y2.23.85.56.57根据以上数据可求y与x之间的相关系数r等于()A0.865B0.896C0.979D0.979【解析】90,140.78,iyi112.3,4,5,代入公式得r0.979.【答案】C二、填空题(本大题共5小题,
97、每小题5分,共25分,将答案填在题中的横线上)11下表是某厂14月份用水量(单位:百吨)的一组数据:月份x1234用水量y4.5432.5由散点图可知,用水量y与月份x之间有较好的线性相关关系,其线性回归直线方程是y0.7xa,则a_.【解析】2.5,3.5,回归直线方程过定(,),3.50.72.5a.a5.25.【答案】5.2512某化工厂为预测某产品的回收率y,需要研究它和原料有效成分含量之间的相关关系现取了8对观测值,计算得xi52,yi228,x478,xiyi1 849,则y对x的线性回归方程是_【解析】b2.62,ab11.47,线性回归方程为y11.472.62x.【答案】y1
98、1.472.62x13从散点图上看,点散布在从左下角到右上角的区域内,则两个变量的这种相关关系称为_【答案】正相关14对有关数据的分析可知,每立方米混凝土的水泥用量x(单位:kg)与28天后混凝土的抗压度y(单位:kg/cm2)之间具有线性相关关系,其线性回归方程为y0.30x9.99.根据建议项目的需要,28天后混凝土的抗压度不得低于89.7 kg/cm2,每立方米混凝土的水泥用量最少应为_kg.(精确到0.1 kg)【解析】由已知,0.30x9.9989.7,解得x265.7.【答案】265.715为了判断学生选修文科是否与性别有关,现随机抽取50名学生,得到如下22列联表:选修文科情况性
99、别理科文科男1310女720已知P(23.841)0.05,P(25.024)0.025.根据表中数据,得到24.844.则认为选修文科与性别有关联的把握度是_【解析】24.8443.841,至少有95%的把握认为是否选修文科与性别有关【答案】95%三、解答题(本大题共6小题,共75分解答应写出文字说明、证明过程或演算步骤)16(本小题满分12分)在500名患者身上试验某种血清治疗SARS的作用,与另外500名未用血清的患者进行比较研究,结果如下表:治疗情况使用血清情况治愈未治愈总计用血清治疗254246500未用血清治疗223277500总计4775231 000问该种血清能否起到治疗SAR
100、S的作用?【解】由列联表给出的数据,23.852 2.因为3.852 23.841,所以我们有95%以上的把握认为这种血清能起到治疗SARS的作用17(本小题满分12分)某小卖部为了了解热茶销售量与气温之间的关系,随机统计并制作了某6天卖出热茶的杯数与当天气温的对比表如下表:气温x()2618131041杯数y202434385064画出散点图并计算相关系数r,判断热茶销售量与气温之间是否具有线性相关关系?【解】由表中数据画出散点图,如图所示由表中数据得(2618131041)11.67,(202434385064)38.33,xiyi26201824133410384501641 910,x
101、26218213210242(1)21 286,y20224234238250264210 172,计算r0.97接近于1,所以热茶销售量与气温之间具有较强的线性相关关系18(本小题满分12分)保险公司统计的资料表明:居民住宅区到最近消防站的距离x(单位:千米)和火灾所造成的损失数额y(单位:千元)有如下的统计资料:距消防距离x(千米)1.802.603.104.305.506.10火灾损失费用y(千元)17.819.627.531.336.043.2如果统计资料表明y与x有线性相关关系,试求:(1)用计算器计算线性回归方程及相关系数r;(2)若发生火灾的某居民区与最近的消防站相距7.8千米,
102、评估一下火灾的损失【解】(1)b5.615 4,ab7.333 3,线性回归方程为y5.615 4x7.333 3.r0.9778接近于1,y与x有很强的相关关系(2)当x7.8,代入回归方程有y5.615 47.87.333 351.133 4(千元)19(本小题满分13分)我们总是能够听到同学们说:“数学和物理是相通的,学好数学就可以学好物理”,有的也这样说:“数学和语文相差太远了,我数学成绩那么高,语文成绩却考成这样”为了研究数学成绩与物理成绩的关系、数学成绩与语文成绩的关系,现调查了10名同学的数学、物理、语文成绩如下表:编号12345数学13612512287108物理1079192
103、7693语文86114104109100编号678910数学113111709474物理8582787873语文1061121049599用什么方法研究这些数据,你能发现什么规律?【解】对于数学成绩与物理成绩的关系、数学成绩与语文成绩的关系,研究它们的关系主要是探讨它们的线性相关性,为此我们研究变量间的相关系数r.可求出物理成绩与数学成绩的相关系数r0.87接近于1,从而认为物理成绩与数学成绩之间具有很强的线性相关关系;而由语文成绩与数学成绩的相关系数|r|0.092接近于0,说明语文成绩与数学成绩不具有线性相关关系因此,数学成绩好的同学,一般来说物理成绩也较好,它们之间的联系较紧密,而数学成
104、绩好的同学,语文成绩也可能好,也可能差,它们之间的关系不大20(本小题满分13分)有两个变量A与B,它们的可能取值分别为A1,A2和B1,B2,其一组观测值如下22列联表所示:BAB1B2总计A1a20a20A215a30a45总计155065其中a,15a均大于5的整数,则a取何值时有90%的把握认为“A与B之间有关系”?【解】要使A与B之间有90%的把握认为有关系,则22.706,又22,22.7062.706,即(13a60)21 124.13a6033.5或13a607.2或a2.又5a10,7.2ab,aB.b,aC.a D.b,a【命题意图】本题考查直线方程和线性回归直线方程及其系
105、数考查运算求解能力及应用意识【解析】由(1,0),(2,2)求b,a.b2,a0212.求,时,iyi04312152458,3.5,14916253691,3.5,a.【答案】C2(2013重庆高考)从某居民区随机抽取10个家庭,获得第i个家庭的月收入xi(单位:千元)与月储蓄yi(单位:千元)的数据资料,算得i80,i20,iyi184,720.(1)求家庭的月储蓄y对月收入x的线性回归方程ybxa;(2)判断变量x与y之间是正相关还是负相关;(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄附:线性回归方程ybxa中,b,ab,其中,为样本平均值,线性回归方程也可写为ybxa.【命
106、题意图】本题考查线性回归方程、变量相关关系,利用线性回归方程解决实际应用问题,考查学生的数据处理能力和运算求解能力【解】(1)由题意知n10,i8,i2,又lxxn2720108280,lxyiyin184108224,由此得b0.3,ab20.380.4.故所求线性回归方程为y0.3x0.4.(2)由于变量y的值随x值的增加而增加(b0.30),故x与y之间是正相关(3)将x7代入回归方程可以预测该家庭的月储蓄为y0.370.41.7(千元)1(2013湖北高考)四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直线方程,分别得到以下四个结论:y与x负相关且y2.347x6.
107、423;y与x负相关且y3.476x5.648;y与x正相关且y5.437x8.493;y与x正相关且y4.326x4.578.其中一定不正确的结论的序号是()ABCD【解析】由正负相关性的定义知一定不正确【答案】D2(2012湖南高考)设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i1,2,n),用最小二乘法建立的回归方程为0.85x85.71,则下列结论中不正确的是()Ay与x具有正的线性相关关系B回归直线过样本点的中心(,)C若该大学某女生身高增加1 cm,则其体重约增加0.85 kgD若该大学某女生身高为170 cm,则可断定
108、其体重必为58.79 kg【解析】由于线性回归方程中x的系数为0.85,因此y与x具有正的线性相关关系,故A正确又线性回归方程必过样本中心点(,),因此B正确由线性回归方程中系数的意义知,x每增加1 cm,其体重约增加0.85 kg,故C正确当某女生的身高为170 cm时,其体重估计值是58.79 kg,而不是具体值,因此D不正确【答案】D线性相关系数(教材P79练习)许多先进国家对驾驶员的培训,大多采用室内模拟教学和训练,而后再进行实地训练并考试,这种方法可以大大节约训练的费用问题是这种方法有效吗?下表是12名学员的模拟驾驶成绩x与实际考试成绩y的记录(单位:分)x9855508777897
109、99894837473y956045857587759792807172试问两者的相关性如何?请画散点图,并求出y与x间的线性相关系数(2012课标全国卷)在一组样本数据(x1,y1),(x2,y2),(xn,yn)(n2,x1,x2,xn不全相等)的散点图中,若所有样本点(xi,yi)(i1,2,n)都在直线yx1上,则这组样本数据的样本相关系数为()A1B0C.D1【命题意图】本题考查相关系数的定义及相关系数的计算【解析】根据样子相关系数的定义可知,当所有样本点都在直线上时,相关系数为1,选D.【答案】D变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.
110、5,4),(13,5);变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1)r1表示变量Y与X之间的线性相关系数,r2表示变量V与U之间的线性相关系数,则()Ar2r10B0r2r1Cr20r1Dr2r1【解析】变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5),1011.311.812.513.511.72,123453这组数据的相关系数是r7.219.1720.3755,变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1)
111、5432153,这组数据的相关系数是0.3755,第一组数据的相关系数大于零,第二组数据的相关系数小于零故选C.【答案】C独立性检验(教材P94第5题)下表是老一代和青年一代对某影片的评价的调查,所得数据如表所示(单位:人)评价年代评价高评价一般老一代4560年青一代3651试问:老一代和年青一代对影片的评价是否一致?(2013福建高考)某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为
112、两组,再将两组工人的日平均生产件数分成5组:50,60)、60,70)、70,80)、80,90)、90,100分别加以统计,得到如图所示的频率分布直方图25周岁以上组25周岁以下组图3(1)从样本中日平均生产件数不足60件的工人中随机抽取2人,求至少抽到一名“25周岁以下组”工人的概率;(2)规定日平均生产件数不少于80件者为“生产能手”,请你根据已知条件完成22列联表,并判断是否有90%的把握认为“生产能手与工人所在的年龄组有关”?附:2P(2k)0.1000.0500.0100.001k2.7063.8416.63510.828(注:此公式也可以写成K2)【命题意图】本题考查古典概型、抽
113、样方法、独立性检验考查运算求解能力、应用意识,必然与或然思想、化归与转化思想【解】(1)由已知得,样本中有25周岁以上组工人60名,25周岁以下组工人40名,所以,样本中日平均生产件数不足60件的工人中,25周岁以上组工人有600.053(人),记为A1,A2,A3;25周岁以下组工人有400.052(人),记为B1,B2.从中随机抽取2名工人,所有的可能结果共有10种,它们是:(A1,A2),(A1,A3),(A2,A3),(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2)其中,至少有1名“25周岁以下组”工人的可能结果共有7种,它
114、们是:(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2)故所求的概率P.(2)由频率分布直方图可知,在抽取的100名工人中,“25周岁以上组”中的生产能手600.2515(人),“25周岁以下组”中的生产能手400.37515(人),据此可得22列联表如下:生产能手非生产能手合计25 周岁以上组15456025周岁以下组152540合计3070100所以得K21.79.因为1.792.706,所以没有90%的把握认为“生产能手与工人所在的年龄组有关”(2012辽宁高考)电视传媒公司为了解某地区电视观众对某类体育节目的收视情况,随机抽取
115、了100名观众进行调查下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:图将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”(1)根据已知条件完成下面的22列联表,并据此资料你是否认为“体育迷”与性别有关?非体育迷体育迷合计男女1055合计(2)将上述调查所得到的频率视为概率现在从该地区大量电视观众中,采用随机抽样方法每次抽取1名观众,抽取3次,记被抽取的3名观众中的“体育迷”人数为X.若每次抽取的结果是相互独立的,求X的分布列,期望E(X)和方差D(X)附:2,P(2k)0.050.01k3.8416.635【解】(1)由频率分布直方图可知,在抽取的100人中,“体
116、育迷”有25人,从而22列联表如下:非体育迷体育迷合计男301545女451055合计7525100将22列联表中的数据代入公式计算,得23.030.因为3.0301)p,则P(11)p且对称轴为0,知P(1)p,P(13.841B26.635D23.841.【答案】A5某校1 000名学生的某次数学考试成绩X服从正态分布,其密度函数曲线如图1,则成绩X位于区间(52,68)的人数大约是()图1 A997B954C683D341【解析】由题图知XN(,2),其中60,8,P(X)P(52X68)0.683.人数为0.6831 000683.【答案】C6若(x)n的展开式前三项的系数成等差数列,
117、则展开式中x4项的系数为()A6B7C8D9【解析】(x)n的二项展开式的通项为Tr1Cxnr(2x)rC2rxn2r,前三项的系数为20C,2n1C,22C.由它们成等差数列,得n8或n1(舍去)由展开式,令82r4,得r2,所以x4项的系数为C227.【答案】B7(2013四川高考)从1,3,5,7,9这五个数中,每次取出两个不同的数分别记为a,b,共可得到lg alg b的不同值的个数是()A9B10C18D20【解析】从1,3,5,7,9这五个数中每次取出两个不同数的排列个数为A20,但lg 1lg 3lg 3lg 9,lg 3lg 1lg 9lg 3,所以不同值的个数为20218,故
118、选C.【答案】C8(2013课标全国卷)设m为正整数,(xy)2m展开式的二项式系数的最大值为a,(xy)2m1展开式的二项式系数的最大值为b.若13a7b,则m()A5B6C7D8【解析】(xy)2m展开式中二项式系数的最大值为C,aC.同理,bC.13a7b,13C7C.137.m6.【答案】B9(2013山东高考)用0,1,9十个数字,可以组成有重复数字的三位数的个数为()A243B252C261D279【解析】0,1,2,9共能组成91010900(个)三位数,其中无重复数字的三位数有998648(个),有重复数字的三位数有900648252(个)【答案】B10某人抛掷一枚硬币,出现正
119、、反面的概率都是.构造数列an,使an记Sna1a2a3an,当S22且S82时的概率为()A. B.C. D.【解析】当前2次同时出现正面时,S22,要使S82,则需要后6次出现3次反面,3次正面,相应的概率为P2C()3()3.【答案】D二、填空题(本大题共5小题,每小题5分,共25分,将答案填在题中的横线上)11甲射击命中目标的概率是,乙命中目标的概率是,丙命中目标的概率是.现在三人同时射击目标,则目标被击中的概率为_【解析】甲、乙、丙都没有击中目标的概率是(1)(1)(1),故目标被击中的概率为1.【答案】12一台机器生产某种产品,如果生产出一件甲等品可获利50元,生产出一件乙等品可获
120、利30元,生产出一件次品,要赔20元,已知这台机器生产出甲等品、乙等品和次品的概率分别为0.6,0.3和0.1,则这台机器每生产一件产品平均预期可获利_元【解析】500.6300.3200.137.【答案】3713(2012湖南高考)(2)6的二项展开式中的常数项为_(用数字作答)【解析】(2)6()6,又(2x1)6的展开式的通项公式为Tr1C(2x)6r(1)r,令6r3,得r3.T31C(2x)32023x3160x3.(2)6的二项展开式中的常数项为160.【答案】16014用1,2,3,4,5,6组成六位数(没有重复数字),要求任何相邻两个数字的奇偶性不同,且1和2相邻,这样的六位数
121、的个数是_(用数字作答)【解析】可分三步来做这件事第一步:先将3,5排列,共有A种排法;第二步:再将4,6插空排列,共有2A种排法;第三步:将1,2放到3,5,4,6形成的空中,共有C种排法由分步计数原理得共有A2AC40种【答案】4015在4次独立重复试验中,随机事件A恰好发生1次的概率不大于其恰好发生2次的概率,则事件A在一次试验中发生的概率的取值范围是_【解析】设事件A发生一次的概率为p,则事件A的概率可以构成二项分布,根据独立重复试验的概率公式可得Cp(1p)3Cp2(1p)2,即可得4(1p)6p,p0.4.又因0p1,故0.4p1.【答案】0.4p6.635,有99%的把握认为这一
122、试题的得分情况与性别有关系19(本小题满分13分)某医院有内科医生12名,外科医生8名,现要派5名医生参加赈灾医疗队,则:(1)某内科医生必须参加某外科医生不能参加,有多少种选法?(2)至少有一名内科医生且至少有一名外科医生参加有几种选法?【解】(1)某内科医生参加,某外科医生不参加,只要从剩余的18名医生中选4名即可故有CC3 060(种)(2)法一(直接法)至少有一名内科医生且至少有一名外科医生参加的方法可以分为四类:“一内四外、二内三外、三内二外、四内一外”故有CCCCCCCC14 656(种)法二(间接法)问题的反面是5名内科医生或者5名外科医生参加,故有:C(CC)14 656(种)
123、20(2013课标全国卷)(本小题满分13分)一批产品需要进行质量检验,检验方案是:先从这批产品中任取4件作检验,这4件产品中优质品的件数记为n.如果n3,再从这批产品中任取4件检验,若都为优质品,则这批产品通过检验;如果n4,再从这批产品中任取1件作检验,若为优质品,则这批产品通过检验;其他情况下,这批产品都不能通过检验假设这批产品的优质品率为50%,即取出的每件产品是优质品的概率都为,且各件产品是否为优质品相互独立(1)求这批产品通过检验的概率;(2)已知每件产品的检验费用为100元,且抽取的每件产品都需要检验,对这批产品作质量检验所需的费用记为X(单元:元),求X的分布列及数学期望【解】
124、(1)设第一次取出的4件产品中恰有3件优质品为事件A1,第一次取出的4件产品全是优质品为事件A2,第二次取出的4件产品都是优质品为事件B1,第二次取出的1件产品是优质品为事件B2,这批产品通过检验为事件A,依题意有A(A1B1)(A2B2),且A1B1与A2B2互斥,所以P(A)P(A1B1)P(A2B2)P(A1)P(B1|A1)P(A2)P(B2|A2).(2)X可能的取值为400,500,800,并且P(X400)1,P(X500),P(X800),所以以X的分布列为X400500800PEX400500800506.25.21(本小题满分13分)(2013四川高考)某算法的程序框图如图
125、所示,其中输入的变量x在1,2,3,24这24个整数中等可能随机产生图2(1)分别求出按程序框图正确编程运行时输出y的值为i的概率Pi(i1,2,3);(2)甲、乙两同学依据自己对程序框图的理解,各自编写程序重复运行n次后,统计记录了输出y的值为i(i1,2,3)的频数以下是甲、乙所作频数统计表的部分数据甲的频数统计表(部分)运行次数n输出y的值为1的频数输出y的值为2的频数输出y的值为3的频数30146102 1001 027376697乙的频数统计表(部分)运行次数n输出y的值为1的频数输出y的值为2的频数输出y的值为3的频数30121172 1001 051696353当n2 100时,
126、根据表中的数据,分别写出甲、乙所编程序各自输出y的值为i(i1,2,3)的频率(用分数表示),并判断两位同学中哪一位所编程序符合算法要求的可能性较大;(2)将按程序框图正确编写的程序运行3次,求输出y的值为2的次数的分布列及数学期望【解】(1)变量x是在1,2,3,24这24个整数中随机产生的一个数,共有24种可能当x从1,3,5,7,9,11,13,15,17,19,21,23这12个数中产生时,输出y的值为1,故P1;当x从2,4,8,10,14,16,20,22这8个数中产生时,输出y的值为2,故P2;当x从6,12,18,24这4个数中产生时,输出y的值为3,故P3.所以输出y的值为1的概率为,输出y的值为2的概率为,输出y的值为3的概率为.(2)当n2 100时,甲、乙所编程序各自输出y的值为i(i1,2,3)的频率如下:输出y的值为1的频率输出y的值为2的频率输出y的值为3的频率甲乙比较频率趋势与概率,可得乙同学所编程序符合算法要求的可能性较大(3)随机变量可能的取值为0,1,2,3.P(0)C03,P(1)C12,P(2)C21,P(3)C30.故的分布列为0123P所以E01231.即的数学期望为1.