收藏 分享(赏)

2018-2019学年高中数学人教A版选修2-3学案:三 统计案例 WORD版含解析.doc

上传人:高**** 文档编号:1159316 上传时间:2024-06-05 格式:DOC 页数:12 大小:469KB
下载 相关 举报
2018-2019学年高中数学人教A版选修2-3学案:三 统计案例 WORD版含解析.doc_第1页
第1页 / 共12页
2018-2019学年高中数学人教A版选修2-3学案:三 统计案例 WORD版含解析.doc_第2页
第2页 / 共12页
2018-2019学年高中数学人教A版选修2-3学案:三 统计案例 WORD版含解析.doc_第3页
第3页 / 共12页
2018-2019学年高中数学人教A版选修2-3学案:三 统计案例 WORD版含解析.doc_第4页
第4页 / 共12页
2018-2019学年高中数学人教A版选修2-3学案:三 统计案例 WORD版含解析.doc_第5页
第5页 / 共12页
2018-2019学年高中数学人教A版选修2-3学案:三 统计案例 WORD版含解析.doc_第6页
第6页 / 共12页
2018-2019学年高中数学人教A版选修2-3学案:三 统计案例 WORD版含解析.doc_第7页
第7页 / 共12页
2018-2019学年高中数学人教A版选修2-3学案:三 统计案例 WORD版含解析.doc_第8页
第8页 / 共12页
2018-2019学年高中数学人教A版选修2-3学案:三 统计案例 WORD版含解析.doc_第9页
第9页 / 共12页
2018-2019学年高中数学人教A版选修2-3学案:三 统计案例 WORD版含解析.doc_第10页
第10页 / 共12页
2018-2019学年高中数学人教A版选修2-3学案:三 统计案例 WORD版含解析.doc_第11页
第11页 / 共12页
2018-2019学年高中数学人教A版选修2-3学案:三 统计案例 WORD版含解析.doc_第12页
第12页 / 共12页
亲,该文档总共12页,全部预览完了,如果喜欢就下载吧!
资源描述

1、三统计案例1最小二乘法对于一组数据(xi,yi),i1,2,n,如果它们线性相关,则线性回归方程为 x,其中=222列联表22列联表如表所示:BB总计AababAcdcd总计acbdn其中nabcd为样本容量3K2检验常用随机变量K2来检验两个变量是否有关系1回归分析的两个关注点(1)回归分析是建立在两个具有相关性的变量之间的一种模拟分析,因此先判断其是否具有相关性(2)并非只有线性相关关系,还可能存在非线性相关关系2独立性检验的两个注意点(1)通过独立性检验得到的结论未必正确,它只是对一种可靠性的预测(2)22列联表中,当数据a,b,c,d都不小于5时,才可以用K2检验主题1回归分析某公司为

2、确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响对近8年的年宣传费xi和年销售量yi(i1,2,8)数据作了初步处理,得到下面的散点图及一些统计量的值(1)根据散点图判断,yabx与ycd哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;(3)已知这种产品的年利润z与x,y的关系为z0.2yx.根据(2)的结果回答下列问题:年宣传费x49时,年销售量及年利润的预报值是多少?年宣传费x为何值时,年利润的预报值最大?附:对于一组数据(

3、u1,v1),(u2,v2),(un,vn),其回归直线vu的斜率和截距的最小二乘估计分别为【解】(1)由散点图可以判断,ycd适宜作为年销售量y关于年宣传费x的回归方程类型(2)令w,先建立y关于w的线性回归方程 563686.8100.6,所以y关于w的线性回归方程为y100.668w,因此y关于x的回归方程为100.668.(3)由(2)知,当x49时,年销售量y的预报值100.668576.6,年利润z的预报值576.60.24966.32.根据(2)的结果知,年利润z的预报值0.2(100.668)xx13.620.12.所以当6.8,即x46.24时,取得最大值故年宣传费为46.2

4、4千元时,年利润的预报值最大解决回归分析问题的一般步骤(1)画散点图根据已知数据画出散点图(2)判断变量的相关性并求回归方程通过观察散点图,直观感知两个变量是否具有相关关系;在此基础上,利用最小二乘法求回归系数,然后写出回归方程(3)回归分析画残差图或计算R2,进行残差分析(4)实际应用依据求得的回归方程解决问题 在一段时间内,某种商品的价格x元和需求量y件之间的一组数据为:x(元)1416182022y(件)1210753且知x与y具有线性相关关系,求出y关于x的回归直线方程,并说明拟合效果的好坏解:(1416182022)18,(1210753)7.4,所以7.41.151828.1,所以

5、y对x的回归直线方程为1.15x28.1.列出残差表为yii00.30.40.10.2yi4.62.60.42.44.4主题2独立性检验某学生对其30位亲属的饮食习惯进行了一次调查,并用茎叶图表示30人的饮食指数,如图所示(说明:图中饮食指数低于70的人,饮食以蔬菜为主;饮食指数大于等于70的人,饮食以肉类为主)(1)根据茎叶图,帮助这位同学说明其30位亲属的饮食习惯;(2)根据以上数据完成如表所示的22列联表主食蔬菜主食肉类总计50岁以下50岁以上总计(3)能否在犯错误的概率不超过0.01的前提下认为“其亲属的饮食习惯与年龄有关”?【解】(1)30位亲属中50岁以上的人饮食多以蔬菜为主,50

6、岁以下的人饮食多以肉类为主(2)22列联表如表所示:主食蔬菜主食肉类总计50岁以下481250岁以上16218总计201030(3)随机变量K2的观测值k106.635,所以在犯错误的概率不超过0.01的前提下认为“其亲属的饮食习惯与年龄有关”独立性检验问题的求解策略(1)等高条形图法:依据题目信息画出等高条形图,依据频率差异来粗略地判断两个变量的相关性(2)K2统计量法:通过公式K2先计算观测值k,再与临界值表作比较,最后得出结论 在考查黄烟是否经过药物处理与发生青花病的关系时,得到如下数据:在试验的470株黄烟中,经过药物处理的黄烟有25株发生青花病,60株没有发生青花病;未经过药物处理的

7、有185株发生青花病,200株没有发生青花病试推断经过药物处理跟发生青花病是否有关系解:由已知,得22列联表如下:经过药物处理未经过药物处理总计青花病25185210无青花病60200260总计85385470提出假设H0:经过药物处理跟发生青花病无关系根据列联表中的数据,可以求得随机变量K2的观测值为k9.788.因为当H0成立时,K27.879的概率约为0.005,而此时K2的观测值k9.7887.879,所以在犯错误的概率不超过0.005的前提下认为经过药物处理跟发生青花病是有关系的, A基础达标1对两个变量y和x进行回归分析,得到一组样本数据:(x1,y1),(x2,y2),(xn,y

8、n),则下列说法中不正确的是()A由样本数据得到的回归方程x必过样本点的中心(x,y)B残差平方和越小的模型,拟合的效果越好C用相关指数R2来刻画回归效果,R2的值越小,说明模型的拟合效果越好D若变量y和x之间的相关系数r0.936 2,则变量y与x之间具有线性相关关系解析:选C.R2的值越大,说明残差平方和越小,也就是说模型的拟合效果越好,故选C.2下列说法中正确的有:()若r0,则x增大时,y也相应增大;若r0,则x增大时,y也相应增大;若r1或r1,则x与y的关系完全对应(有函数关系),在散点图上各个散点均在一条直线上A BC D解析:选C.若r0,表示两个相关变量正相关,x增大时,y也

9、相应增大,故正确,r0,表示两个变量负相关,x增大时,y相应减小,故错误|r|越接近1,表示两个变量相关性越高,|r|1表示两个变量有确定的关系(即函数关系),故正确3若两个变量的残差平方和是325,923,则随机误差对预报变量的贡献率约为()A64.8% B60%C35.2% D40%解析:选C.由题意可知随机误差对预报变量的贡献率约为0.352.4有下列数据x123y35.9912.01下列四个函数中,模拟效果最好的为()Ay32x1 Bylog2xCy3x Dyx2解析:选A.分别把x1,2,3,代入求值,求最接近y的值,即为模拟效果最好,故选A.5通过随机询问100名性别不同的小学生是

10、否爱吃零食,得到如下的列联表:男女合计爱吃104050不爱吃203050合计3070100P(K2k)0.100.050.025k2.7063.8415.024由K2,计算得K24.762.参照附表,得到的正确结论为()A在犯错误的概率不超过5%的前提下,认为“是否爱吃零食与性别有关”B在犯错误的概率不超过5%的前提下,认为“是否爱吃零食与性别无关”C有97.5%以上的把握认为“是否爱吃零食与性别有关”D有97.5%以上的把握认为“是否爱吃零食与性别无关”解析:选A.因为K24.7623.841,P(K23.841)0.05.所以在犯错误的概率不超过5%的前提下,认为“是否爱吃零食与性别有关”

11、,故选A.6某种活性细胞的存活率y(%)与存放温度x()之间有如下几组样本数据:存放温度x()10428存活率y(%)20445680经测算,上述样本数据具有线性相关关系,且回归直线的斜率为3.2.则当存放温度为6 时,该种细胞的存活率的预报值为_%.解析:设回归直线方程为3.2x,因为1,50,则3.253.2.当x6时,3.2653.234.答案:347已知具有相关关系的两个随机变量的一组观测数据的散点图分布在函数y3e2x1的图象附近,则可通过转换得到的线性回归方程为_解析:由y3e2x1,得ln yln(3e2x1),即ln yln 32x1,令uln y,vx,则线性回归方程为u1l

12、n 32v.答案:u1ln 32x(其中uln y)8为了调查患慢性气管炎是否与吸烟有关,调查了100名50岁以下的人,调查结果如下表:患慢性气管炎未患慢性气管炎总计吸烟202040不吸烟55560总计2575100根据列联表数据,求得K2_(保留3位有效数字),根据下表,在犯错误的概率不超过_的前提下认为患慢性气管炎与吸烟有关附:P(K2k0)0.0500.0100.001k03.8416.63510.828K2.解析:K2的观测值k22.210.828.所以在犯错误的概率不超过0.001的前提下认为患慢性气管炎与吸烟有关答案:22.20.0019某学校高三年级有学生1 000名,经调查,其

13、中750名同学经常参加体育锻炼(称为A类同学),另外250名同学不经常参加体育锻炼(称为B类同学),现用分层抽样方法(按A类、B类分两层)从该年级的学生中共抽查100名同学,如果以身高达165 cm作为达标的标准,对抽取的100名学生,得到以下列联表:身高达标身高不达标总计经常参加体育锻炼40不经常参加体育锻炼15总计100(1)完成上表;(2)能否在犯错误的概率不超过0.05的前提下认为经常参加体育锻炼与身高达标有关系(K2的观测值精确到0.001)?解:(1)填写列联表如下:身高达标身高不达标总计经常参加体育锻炼403575不经常参加体育锻炼101525总计5050100(2)由列联表中的

14、数据,得K2的观测值为k1.3333.841.所以不能在犯错误的概率不超过0.05的前提下认为经常参加体育锻炼与身高达标有关系10某城市理论预测2011年到2015年人口总数与年份的关系如表所示:年份2011x(年)01234人口数y(十万)5781119(1)请画出上表数据的散点图;(2)请根据上表提供的数据,求出y关于x的线性回归方程x;(3)据此估计2018年该城市人口总数解:(1)散点图如图:(2)因为2,10,y x3.6;所以线性回归方程为3.2x3.6.(3)令x7,则3.273.626.即估计2018年该城市人口总数为26十万B能力提升11(2018河南洛阳3月模拟)某省电视台

15、为了解该省卫视一档成语类节目的收视情况,抽查东、西部各5个城市,得到观看该节目的人数的统计数据(单位:千人),并画出如下茎叶图,其中一个数字被污损. 东部西部 9883372109 9 (1)求东部各城市观看该节目的观众的平均人数超过西部各城市观看该节目的观众的平均人数的概率;(2)该节目的播出极大地激发了观众对成语知识学习积累的热情,现从观看节目的观众中随机统计了4位观众学习成语知识的周均时间(单位:小时)与年龄(单位:岁),并制作了如下对照表:年龄x20304050周均学习成语知识时间y2.5344.5根据表中数据,试求线性回归方程x,并预测年龄为60岁的观众周均学习成语知识的时间解:(1

16、)设被污损的数字为a,则a有10种情况由888990919283838790a99,得a8,所以有8种情况使得东部各城市观看该节目的观众的平均人数超过西部各城市观看该节目的观众的平均人数,所求概率为. yx3.535.所以x.当x60时,5.25.即预测年龄为60岁的观众周均学习成语知识的时间为5.25小时12(选做题)为了调查某地区成年人血液的一项指标,现随机抽取了成年男性、女性各20人组成一个样本,对他们的这项血液指标进行了检测,得到了如下茎叶图根据医学知识,我们认为此项指标大于40为偏高,反之即为正常(1)依据上述样本数据研究此项血液指标与性别的关系,列出22列联表,并判断能否在犯错误的

17、概率不超过0.01的前提下认为此项血液指标与性别有关系?(2)以样本估计总体,视样本频率为概率,现从本地区随机抽取成年男性、女性各2人,求此项血液指标为正常的人数X的分布列及数学期望附:K2,其中nabcd,P(K2k0)0.0250.0100.005k05.0246.6357.879解:(1)由茎叶图可得22列联表:正常偏高合计男性16420女性12820合计281240K21.9056.635,所以不能在犯错误的概率不超过0.01的前提下认为此项血液指标与性别有关系(2)由样本数据可知,男性正常的概率为,女性正常的概率为.此项血液指标为正常的人数X的可能取值为0,1,2,3,4,P(X0)(1)2(1)2,P(X1)C(1)(1)2(1)2C(1),P(X2)CC,P(X3)CC,P(X4),所以X的分布列为X01234P所以E(X)012342.8,即此项血液指标为正常的人数X的数学期望为2.8.

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 幼儿园

网站客服QQ:123456
免费在线备课命题出卷组卷网版权所有
经营许可证编号:京ICP备12026657号-3