ImageVerifierCode 换一换
格式:DOCX , 页数:19 ,大小:633.74KB ,
资源ID:218431      下载积分:6 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝扫码支付
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.ketangku.com/wenku/file-218431-down.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(《新步步高》2017版北师大版数学(文)大一轮复习文档:第十章 统计与统计案例 10.3 WORD版含答案.docx)为本站会员(高****)主动上传,免费在线备课命题出卷组卷网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知免费在线备课命题出卷组卷网(发送邮件至service@ketangku.com或直接QQ联系客服),我们立即给予删除!

《新步步高》2017版北师大版数学(文)大一轮复习文档:第十章 统计与统计案例 10.3 WORD版含答案.docx

1、1相关性(1)通常将变量所对应的点描出来,这些点就组成了变量之间的一个图,通常称这种图为变量之间的散点图(2)从散点图上可以看出,如果变量之间存在着某种关系,这些点会有一个集中的大致趋势,这种趋势通常可以用一条光滑的曲线来近似,这样近似的过程称为曲线拟合(3)在两个变量x和y的散点图中,若所有点看上去都在一条直线附近波动,则称变量间是线性相关的,若所有点看上去都在某条曲线(不是一条直线)附近波动,称此相关是非线性相关的如果所有的点在散点图中没有显示任何关系,则称变量间是不相关的2线性回归方程(1)最小二乘法如果有n个点(x1,y1),(x2,y2),(xn,yn),可以用y1(abx1)2y2

2、(abx2)2yn(abxn)2来刻画这些点与直线yabx的接近程度,使得上式达到最小值的直线yabx就是所要求的直线,这种方法称为最小二乘法(2)线性回归方程方程ybxa是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),(xn,yn)的线性回归方程,其中a,b是待定参数3回归分析(1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法(2)样本点的中心对于一组具有线性相关关系的数据(x1,y1),(x2,y2),(xn,yn)中,(,)称为样本点的中心(3)相关系数r;当r0时,表明两个变量正相关;当r2.706时,有90%的把握判定变量A,B有关联;当23.841

3、时,有95%的把握判定变量A,B有关联;当26.635时,有99%的把握判定变量A,B有关联【思考辨析】判断下面结论是否正确(请在括号中打“”或“”)(1)相关关系与函数关系都是一种确定性的关系,也是一种因果关系()(2)“名师出高徒”可以解释为教师的教学水平与学生的水平成正相关关系()(3)只有两个变量有相关关系,所得到的回归模型才有预测价值()(4)某同学研究卖出的热饮杯数y与气温x()之间的关系,得线性回归方程y2.352x147.767,则气温为2时,一定可卖出143杯热饮()(5)变量A、B关系越密切,则由观测数据计算得到的2的值越大()(6)由独立性检验可知,有99%的把握认为物理

4、成绩优秀与数学成绩有关,某人数学成绩优秀,则他有99%的可能物理优秀()1(2015湖北)已知变量x和y满足关系y0.1x1,变量y与z正相关下列结论中正确的是()Ax与y正相关,x与z负相关Bx与y正相关,x与z正相关Cx与y负相关,x与z负相关Dx与y负相关,x与z正相关答案C解析因为y0.1x1,0.10),所以z0.1axab,0.1ar;x、y之间不能建立线性回归方程答案(1)D(2)解析(1)所有点均在直线上,则样本相关系数最大即为1,故选D.(2)显然正确;由散点图知,用yc1ec2x拟合的效果比用ybxa拟合的效果要好,故正确;x,y之间能建立线性回归方程,只不过预报精度不高,

5、故不正确思维升华判定两个变量正、负相关性的方法(1)画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下角,两个变量负相关(2)相关系数:r0时,正相关;r0时,正相关;b0时,y与x正相关,当b0时,y与x负相关,一定错误(2)对于变量Y与X而言,Y随X的增大而增大,故Y与X正相关,即r10;对于变量V与U而言,V随U的增大而减小,故V与U负相关,即r20,所以选C.题型二线性回归分析例2(2015课标全国)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响,对近8年的年宣传费xi和年销售量yi

6、(i1,2,8)数据作了初步处理,得到下面的散点图及一些统计量的值(xi)2(wi)2(xi)(yi)(wi)(yi)46.65636.8289.81.61 469108.8表中wi,i.(1)根据散点图判断,yabx与ycd哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;(3)已知这种产品的年利润z与x,y的关系为z0.2yx.根据(2)的结果回答下列问题:年宣传费x49时,年销售量及年利润的预报值是多少?年宣传费x为何值时,年利润的预报值最大?附:对于一组数据(u1,v1),(u2,v2),(

7、un,vn),其回归直线vu的斜率和截距的最小二乘估计分别为, .解(1)由散点图可以判断,ycd适宜作为年销售量y关于年宣传费x的回归方程类型(2)令w,先建立y关于w的线性回归方程,由于d68,cd563686.8100.6,所以y关于w的线性回归方程为y100.668w,因此y关于x的回归方程为y100.668.(3)由(2)知,当x49时,年销售量y的预报值y100.668576.6,年利润z的预报值z576.60.24966.32.根据(2)的结果知,年利润z的预报值z0.2(100.668)xx13.620.12.所以当6.8,即x46.24时,z取得最大值故年宣传费为46.24千

8、元时,年利润的预报值最大思维升华(1)回归直线ybxa必过样本点的中心(,)(2)正确运用计算b,a的公式和准确的计算,是求线性回归方程的关键(3)分析两变量的相关关系,可由散点图作出判断,若具有线性相关关系,则可通过线性回归方程估计和预测变量的值某车间为了制定工时定额,需要确定加工零件所花费的时间,为此做了四次试验,得到的数据如下:零件的个数x(个)2345加工的时间y(小时)2.5344.5(1)在给定的坐标系中画出表中数据的散点图;(2)求出y关于x的线性回归方程ybxa,并在坐标系中画出回归直线;(3)试预测加工10个零件需要多少小时?(注:b,ab )解(1)散点图如图(2)由表中数

9、据得:iyi52.5,3.5,3.5,54,b0.7,a1.05,y0.7x1.05,回归直线如图所示(3)将x10代入线性回归方程,得y0.7101.058.05,故预测加工10个零件约需要8.05小时题型三独立性检验例3(2015南昌模拟)大家知道,莫言是中国首位获得诺贝尔奖的文学家,国人欢欣鼓舞某高校文学社从男女生中各抽取50名同学调查他们对莫言作品的了解程度,结果如下:阅读过莫言的作品数(篇)0252650517576100101130男生36111812女生48131510(1)试估计该校学生阅读莫言作品超过50篇的概率;(2)对莫言作品阅读超过75篇的则称为“对莫言作品非常了解”,

10、否则为“一般了解”根据题意完成下表,并判断能否有75%的把握认为对莫言作品非常了解与性别有关?非常了解一般了解合计男生女生合计附:2P(2k0)0.500.400.250.150.100.050.050.010k00.4550.7081.3232.0722.7063.8415.0246.635解(1)由抽样调查得阅读莫言作品在50篇以上的频率为,据此估计该校学生阅读莫言作品超过50篇的概率约为.(2)非常了解一般了解合计男生302050女生252550合计5545100根据列联表数据得21.0106.635,所以有99%的把握认为其亲属的饮食习惯与年龄有关20求线性回归方程的方法技巧典例(12

11、分)某地最近十年粮食需求量逐年上升,下表是部分统计数据:年份20062008201020122014需求量/万吨236246257276286(1)利用所给数据求年需求量与年份之间的线性回归方程ybxa;(2)利用(1)中所求出的线性回归方程预测该地2016年的粮食需求量规范解答解(1)由所给数据看出,年需求量与年份之间是近似直线上升,下面来求线性回归方程,先将数据处理如下:年份201042024需求257211101929对处理的数据,容易算得0,3.2,4分b6.5,ab 3.2.6分由上述计算结果,知所求线性回归方程为y2576.5(x2010)3.2,即y6.5(x2010)260.2

12、.8分(2)利用所求得的线性回归方程,可预测2016年的粮食需求量大约为6.5(20162010)260.26.56260.2299.2(万吨)12分温馨提醒求线性回归方程时,重点考查的是计算能力若本题用一般法去解,计算更烦琐(如年份、需求量,不做如上处理),所以平时训练时遇到数据较大的题目时,要考虑有没有更简便的方法解决 方法与技巧1回归分析是处理变量相关关系的一种数学方法主要解决:(1)确定特定量之间是否有相关关系,如果有就找出它们之间贴近的数学表达式;(2)根据一组观察值,预测变量的取值及判断变量取值的变化趋势;(3)求出线性回归方程2根据2的值可以判断两个分类变量有关的可信程度失误与防

13、范1回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的线性回归方程才有实际意义,否则,求出的线性回归方程毫无意义根据回归方程进行预报,仅是一个预报值,而不是真实发生的值2独立性检验中统计量2的值的计算公式很复杂,在解题中易混淆一些数据的意义,代入公式时出错,而导致整个计算结果出错A组专项基础训练 (时间:45分钟)1已知x,y的取值如下表:x014568y1.31.85.66.17.49.3从所得散点图中分析可知:y与x线性相关,且y0.95xa,则x13时,y等于()A1.45 B13.8 C13 D12.8答案B解析由题意,(014568)4,(1.31

14、.85.66.17.49.3)5.25,y与x线性相关,且y0.95xa,5.250.954a,a1.45,从而当x13时,有y13.8.故选B.2某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未使用血清的人一年中的感冒记录作比较,提出假设H:“这种血清不能起到预防感冒的作用”,利用22列联表计算的23.918,经查临界值表知P(23.841)0.05.则下列表述中正确的是()A有95%的把握认为“这种血清能起到预防感冒的作用B若有人未使用该血清,那么他在一年中有95%的可能性得感冒C这种血清预防感冒的有效率为95%D这种血清预防感冒的有效率为5%答案A解析由

15、题意可知,在假设H成立的情况下,P(23.841)的概率约为0.05,即在犯错的概率不超过0.05的前提下认为“血清起预防感冒的作用”,即有95%的把握认为“这种血清能起到预防感冒的作用”这里的95%是我们判断H不成立的概率量度而非预测血清与感冒的概率的量度,故B错误C,D也犯有B中的错误故选A.3某工厂为了新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单位x(元)456789销量y(件)908483807568由表中数据,求得线性回归方程为y4xa,若在这些样本点中任取一点,则它在回归直线左下方的概率为()A. B. C. D.答案B解析由表中数据得6.5,8

16、0,由点(,)在直线y4xa上,得a106,即线性回归方程为y4x106,经过计算只有点(9,68)和(5,84)在直线的左下方,故所求概率为.4设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i1,2,n),用最小二乘法建立的回归方程为y0.85x85.71,则下列结论中不正确的是()Ay与x具有正的线性相关关系B回归直线过样本点的中心(,)C若该大学某女生身高增加1 cm,则其体重约增加0.85 kgD若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg答案D解析0.850,y与x正相关,A正确;回归直线经过样本点的

17、中心(,),B正确;y0.85(x1)85.71(0.85x85.71)0.85,C正确故选D.5通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:男女总计爱好402060不爱好203050总计6050110以下结论正确的是()A有99%以上的把握认为“爱好该项运动与性别有关”B有99%以上的把握认为“爱好该项运动与性别无关”C在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”D在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”答案A解析根据独立性检验的定义,由27.86.635可知我们有99%以上的把握认为“爱好该项运动与性别有关”,

18、故选A.6已知x与y之间的几组数据如下表:x123456y021334假设根据上表数据所得线性回归方程为ybxa,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为ybxa,则以下结论正确的是()Abb,aa Bbb,aaCba Dbb,aa答案C解析b2,a2,由公式b求得,b,ab,ba.7以下四个命题,其中正确的序号是_从匀速传递的产品生产流水线上,质检员每20分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;两个随机变量相关性越强,则相关系数的绝对值越接近于1;在线性回归方程y0.2x12中,当解释变量x每增加一个单位时,预报变量y平均增加0.2个单位;对分

19、类变量X与Y的随机变量2来说,2越小,“X与Y有关系”的把握程度越大答案解析是系统抽样;对于,随机变量2越小,说明两个相关变量有关系的把握程度越小8(2015延安模拟)某班班主任对全班30名男生进行了“认为作业量多少”的调查,数据如下表:认为作业多认为作业不多总计喜欢玩电脑游戏12820不喜欢玩电脑游戏2810总计141630该班主任据此推断男生认为作业多与喜欢玩电脑游戏有关系,则这种推断犯错误的概率不超过_答案0.050解析24.2863.841,则推断犯错误的概率不超过0.050.9假设关于某设备的使用年限x(年)和所支出的维修费用y(万元)有如下表的统计资料:使用年限x(年)23456维

20、修费用y(万元)2.23.85.56.57.0若由资料可知y对x呈线性相关关系,试求:(1)线性回归方程;(2)根据线性回归方程,估计使用年限为12年时,维修费用是多少?解(1)列表i12345合计xi2345620yi2.23.85.56.57.025xiyi4.411.422.032.542.0112.3x49162536904,5;x90;xiyi112.3b1.23,于是ab51.2340.08.所以线性回归方程为y1.23x0.08.(2)当x12时,y1.23120.0814.84(万元),即估计使用12年时,维修费用是14.84万元10某企业有两个分厂生产某种零件,按规定内径尺寸

21、(单位:mm)的值落在29.94,30.06)的零件为优质品从两个分厂生产的零件中各抽出了500件,量其内径尺寸,得结果如下表:甲厂:分组29.86,29.90)29.90,29.94)29.94,29.98)29.98,30.02)30.02,30.06)30.06,30.10)30.10,30.14)频数12638618292614乙厂:分组29.86,29.90)29.90,29.94)29.94,29.98)29.98,30.02)30.02,30.06)30.06,30.10)30.10,30.14)频数297185159766218(1)试分别估计两个分厂生产的零件的优质品率;(2

22、)由以上统计数据填下面22列联表,问是否有99%的把握认为“两个分厂生产的零件的质量有差异”?甲厂乙厂合计优质品非优质品合计附P(2k)0.050.01k3.8416.635解(1)甲厂抽查的500件产品中有360件优质品,从而估计甲厂生产的零件的优质品率为100%72%;乙厂抽查的500件产品中有320件优质品,从而估计乙厂生产的零件的优质品率为100%64%.(2)完成的22列联表如下:甲厂乙厂合计优质品360320680非优质品140180320合计5005001 000由表中数据计算得,27.3526.635,所以有99%的把握认为“两个分厂生产的零件的质量有差异”B组专项能力提升(时

23、间:30分钟)11下列说法:将一组数据中的每一个数据都加上或减去同一个常数后,方差不变;设有一个线性回归方程y35x,变量x增加1个单位时,y平均增加5个单位;设具有相关关系的两个变量x,y的相关系数为r,则|r|越接近于0,x和y之间的线性相关程度越强;在一个22列联表中,由计算得2的值,则2的值越大,判断两个变量间有关联的把握就越大以上,错误结论的个数为()A0 B1 C2 D3答案C解析方差反应一组数据的波动大小,将一组数据中的每个数据都加上或减去同一个常数后,方差不变,故正确;在线性回归方程y35x中,变量x增加1个单位时,y平均减小5个单位,故不正确;根据线性回归分析中相关系数的定义

24、:在线性回归分析中,相关系数为r,|r|越接近于1,相关程度越强,故不正确;对分类变量x与y的随机变量2来说,2越大,“x与y有关系”的可信程度越大,故正确综上所述,错误结论的个数为2,故选C.12对具有线性相关关系的变量x,y有一组观测数据(xi,yi)(i1,2,8),其线性回归方程是yxa,且x1x2x3x82(y1y2y3y8)6,则实数a的值是()A. B. C. D.答案B解析依题意可知样本点的中心为,则a,解得a.13有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如下所示的列联表:优秀非优秀总计甲班10b乙班c30合计已知在全部105人中

25、随机抽取1人,成绩优秀的概率为,则下列说法正确的是()A列联表中c的值为30,b的值为35B列联表中c的值为15,b的值为50C根据列联表中的数据,若按95%的可靠性要求,能认为“成绩与班级有关系”D根据列联表中的数据,若按95%的可靠性要求,不能认为“成绩与班级有关系”答案C解析由题意知,成绩优秀的学生数是30,成绩非优秀的学生数是75,所以c20,b45,选项A、B错误根据列联表中的数据,得到26.1093.841,因此有95%的把握认为“成绩与班级有关系”14某百货公司16月份的销售量x与利润y的统计数据如下表:月份123456销售量x(万件)1011131286利润y(万元)22252

26、9261612(1)根据25月份的数据,画出散点图,求出y关于x的线性回归方程ybxa;(2)若由线性回归方程得到的估计数据与剩下的检验数据的误差均不超过2万元,则认为得到的线性回归方程是理想的,试问所得线性回归方程是否理想?解(1)根据表中25月份的数据作出散点图,如图所示:计算得11,24,xiyi1125132912268161 092,x11213212282498,则b,ab2411.故y关于x的线性回归方程为yx.(2)当x10时,y10,此时|22|2;当x6时,y6,此时|12|2.故所得的线性回归方程是理想的15某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人

27、200名为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分成5组:50,60),60,70),70,80),80,90),90,100分别加以统计,得到如图所示的频率分布直方图(1)从样本中日平均生产件数不足60件的工人中随机抽取2人,求至少抽到一名“25周岁以下组”工人的概率;(2)规定日平均生产件数不少于80件者为“生产能手”,请你根据已知条件完成22列联表,并判断是否有90%的把握认为“生产能手与工人所在的年龄组有关

28、”?解(1)由已知得,样本中有25周岁以上组工人60名,25周岁以下组工人40名所以,样本中日平均生产件数不足60件的工人中,25周岁以上组工人有600.053(人),记为A1,A2,A3;25周岁以下组工人有400.052(人),记为B1,B2.从中随机抽取2名工人,所有的可能结果共有10种,它们是(A1,A2),(A1,A3),(A2,A3),(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2)其中,至少有1名“25周岁以下组”工人的可能结果共有7种,它们是(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2)故所求的概率P.(2)由频率分布直方图可知,在抽取的100名工人中,“25周岁以上组”中的生产能手有600.2515(人),“25周岁以下组”中的生产能手有400.37515(人),据此可得22列联表如下:生产能手非生产能手合计25周岁以上组15456025周岁以下组152540合计3070100所以得21.786.因为1.7862.706.所以没有90%的把握认为“生产能手与工人所在的年龄组有关”

网站客服QQ:123456
免费在线备课命题出卷组卷网版权所有
经营许可证编号:京ICP备12026657号-3