收藏 分享(赏)

2020-2021学年人教A版数学选修2-3学案:3-2 独立性检验的基本思想及其初步应用 WORD版含解析.doc

上传人:高**** 文档编号:119870 上传时间:2024-05-25 格式:DOC 页数:9 大小:332.50KB
下载 相关 举报
2020-2021学年人教A版数学选修2-3学案:3-2 独立性检验的基本思想及其初步应用 WORD版含解析.doc_第1页
第1页 / 共9页
2020-2021学年人教A版数学选修2-3学案:3-2 独立性检验的基本思想及其初步应用 WORD版含解析.doc_第2页
第2页 / 共9页
2020-2021学年人教A版数学选修2-3学案:3-2 独立性检验的基本思想及其初步应用 WORD版含解析.doc_第3页
第3页 / 共9页
2020-2021学年人教A版数学选修2-3学案:3-2 独立性检验的基本思想及其初步应用 WORD版含解析.doc_第4页
第4页 / 共9页
2020-2021学年人教A版数学选修2-3学案:3-2 独立性检验的基本思想及其初步应用 WORD版含解析.doc_第5页
第5页 / 共9页
2020-2021学年人教A版数学选修2-3学案:3-2 独立性检验的基本思想及其初步应用 WORD版含解析.doc_第6页
第6页 / 共9页
2020-2021学年人教A版数学选修2-3学案:3-2 独立性检验的基本思想及其初步应用 WORD版含解析.doc_第7页
第7页 / 共9页
2020-2021学年人教A版数学选修2-3学案:3-2 独立性检验的基本思想及其初步应用 WORD版含解析.doc_第8页
第8页 / 共9页
2020-2021学年人教A版数学选修2-3学案:3-2 独立性检验的基本思想及其初步应用 WORD版含解析.doc_第9页
第9页 / 共9页
亲,该文档总共9页,全部预览完了,如果喜欢就下载吧!
资源描述

1、32独立性检验的基本思想及其初步应用内容标准学科素养1.能用等高条形图反映两个分类变量之间是否有关系2.能够根据条件列出列联表并会由公式求k.3.能知道独立性检验的基本思想和方法.利用数据分析提升数学建模及数学运算授课提示:对应学生用书第54页基础认识知识点一分类变量及22列联表在日常生活中,我们常常关心两个分类变量之间是否有关系例如,吸烟与患肺癌是否有关系?性别是否对喜欢数学课程有影响?等等为研究吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了9 965人,得到如下结果:不患肺癌患肺癌总计不吸烟7 775427 817吸烟2 099492 148总计9 874919 965那么吸烟是否对患肺

2、癌有影响?提示:在不吸烟样本中,有0.54%患肺癌;在吸烟样本中,有2.28%患肺癌因此,直观上可以得到结论:吸烟群体和不吸烟群体患肺癌的可能性存在差异,吸烟者患肺癌的可能性大 知识梳理1.分类变量变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量2列联表(1)定义:列出的两个分类变量的频数表,称为列联表(2)22列联表一般地,假设有两个分类变量X和Y,它们的取值分别为x1,x2和y1,y2,其样本频数列联表(也称为22列联表)为下表.y1y2总计x1ababx2cdcd总计acbdabcd知识点二等高条形图知识梳理与表格相比,图形更能直观地反映出两个分类变量间是否相互影响,常用

3、等高条形图展示列联表数据的频率特征比较图中两个深色条的高可以发现,在吸烟样本中患肺癌的频率要高一些,因此直观上可以认为吸烟更容易引发肺癌如果通过直接计算或等高条形图发现和相差很大,就判断两个分类变量之间有关系知识点三独立性检验知识梳理1.定义:利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验2K2,其中nabcd.3独立性检验的具体做法(1)根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界,然后查表确定临界值k0.(2)利用公式计算随机变量K2的观测值k.(3)如果kk0,就推断“X与Y有关系”,这种推断犯错误的概率不超过,否则就认为在犯错误的概率不超过的前

4、提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够证据支持结论“X与Y有关系”自我检测1在一个22列联表中,由其数据计算得K213.097,认为两个变量有关系犯错误的概率不超过()A0.001B0.05C0.1 D0.2答案:A2由如图所示的等高条形图,可知吸烟与患肺病_关系(填“有”或“没有”)答案:有授课提示:对应学生用书第55页探究一等高条形图的应用阅读教材P95例1在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶,而另外772名不是因为患心脏病而住院的男性病人中有175人秃顶(1)利用图形判断秃顶与患心脏病是否有关系;(2)能否在犯错误的概率不超过0.01的前提

5、下认为秃顶与患心脏病有关系?题型:利用等高条形图判断两分类变量是否有关方法步骤:(1)列出22列联表(2)计算出秃顶样本中患心脏病的频率,和不秃顶样本中患心脏病的频率(3)作出两样本中的等高条形图作出判断:秃顶与患心脏病有关例1为了解铅中毒病人与尿棕色素为阳性是否有关系,分别对病人组和对照组的尿液作尿棕色素定性检查,结果如下:组别阳性数阴性数总计铅中毒病人29736对照组92837总计383573试画出列联表的等高条形图,分析铅中毒病人和对照组的尿棕色素阳性数有无差别,铅中毒病人与尿棕色素为阳性是否有关系?解析等高条形图如图所示:其中两个浅色条的高分别代表铅中毒病人和对照组样本中尿棕色素为阳性

6、的频率由图可以直观地看出铅中毒病人与对照组相比, 尿棕色素为阳性的频率差异明显,因此铅中毒病人与尿棕色素为阳性有关系方法技巧1.判断两个分类变量是否有关系的方法(1)利用数形结合思想,借助等高条形图来判断两个分类变量是否相关是判断变量相关的常见方法(2)在等高条形图中,与相差越大,两个分类变量有关系的可能性就越大2利用等高条形图判断两个分类变量是否相关的步骤跟踪探究1.为考察某种药物预防疾病的效果进行动物试验,得到如下列联表:患病未患病总计服用药104555未服用药203050总计3075105试用等高条形图分析服用药和患病之间是否有关系解析:根据列联表所给的数据可得出服用药患病的频率为0.1

7、8,未服用药患病的频率为0.4,两者的差距是|0.180.4|0.22,两者相差很大,作出等高条形图如图所示,因此服用药与患病有关系探究二独立性检验阅读教材P97习题3.2第2题通过随机询问72名不同性别的大学生在购买食物时是否看营养说明,得到如下列联表:性别与读营养说明列联表女男总计读营养说明162844不读营养说明20828总计363672能否在犯错误的概率不超过0.005的前提下认为性别和是否看营养说明有关系呢?解析:由题意得K28.4167.879因此能在犯错误的概率不超过0.005的前提下认为性别与读营养说明之间有关系例2某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行了抽

8、样调查,调查结果如下表所示:喜欢甜品不喜欢甜品合计南方学生602080北方学生101020合计7030100根据表中数据,问是否在犯错误的概率不超过0.05的前提下认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”解析将22列联表中的数据代入公式计算,得K2的观测值k4.762.因为4.7623.841,所以在犯错误的概率不超过0.05的前提下认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”方法技巧1.独立性检验的关注点在22列联表中,如果两个分类变量没有关系,则应满足adbc0,因此|adbc|越小,关系越弱;|adbc|越大,关系越强2独立性检验的具体做法(1)根据实际问题的

9、需要确定允许推断“两个分类变量有关系”犯错误的概率的上界,然后查表确定临界值k0.(2)利用公式K2计算随机变量K2的观测值k.(3)如果kk0,推断“X与Y有关系”这种推断犯错误的概率不超过;否则,就认为在犯错误的概率不超过的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够的证据支持结论“X与Y有关系”跟踪探究2.某省进行高中新课程改革已经四年了,为了解教师对新课程教学模式的使用情况,某一教育机构对某学校的教师关于新课程教学模式的使用情况进行了问卷调查,共调查了50人,其中有老教师20人,青年教师30人老教师对新课程教学模式赞同的有10人,不赞同的有10人;青年教师对新课程教学模

10、式赞同的有24人,不赞同的有6人(1)根据以上数据建立一个22列联表;(2)判断是否有99%的把握说明对新课程教学模式的赞同情况与教师年龄有关系解析:(1)22列联表如下所示:赞同不赞同总计老教师101020青年教师24630总计341650(2)假设“对新课程教学模式的赞同情况与教师年龄无关”由公式得K24.9636.635,所以没有99%的把握认为对新课程教学模式的赞同情况与教师年龄有关探究三独立性检验的综合应用例3某高校共有学生15 000人,其中男生10 500人,女生4 500人为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时间(单位:

11、时)的样本数据(1)应收集多少位女生的样本数据?(2)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图),其中样本数据的分组区间为0,2,(2,4,(4,6,(6,8,(8,10,(10,12估计该校学生每周平均体育运动时间超过4小时的概率(3)在样本数据中,有60位女生的每周平均体育运动时间超过4小时,请完成每周平均体育运动时间与性别列联表,并判断是否认为“该校学生的每周平均体育运动时间与性别有关”解析(1)由分层抽样可得30090,所以应收集90位女生的样本数据(2)由频率分布直方图得学生每周平均体育运动超过4小时的频率为12(0.1000.025)0.75,所以

12、该校学生每周平均体育运动时间超过4小时的概率的估计值为0.75.(3)由(2)知,300位学生中有3000.75225(人)的每周平均体育运动时间超过4小时,75人的每周平均体育运动时间不超过4小时样本数据中有210份是关于男生的,90份是关于女生的,可得每周平均体育运动时间与性别列联表如下:男生女生总计每周平均体育运动时间不超过4小时453075每周平均体育运动时间超过4小时16560225总计21090300结合列联表可算得K2的观测值k4.7623.841.所以有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”方法技巧1.解答此类题目的关键在于正确利用K2计算k的值,再用它与

13、临界值k0的大小作比较来判断假设检验是否成立,从而使问题得到解决2此类题目规律性强,解题比较格式化,填表计算分析比较即可,要熟悉其计算流程,不难理解掌握跟踪探究3.为了解某班学生喜爱打篮球是否与性别有关,对本班48人进行了问卷调查得到了如下的22列联表:喜爱打篮球不喜爱打篮球合计男生6女生10合计48已知在全班48人中随机抽取1人,抽到喜爱打篮球的学生的概率为.(1)请将上面的22列联表补充完整(不用写计算过程);(2)能否在犯错误的概率不超过0.05的前提下认为喜爱打篮球与性别有关?说明你的理由;(3)现从女生中抽取2人进一步调查,设其中喜爱打篮球的女生人数为X,求X的分布列与均值解析:(1

14、)列联表补充如下:喜爱打篮球不喜爱打篮球合计男生22628女生101020合计321648(2)由K24.286.因为4.2863.841,所以,能在犯错误的概率不超过0.05的前提下认为喜爱打篮球与性别有关(3)喜爱打篮球的女生人数X的可能取值为0,1,2.其概率分别为P(X0),P(X1),P(X2),故X的分布列为:X012PX的均值为E(X)01.授课提示:对应学生用书第57页课后小结(1)列联表与等高条形图列联表由两个分类变量之间频率大小差异说明这两个变量之间是否有相关关系,而利用等高条形图能形象直观地反映它们之间的差异,进而推断它们之间是否具有相关关系(2)对独立性检验思想的理解独

15、立性检验的基本思想类似于数学中的反证法先假设“两个分类变量没有关系”成立,计算随机变量K2的值,如果K2的值很大,说明假设不合理K2越大,两个分类变量有关系的可能性越大素养培优因对独立性检验的基本思想不理解而致错已知两个分类变量X和Y的取值分别为x1,x2,y1,y2,若其列联表为y1y2x1515x24010则()AX与Y之间有关系的概率为0.001BX与Y之间有关系的概率为0.999C认为X与Y有关系,犯错误的概率为0.999D认为X与Y有关系,犯错误的概率不超过0.001易错分析:独立性检验的基本思想是指某件事发生在犯错概率不超过某个非常小的数据的前提下,我们有把握认为有关理解有误会致误自我纠正:K2的观测值为k18.822.查表知P(K210.828)0.001,所以在犯错误的概率不超过0.001的前提下,我们认为X与Y有关答案:D

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 幼儿园

Copyright@ 2020-2024 m.ketangku.com网站版权所有

黑ICP备2024021605号-1