1、课堂探究探究一 利用图形与分类变量间的关系作出分析(1)利用列联表直接计算和,如果两者相差很大,就判断两个分类变量之间有关系(2)在等高条形图中展示列联表数据的频率特征,比较图中两个深色条的高可以发现两者频率不一样而得出结论,这种直观判断的不足之处在于不能给出推断“两个分类变量有关系”犯错误的概率【典型例题1】某学校对高三学生作了一项调查发现:在平时的模拟考试中,性格内向的学生426人中有332人在考前心情紧张,性格外向的学生594人中有213人在考前心情紧张,作出等高条形图,利用图形判断考前心情紧张与性格类别是否有关系解:作列联表如下:性格内向性格外向总计考前心情紧张332213545考前心
2、情不紧张94381475总计4265941 020adbc33238121394106 470.adbc比较大,说明考前紧张与性格类型有关图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的比例,从图中可以看出考前紧张的样本中性格内向占的比例比考前心情不紧张样本中性格内向占的比例高,可以认为考前紧张与性格类型有关规律总结 探究二 独立性检验与应用进行独立性检验时,首先要根据题意列出两个分类变量的列联表,然后代入公式计算随机变量K2的观测值k,再对照相应的临界值给出结论,以决定两个变量有关,还是在犯错误概率不超过多少的前提下有关系【典型例题2】为调查某地区老年人是否需要志愿者提供帮助,用简单
3、随机抽样方法从该地区调查了500位老年人,结果如下:男女需要4030不需要160270(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例;(2)能否在犯错误的概率不超过0.01的前提下认为该地区的老年人需要志愿者提供帮助与性别有关?附:P(K2k)0.0500.0100.001k3.8416.63510.828K2思路分析:(1)求出老年人需要帮助的共有多少人,再求比值(2)利用公式计算出K2,再进行判断解:(1)调查的500位老年人中有70位需要志愿者提供帮助,因此该地区老年人中,需要帮助的老年人的比例的估计值为14%.(2)由列联表中数据,得K2观测值为k9.967.由于9.967
4、6.635,所以在犯错误的概率不超过0.01的前提下认为该地区的老年人需要志愿者提供帮助与性别有关规律总结 在判断两个分类变量关系的可靠性时一般利用随机变量K2来确定,把计算出的K2的值与相关的临界值作比较,确定出两个变量有关系的把握程度探究三 易错辨析易错点对概念理解不当致误【典型例题3】若两个分类变量x和y的列联表为:y1y2x1515x24010则x与y之间有关系的概率约为_错解:计算K2的观测值得k18.822,查表知P(K210.828)0.001.答案:0.001错因分析:没有理解好独立性检验的基本思想正解:k18.822.查表知P(K210.828)0.001,则x与y之间有关系的概率约为10.0010.999.答案:0.999