1、温馨提示: 此套题为Word版,请按住Ctrl,滑动鼠标滚轴,调节合适的观看比例,答案解析附后。关闭Word文档返回原板块。4.3.2独立性检验必备知识自主学习122列联表及随机事件的概率(1)22列联表:如果随机事件A与B的样本数据如下表格形式在这个表格中,核心的数据是中间的4个格子,所以这样的表格通常称为22列联表(2)22列联表中随机事件的概率:如上表,记nabcd,则事件A发生的概率可估计为;事件B发生的概率可估计为;事件AB发生的概率可估计为事件,A发生的概率估计值分别是多少?提示:P,P.2独立性检验(1)定义:在22列联表中,定义随机变量2,任意给定(称为显著性水平),可以找到满
2、足条件P(2k)的数k(称为显著性水平对应的分位数),若2k成立,就称在犯错误的概率不超过的前提下,可以认为A与B不独立(也称A与B有关),或说有1的把握认为A与B有关;若2k成立,就称不能得到前述结论这一过程通常称为独立性检验(2)统计学中,常用的显著性水平以及对应的分位数k如表所示P(2k)0.10.050.010.0050.001k2.7063.8416.6357.87910.828若2k成立,则说明事件A与B无关,对吗?提示:不对,若23.841,故有95%的把握认为男、女顾客对该商场服务的评价有差异独立性检验的关注点(1)步骤:列表,计算,判断;(2)注意:2计算公式较复杂,一是公式
3、要清楚;二是代入数值时不能张冠李戴;三是计算时要细心判断时把计算结果与临界值比较,其值越大,有关的可信度越高1某人研究中学生的性别与成绩、视力这2个变量的关系,随机抽查52名中学生,得到统计数据如表1与表2,则与性别有关联的可能性较大的变量是_.表1成绩不及格成绩及格总计男61420女102232总计163652表2视力好视力差总计男41620女122032总计163652【解析】因为,所以,故视力与性别有关联的可能性较大答案:视力2为了研究子女吸烟与父母吸烟的关系,调查了一千多名青少年及其家长,数据如表:父母吸烟父母不吸烟总计子女吸烟23783320子女不吸烟6785221 200总计915
4、6051 520试问:父母吸烟对子女是否吸烟有影响吗?【解析】由22列联表中的数据得232.526.635.所以,我们有99%的把握认为父母吸烟对子女是否吸烟有影响类型三独立性检验的综合问题(数据分析、逻辑推理、数学运算)【典例】(2020新高考全国卷)为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和SO2浓度(单位:g/m3),得下表:PM2.5SO20,50(50,150(150,4750,3532184(35,756812(75,1153710(1)估计事件“该市一天空气中PM2.5浓度不超过75,且SO2浓度不超过150”的概率;
5、(2)根据所给数据,完成下面22列联表:PM2.5SO20,150(150,4750,75(75,115(3)根据(2)中的列联表,判断是否有99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关?附:2.P(2k)0.0500.0100.001k3.8416.63510.828独立性检验综合应用的方法策略1独立性检验在实际中有着广泛的应用,是对实际生活中数据进行分析的一种方法,通过这种分析得出的结论对实际生活或者生产都有一定的指导作用2近几年高考中较少单独考查独立性检验,经常与统计、概率等知识综合频率分布表、频率分布直方图与独立性检验融合在一起是常见的考查形式,一般需要根据条件列出22
6、列联表,计算2值,从而解决问题(2020全国卷)某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):锻炼人次空气质量等级0,200(200,400(400,6001(优)216252(良)510123(轻度污染)6784(中度污染)720(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”根据所给数据,完成下面的22列联表,并根
7、据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?人次400人次400空气质量好空气质量不好附:2,P(2k)0.0500.0100.001k3.8416.63510.828【解析】(1)由频数分布表可知,该市一天的空气质量等级为1的概率为0.43,等级为2的概率为0.27,等级为3的概率为0.21,等级为4的概率为0.09.(2)由频数分布表可知,一天中到该公园锻炼的人次的平均数为350.(3)22列联表如下:人次400人次400空气质量好3337空气质量不好2282的观测值k5.8203.841,因此,有95%的把握认为一天中到该公园锻炼的人次与该市当天
8、的空气质量有关课堂检测素养达标1对于分类变量X与Y的随机变量2值,下列说法正确的是()A2越大,“X与Y有关系”的可信程度越小B2越小,“X与Y有关系”的可信程度越小C2越接近于0,“X与Y没有关系”的可信程度越小D2越大,“X与Y没有关系”的可信程度越大【解析】选B.2越大,“X与Y没有关系”的可信程度越小,则“X与Y有关系”的可信程度越大,2越小,“X与Y有关系”的可信程度越小2下列选项中,哪一个2的值可以有99%以上的把握认为A与B有关系()A22.715 B23.910C26.165 D27.014【解析】选D.因为7.0146.635,查阅2表知有99%的把握认为A与B有关系3给出下
9、列实际问题:一种药物对某种病的治愈率;两种药物治疗同一种病是否有区别;吸烟者得肺病的概率;吸烟是否与性别有关系;网吧与青少年的犯罪是否有关系其中用独立性检验可以解决的问题有()A BC D【解析】选B.独立性检验是判断两个随机事件是否有关系的方法,而都是求概率问题,不能用独立性检验4下面22列联表中a,b的值分别为_.【解析】因为a2173,所以a52.又因为a2b,所以b54.答案:52,545(教材二次开发:例题改编)调查某医院某段时间内婴儿出生的时间与性别的关系,得到数据:出生时间在晚上的男婴为24人,女婴为8人;出生时间在白天的男婴为31人,女婴为26人(1)将下面的22列联表补充完整;晚上白天总计男婴女婴总计(2)能否在犯错误的概率不超过0.1的前提下认为婴儿性别与出生时间有关系?【解析】(1)晚上白天总计男婴243155女婴82634总计325789(2)由所给数据计算得:23.6892.706.根据临界值表知P(22.706)0.1.因此在犯错误的概率不超过0.1的前提下认为婴儿的性别与出生的时间有关系关闭Word文档返回原板块