1、课时作业(四)1有两个分类变量X与Y的一组数据,由其列联表计算得24.523,则认为X与Y有关系是错误的可信度为()A95%B90%C5% D10%答案C解析P(23.841)0.05.故选C.2下列是一个22列联表:y1y2总计x1a2173x222527总计b46100则该表中a,b的值分别为()A94,96 B52,50C52,54 D54,52答案C解析a732152,ba252254.3高二第二学期期中考试,按照甲、乙两个班级学生数学考试成绩优秀和及格统计人数后,得到如下列联表:班级与成绩列联表优秀及格总计甲班113445乙班83745总计197190则随机变量2的观测值约为()A0
2、.600 B0.828C2.712 D6.004答案A解析20.600.4某班主任对全班50名学生进行了作业量的调查,数据如下表:认为作业量大认为作业量不大总计男生18927女生81523总计262450则学生的性别与认为作业量的大小有关系的把握大约为()A99% B95%C90% D无充分根据答案B解析25.0593.841.5通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:男女总计爱好402060不爱好203050总计6050110由2算得,27.8.附表:P(2k)0.0500.0100.001k3.8416.63510.828参照附表,得到的正确结论是()A有9
3、9%以上的把握认为“爱好该项运动与性别有关”B有99%以上的把握认为“爱好该项运动与性别无关”C在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”D在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”答案A6某高校统计课程的教师随机调查了选该课程的学生的一些情况,具体数据如下:非统计专业统计专业男1310女720为了判断选修统计专业是否与性别有关,根据表中的数据,得24.844,因为23.841,所以可判定选修统计专业与性别有关那么这种判断出错的可能性为_答案5%7大学生和研究生毕业的一个随机样本给出了关于所获取学位类别与学生性别的分类数据如表根据表中数据,有
4、_的把握认为性别与获取学位类别有关硕士博士合计男16227198女1438151合计30535340答案99%8在独立性检验中,选用2作为统计量,当2满足条件_时,我们有90%的把握说事件A与B有关答案22.7069统计推断,当_时,有95%的把握说事件A与B有关;当_时,认为没有充分的证据显示事件A与B是有关的答案23.84122.706解析结合2的临界值表可知,当23.841时有95%的把握说事件A与B有关;当22.706时认为没有充分的证明显示事件A与B是有关的10有22列联表:B合计A544094326395合计86103189由上表可计算2_答案10.76解析210.76.11205
5、份样品分别接种于甲、乙两种培养基上,经过规定的一段时间后,检查培养的效果结果分为阳性和阴性,资料如下试分析这两种培养基的培养效果是否有显著差别阳性阴性总计甲培养基363470乙培养基32103135总计68137205解析215.984,因为15.98410.828,210.828的概率约为0.001.因此有99.9%以上的把握认为这两种培养基的培养效果有显著差异12某推销商为某保健药品做广告,在广告中宣传:“在服用该药品的105人中有100人未患A疾病”经调查发现,在不服用该药品的418人中仅有18人患A疾病请用所学知识分析该药品对患A疾病是否有效?解析将问题中的数据写成22列联表:患A疾病
6、不患A疾病合计服用该药品5100105不服用该药品18400418合计23500523计算可得20.0414,因为0.04146.635,所以有99%的把握认为该地区的老年人是否需要帮助与性别有关(3)根据(2)的结论可知,该地区的老年人是否需要志愿者提供帮助与性别有关,并且从样本数据能够看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此在调查时,先确定该地区老年人中男女的比例,再把老年人分成男女两层,并采用分层抽样方法比简单随机抽样方法更好14(2019人大附中模拟)大家知道,莫言是中国首位获得诺贝尔奖的文学家,某高校文学社从男女生中各抽取50名同学调查对莫言作品的了解程度,结
7、果如下:阅读过莫言的作品数(篇)0252650517576100101130男生36111812女生48131510(1)试估计该校学生阅读莫言作品超过50篇的概率;(2)对莫言作品阅读超过75篇的则称为“对莫言作品非常了解”,否则为“一般了解”根据题意完成下表,并判断能否有75%的把握认为对莫言作品非常了解与性别有关?非常了解一般了解合计男生女生合计附:2P(2k0)0.500.400.250.150.100.050.0250.010k00.4550.7081.3232.0722.7063.8415.0246.635解析(1)由抽样调查得阅读莫言作品在50篇以上的频率为.据此估计该校学生阅读
8、莫言作品超过50篇的概率约为.(2)非常了解一般了解合计男生302050女生252550合计5545100根据列联表数据得:21.0101.323,所以没有75%的把握认为对莫言作品非常了解与性别有关1(2018课标全国)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如图所示的饼图:则下面结论中不正确的是()A新农村建设后,种植收入减少B新农村建设后,其他收入增加了一倍以上C新农村建设后,养殖收入增加了一倍D新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半答案A解析方法
9、一:设建设前经济收入为a,则建设后经济收入为2a,则由饼图可得建设前种植收入为0.60,其他收入为0.04a,养殖收入为0.3a,建设后种植收入为0.74a,其他收入为0.1a,养殖收入为0.6a,养殖收入与第三产业收入的总和为1.16a,所以新农村建设后,种植收入减少是错误的故选A.方法二:因为0.63.841,故有95%的把握认为男、女顾客对该商场服务的评价有差异6(2017课标全国,文)为了监控某种零件的一条生产线的生产过程,检验员每隔30 min从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm)下面是检验员在一天内依次抽取的16个零件的尺寸:抽取次序12345678零件尺寸9.9
10、510.129.969.9610.019.929.9810.04抽取次序910111213141516零件尺寸10.269.9110.1310.029.2210.0410.059.95经计算得xi9.97,s0.212,18.439, (xi)(i8.5)2.78,其中xi为抽取的第i个零件的尺寸,i1,2,16.(1)求(xi,i)(i1,2,16)的相关系数r,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若|r|0.25,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小)(2)一天内抽检零件中,如果出现了尺寸在(3s,3s)之外的零件,就认为这条生产
11、线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查从这一天抽检的结果看,是否需对当天的生产过程进行检查?在(3s,3s)之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差(精确到0.01)附:样本(xi,yi)(i1,2,n)的相关系数r .0.09.解析(1)由样本数据得(x,i)(i1,2,16)的相关系数为r0.18.由于|r|0.25,因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(2)由于9.97,s0.212,由样本数据可以看出抽取的第13个零件的尺寸在(3s,3s)以外,因此需对当天的生产过程进行检查易除离群值
12、,即第13个数据,剩下数据的平均数为(169.979.22)10.02,这条生产线当天生产的零件尺寸的均值的估值为10.02,xi2160.2122169.9721 591.134.剔除第13个数据,剩下数据的样本方差为(1 591.1349.2221510.022)0.008.这条生产线当天生产的零件尺寸的标准差的估计值为0.09.7(2016课标全国)下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;(2)建立y与t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量附注
13、:参考数据:yi9.32,tiyi40.17, 0.55,2.646.参考公式:相关系数r,回归方程t中斜率和截距的最小二乘估计公式分别为:,.解析(1)由折线图中数据和附注中参考数据得4, (ti)228, 0.55, (ti)(yi)tiyiyi40.1749.322.89,r0.99.因为y与t的相关系数近似为0.99,说明y与t的线性相关程度相当高,从而可以用线性回归模型拟合y与t的关系(2)由1.331及(1)得0.103,1.3310.10340.92.所以,y关于t的回归方程为0.920.10t,将2016年对应的t9代入回归方程得0.920.1091.82.所以预测2016年我
14、国生活垃圾无害化处理量约为1.82亿吨8(2015课标全国)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响,对近8年的年宣传费xi和年销售量yi(i1,2,8)数据作了初步处理,得到下面的散点图及一些统计量的值 (xi)2 (wi)2 (xi)(yi) (wi)(yi)46.65636.8289.81.61 469108.8表中wi,wi.(1)根据散点图判断,yabx与ycd哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y关于x的回归
15、方程;(3)已知这种产品的年利润z与x,y的关系为z0.2yx.根据(2)的结果回答下列问题:年宣传费x49时,年销售量及年利润的预报值是多少?年宣传费x为何值时,年利润的预报值最大?附:对于一组数据(u1,v1),(u2,v2),(un,vn),其回归直线vu的斜率和截距的最小二乘估计分别为,.解析(1)由散点图可以判断,ycd适宜作为年销售量y关于年宣传费x的回归方程类型(2)令w,先建立y关于w的线性回归方程,由于68,563686.8100.6.y关于w的线性回归方程为100.668w.因此y关于x的回归方程为100.668.(3)由(2)知x49时,年销售量y的预报值为100.668
16、576.6,年利润z的预报值576.60.24966.32.根据(2)的结果知年利润z的预报值为0.2(100.668)xx13.620.12.当6.8,即x46.24时,取得最大值年宣传费为46.24千元时,年利润的预报值最大9(2017课标全国,文)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:(1)记A表示事件“旧养殖法的箱产量低于50 kg”,估计A的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:箱产量50 kg箱产量50 kg旧养殖法新养殖法(3
17、)根据箱产量的频率分布直方图,对这两种养殖方法的优劣进行比较附:P(K2k)0.0500.0100.010k3.8416.63510.828K2.解析(1)旧养殖法的箱产量低于50 kg的频率为(0.0120.0140.0240.0340.040)50.62.因此,事件A的概率估计值为0.62.(2)由(1)得旧养殖法的箱产量低于50 kg的有0.6210062(个),新养殖法箱产量低于50 kg的频率为(0.0040.0200.044)50.34,新养殖法的箱产量低于50 kg的有0.3410034(个)根据箱产量的频率分布直方图得列联表:箱产量6.635,故有99%的把握认为箱产量与养殖方
18、法有关(3)箱产量的频率分布直方图表明:新养殖法的箱产量平均值(或中位数)在50 kg到55kg之间旧养殖法的箱产量平均值(或中位数)在45 kg至50 kg之间,且新养殖法的箱产量分布集中程度较旧养殖法的箱产量分布集中程度高,因此,可以认为新养殖法的箱产量较高且稳定,从而新养殖法优于旧养殖法1(高考真题江西卷)某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是()表1 成绩性别不及格及格总计男61420女102232总计163652表2 视力性别好差总计男41620女122032总计163652、
19、表3 智商性别偏高正常总计男81220女82432总计163652表4 阅读量性别丰富不丰富总计男14620女23032总计163652A.成绩 B视力C智商 D阅读量答案D解析根据数据求出K2的值,再进一步比较大小A中,a6,b14,c10,d22,ab20,cd32,ac16,bd36,n52,2.B中,a4,b16,c12,d20,ab20,cd32,ac16,bd36,n52,2.C中,a8,b12,c8,d24,ab20,cd32,ac16,bd36,n52,2.D中,a14,b6,c2,d30,ab20,cd32,ac16,bd36,n52,2.,与性别有关联的可能性最大的变量是阅
20、读量2(高考真题湖北卷)根据如下样本数据x345678y4.02.50.50.52.03.0得到的回归方程为bxa,则()Aa0,b0Ba0,b0Ca0 Da0,b0答案B解析根据题中表内数据画出散点图(图略),由散点图可知b0,选B.3(高考真题辽宁卷)调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程:0.254x0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加_万元答案0.254解析家庭收入每增加1万元,对应回归直线方程中的x增加1,相应的的值增加0.25
21、4,即年饮食支出平均增加0.254万元4(2015重庆文)随着我国经济的发展,居民的储蓄存款逐年增长设某地区城乡居民人民币储蓄存款(年底余额)如下表:年份20102011201220132014时间代号t12345储蓄存款y(千亿元)567810(1)求y关于t的回归方程t;(2)用所求回归方程预测该地区2015年(t6)的人民币储蓄存款附:回归方程t中,.解析(1)列表计算如下,itiyiti2tiyi11515226412337921448163255102550153655120这里n5,ti3,yi7.2.又lttti2n25553210,ltytiyin120537.212,从而1.
22、2,7.21.233.6,故所求回归方程为1.2t3.6.(2)将t6代入回归方程可预测该地区2015年的人民币储蓄存款为1.263.610.8(千亿元)5(2014课标全国)某地区2007年至2013年农村居民家庭人均纯收入y(单位:千元)的数据如下表:年份2007200820092010201120122013年份代号t1234567人均纯收入y2.93.33.64.44.85.25.9(1)求y关于t的线性回归方程;(2)利用(1)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入附:回归直线的斜率和截距的最小二乘
23、估计公式分别为:,.解析(1)由所给数据计算,得(1234567)4,(2.93.33.64.44.85.25.9)4.3, (ti)2941014928, (ti)(yi)(3)(1.4)(2)(1)(1)(0.7)00.110.520.931.614,0.5,t4.30.542.3.所求回归方程为0.5t2.3.(2)由(1)知,0.50,故2007年至2013年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元将2015年的年份代号t9代入(1)中的回归方程,得0.592.36.8,故预测该地区2015年农村居民家庭人均纯收入约为6.8千元6(高考真题重庆卷)从某居民区随机抽取
24、10个家庭,获得第i个家庭的月收入xi(单位:千元)与月储蓄yi(单位:千元)的数据资料,算得xi80,yi20,xiyi184,xi2720.(1)求家庭的月储蓄y对月收入x的线性回归方程ybxa;(2)判断变量x与y之间是正相关还是负相关;(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄附:线性回归方程ybxa中,b,ab,其中,为样本平均值,线性回归方程也可写为x.解析(1)由题意知n10,xi8,yi2,又xi2n2720108280,xiyin184108224,由此得b0.3,ab20.380.4,故所求回归方程为0.3x0.4.(2)由于变量y的值随x的值增加而增加(b0.30),故x与y之间是正相关(3)将x7代入回归方程可以预测该家庭的月储蓄约为y0.370.41.7千元