1、章末综合测评(一)统计案例(时间120分钟,满分150分)一、选择题(本大题共12小题,每小题5分,共60分在每小题给出的四个选项中,只有一项是符合题目要求的)1在下列各量与量的关系中是相关关系的为()正方体的体积与棱长之间的关系;一块农田的水稻产量与施肥量之间的关系;人的身高与年龄之间的关系;家庭的支出与收入之间的关系;某户家庭用电量与电费之间的关系ABCD【解析】是一种确定性关系,属于函数关系正确【答案】D2散点图在回归分析过程中的作用是()A查找个体个数B比较个体数据大小关系C探究个体分类D粗略判断变量是否线性相关【解析】由散点图可以粗略地判断两个变量是否线性相关,故选D.【答案】D3身
2、高与体重有关系可以用_来分析()A残差B回归分析C等高条形图D独立性检验【解析】因为身高与体重是两个具有相关关系的变量,所以要用回归分析来解决【答案】B4一位母亲记录了她儿子3岁到9岁的身高,建立了她儿子身高与年龄的回归模型73.937.19x,她用这个模型预测儿子10岁时的身高,则下面的叙述正确的是()A她儿子10岁时的身高一定是145.83 cmB她儿子10岁时的身高一定是145.83 cm以上C她儿子10岁时的身高在145.83 cm左右D她儿子10岁时的身高一定是145.83 cm以下【解析】由回归模型得到的预测值是可能取值的平均值,而不是精确值,故选C.【答案】C5在等高条形图中,下
3、列哪两个比值相差越大,要推断的论述成立的可能性就越大()A.与B.与C.与D.与【解析】由等高条形图的解可知与的值相差越大,|adbc|就越大,相关性就越强【答案】C6已知一个线性回归方程为1.5x45,其中x的取值依次为1,7,5,13,19,则()A58.5B46.5C60D75【解析】(1751319)9,回归直线过样本点的中心(,),1.594558.5.【答案】A7若两个变量的残差平方和是325,(yii)2923,则随机误差对预报变量的贡献率约为()A64.8%B60%C35.2%D40%【解析】相关指数R2表示解释变量对于预报变量变化的贡献率,故随机误差对预报变量的贡献率为100
4、%100%35.2%,故选C.【答案】C8在研究吸烟与患肺癌的关系中,通过收集数据并整理、分析,得到“吸烟与患肺癌有关”的结论,并且有99%的把握认为这个结论成立下列说法正确的个数是()在100个吸烟者中至少有99个人患肺癌;如果一个人吸烟,那么这个人有99%的概率患肺癌;在100个吸烟者中一定有患肺癌的人;在100个吸烟者中可能一个患肺癌的人也没有. 【导学号:81092008】A4B3C2D1【解析】有99%的把握认为“吸烟与患肺癌有关”,指的是“吸烟与患肺癌有关”这个结论成立的可能性或者可信程度有99%,并不表明在100个吸烟者中至少有99个人患肺癌,也不能说如果一个人吸烟,那么这个人就
5、有99%的概率患肺癌;更不能说在100个吸烟者中一定有患肺癌的人,反而有可能在100个吸烟者中,一个患肺癌的人也没有故正确的说法仅有,选D.【答案】D9下面是调查某地区男女中学生喜欢理科的等高条形图,阴影部分表示喜欢理科的百分比,从图1中可以看出()图1A性别与喜欢理科无关B女生中喜欢理科的百分比为80%C男生比女生喜欢理科的可能性大些D男生不喜欢理科的百分比为60%【解析】从题图中可以分析,男生喜欢理科的可能性比女生大一些【答案】C10下列关于K2的说法中正确的是()AK2在任何相互独立问题中都可以用来检验有关还是无关BK2的值越大,两个分类变量相关的可能性就越小CK2是用来判断两个分类变量
6、是否有关系的随机变量,只对两个分类变量适用DK2的计算公式为K2【解析】K2只适用于22列联表问题,故A错;K2越大两个分类变量相关的可能性越大,故B错;选项D中公式错误,分子应为n(adbc)2.【答案】C11在两个学习基础相当的班级实行某种教学措施的试验,测试结果见下表,则试验效果与教学措施()优、良、中差总计实验班48250对比班381250总计8614100A.有关B无关C关系不明确D以上都不正确【解析】随机变量K2的观测值为k8.3067.879,则认为“试验效果与教学措施有关”的概率为0.995.【答案】A12为预测某种产品的回收率y,需要研究它和原料有效成分含量x之间的相关关系,
7、现取了8组观测值计算知i52,i228,478,iyi1 849,则y对x的回归方程是()A.11.472.62xB.11.472.62xC.2.6211.47xD.11.472.62x【解析】由已知数据计算可得2.62,11.47,所以回归方程是11.472.62x,故选A.【答案】A二、填空题(本大题共4小题,每小题5分,共20分将答案填在题中的横线上)13若一组观测值(x1,y1),(x2,y2),(xn,yn)之间满足yibxiaei(i1,2,n),若ei恒为0,则R2的值为_【解析】由ei恒为0,知yii,即yii0,故R21101.【答案】114某单位为了了解用电量y(度)与气温
8、x()之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表:气温()1813101用电量(度)24343864由表中数据得回归直线方程x中的2,预测当气温为4 时,用电量为_.【解析】根据题意知10,40,因为回归直线过样本点的中心,所以40(2)1060,所以当x4时,y(2)(4)6068,所以用电量为68度【答案】6815为了判断高中三年级学生是否选修文科与性别的关系,现随机抽取50名学生,得到如下22列联表:理科文科男1310女720已知P(K23.841)0.05,P(K25.024)0.025.根据表中数据,得到k4.844,则认为“选修文科与性别有关系”出错的可能性为_
9、【解析】k4.8443.841,故判断出错的概率为0.05.【答案】0.0516若对于变量y与x的10组统计数据的回归模型中,相关指数R20.95,又知残差平方和为120.53,那么(yi)2的值为_【解析】R21,残差平方和(yii)2120.53,0.951,(yi)22 410.6.【答案】2 410.6三、解答题(本大题共6小题,共70分解答时应写出必要的文字说明、证明过程或演算步骤)17(本小题满分10分)为了解铅中毒病人与尿棕色素为阳性是否有关系,分别对病人组和对照组的尿液作尿棕色素定性检查,结果如下:组别阳性数阴性数总计铅中毒病人29736对照组92837总计383573试画出列
10、联表的等高条形图,分析铅中毒病人和对照组的尿棕色素阳性数有无差别,铅中毒病人与尿棕色素为阳性是否有关系【解】等高条形图如图所示:其中两个浅色条的高分别代表铅中毒病人和对照组样本中尿棕色素为阳性的频率由图可以直观地看出铅中毒病人与对照组相比较尿棕色素为阳性差异明显,因此铅中毒病人与尿棕色素为阳性有关系18(本小题满分12分)吃零食是中学生中普遍存在的现象,吃零食对学生身体发育有诸多不利影响,影响学生的健康成长下表是性别与吃零食的列联表:男女总计喜欢吃零食51217不喜欢吃零食402868总计454085请问喜欢吃零食与性别是否有关?【解】k,把相关数据代入公式,得k4.7223.841.因此,在
11、犯错误的概率不超过0.05的前提下,可以认为“喜欢吃零食与性别有关”19(本小题满分12分)为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价x(元)88.28.48.68.89销量y(件)908483m7568根据最小二乘法建立的回归直线方程为20x250.(1)试求表格中m的值;(2)预计在今后的销售中,销量与单价仍然服从建立的回归方程,且该产品的成本是5元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润销售收入成本) 【导学号:81092009】【解】(1)由于(88.28.48.68.89)8.5,所以208.525080,故(9084
12、83m7568)80,解得m80.(2)设工厂获得的利润为L元,依题意得L(x5)(20x250)20(x0),所以x8.75时,L取得最大值故当单价定为8.75元/件时,工厂可获得最大利润20(本小题满分12分)如图2是对用药与不用药,感冒已好与未好进行统计的等高条形图若此次统计中,用药的患者是70人,不用药的患者是40人,试问:能否在犯错误的概率不超过0.001的前提下认为“感冒已好与用药有关”?图2【解】根据题中的等高条形图,可得在用药的患者中感冒已好的人数为7056,在不用药的患者中感冒已好的人数为4012.22列联表如下:感冒已好感冒未好总计用药561470不用药122840总计68
13、42110根据表中数据,得到k26.9610.828.因此,能在犯错误的概率不超过0.001的前提下认为感冒已好与用药有关系21(本小题满分12分)某高校共有学生15 000人,其中男生10 500人,女生4 500人,为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时间的样本数据(单位:小时)图3(1)应收集多少位女生的样本数据?(2)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图3所示),其中样本数据的分组区间为:0,2,(2,4,(4,6,(6,8,(8,10,(10,12,估计该校学生每周平均体育运动时间超过4小
14、时的概率;(3)在样本数据中,有60位女生的每周平均体育运动时间超过4小时,请完成每周平均体育运动时间与性别列联表,并判断是否有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”附:K2.P(K2k0)0.100.050.0100.005k02.7063.8416.6357.879【解】(1)30090,所以应收集90位女生的样本数据(2)由频率分布直方图得12(0.0250.100)0.75,所以该校学生每周平均体育运动时间超过4小时的概率的估计值为0.75.(3)由(2)知,300位学生中有3000.75225人的每周平均体育运动时间超过4小时,75人的每周平均体育运动时间不超过
15、4小时又因为样本数据中有210份是关于男生的,90份是关于女生的,所以每周平均体育运动时间与性别列联表如下:每周平均体育运动时间与性别列联表男生女生总计每周平均体育运动时间不超过4小时453075每周平均体育运动时间超过4小时16560225总计21090300结合列联表可算得K24.7623.841.所以,有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”22(本小题满分12分)在关于人的脂肪含量(百分比)和年龄的关系的研究中,研究人员获得了一组数据如下表:年龄x2327394145495053545657586061脂肪含量y9.517.821.225.927.526.328.
16、229.630.231.430.833.535.234.6(1)作出散点图,并判断y与x是否线性相关,若线性相关,求线性回归方程;(2)求相关指数R2,并说明其含义;(3)给出37岁时人的脂肪含量的预测值【解】(1)散点图如图所示由散点图可知样本点呈条状分布,脂肪含量与年龄有比较好的线性相关关系,因此可以用线性回归方程来刻画它们之间的关系设线性回归方程为x,则由计算器算得0.576,0.448,所以线性回归方程为0.576x0.448.(2)残差平方和: (yii)237.20,总偏差平方和: (yi)2644.99,R210.942,表明年龄解释了94.2%的脂肪含量变化(3)当x37时,0.576370.44820.9,故37岁时人的脂肪含量约为20.9%.