1、章末综合检测(一)学生用书P57(单独成册)(时间:120分钟,满分:150分)一、选择题:本题共12小题,每小题5分,在每小题给出的四个选项中,只有一项是符合题目要求的1在下列各图中,两个变量具有较强正相关关系的散点图是()解析:选B.因为两变量x,y成正相关,所以其在坐标系中的散点分布应在左下角到右上角的区域,故选B.2商品销售量y(单位:件)与销售价格x(单位:元/件)负相关,则其回归方程可能是()A.10x200B.10x200C.10x200D.10x200解析:选A.由x与y负相关,可排除B,D两项,而C项中的10x2000不符合题意,故选A.3设产品产量与产品质量之间的线性相关系
2、数为0.87,这说明二者存在着()A高度相关B中度相关C弱度相关D极弱相关解析:选A.因为|0.87|0.87,与1接近,二者存在高度相关4某市政府调查市民收入增减与旅游愿望的关系时,采用独立性检验法抽查了3 000人,计算发现K26.023,则根据这一数据查阅下表,市政府断言市民收入增减与旅游愿望有关系的可信程度是()P(K2k0)0.250.150.100.0250.0100.005k01.3232.0722.7065.0246.6357.879A.90%B95%C97.5%D99.5%解析:选C.因为K26.0235.024,故其可信程度为97.5%.5某汽车的使用年数x与所支出的维修总
3、费用y的统计数据如表:使用年数x/年12345维修总费用y/万元0.51.22.23.34.5根据上表可得y关于x的线性回归方程x0.69,若该汽车维修总费用超过10万元就不再维修,直接报废,据此模型预测该汽车最多可使用(不足1年按1年计算)()A8年B9年C10年D11年解析:选D.由y关于x的线性回归直线x0.69过样本点的中心(3,2.34),得1.01,即线性回归方程为1.01x0.69,由1.01x0.6910得x10.6,所以预测该汽车最多可使用11年,故选D.6与变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);与变量U
4、与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1)r1表示变量Y与X之间的线性相关系数,r2表示变量V与U之间的线性相关系数,则()Ar2r10B0r2r1Cr20r1Dr2r1解析:选C.对于变量Y与X而言,Y随X的增大而增大,故Y与X成正相关,即r10;对于变量V与U而言,V随U的增大而减小,故V与U成负相关,即r20,所以有r20r1.7某考察团对全国10大城市进行职工人均工资水平x(单位:千元)与居民人均消费水平y(单位:千元)统计调查发现,y与x具有相关关系,回归方程为0.66x1.562.若某城市居民人均消费水平为7.675千元,
5、估计该城市人均消费额占人均工资收入的百分比约为()A83%B72%C67%D66%解析:选A.因为当7.675时,x9.262,所以0.82983%.8如图所示的等高条形图可以说明的问题是()A“心脏搭桥”手术和“血管清障”手术对“诱发心脏病”的影响是绝对不同的B“心脏搭桥”手术和“血管清障”手术对“诱发心脏病”的影响没有什么不同C此等高条形图看不出两种手术有什么不同的地方D“心脏搭桥”手术和“血管清障”手术对“诱发心脏病”的影响在某种程度上是不同的,但是没有100%的把握解析:选D.由等高条形图可知选项D正确9下列说法:将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;设有一个回归
6、方程35x,变量x增加一个单位时,y平均增加5个单位;在线性回归分析中,判断所求得的两个相关变量x,y的回归方程拟合效果时,采用相关指数R2进行定量分析,R2越大(越接近1)说明模型拟合效果越好;在一个22列联表中,由计算得K2的观测值为13.079,则有99%的把握确认这两个变量间有关系其中错误的个数是()A0B1C2D3解析:选C.方差反映一组数据的波动大小,将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变,故正确;设有一个回归方程35x,变量x增加一个单位时,y平均减少5个单位,故不正确;判断模型拟合效果的重要量化指标为相关指数R2,R2越大意味着残差平方和就越小,拟合效果就越
7、好故正确;由计算得K2的观测值为13.079,对照临界值,可得其两个变量间有关系的可能性是99.9%,故错误,综上知,错误的个数是2.10若对于变量y与x的10组统计数据的回归模型R20.95,又知残差平方和为120.53,那么(yi)2的值为()A241.06B2 410.6C253.08D2 530.811(2019莆田模拟)某工厂为了调查工人文化程度与月收入的关系,随机抽取了部分工人,得到如下列联表:月收入2 000元及以下月收入2 000元以上总计高中文化以上504090高中文化及以下102030总计6060120请根据下表,估计有多大把握认为文化程度与月收入有关系()P(K2k0)0
8、.500.400.250.150.100.050.0250.0100.0050.001k00.4550.7081.3232.0722.7063.8415.0246.6357.87910.828A.1%B99%C5%D95%解析:选D.根据列联表得出K2的观测值k4.4443.841,则有95%以上的把握认为文化程度与月收入有关系故选D.12(2019石家庄模拟)对甲、乙两个班级学生的数学考试成绩按照优秀和不优秀统计人数后,得到如下列联表:优秀不优秀总计甲班10b10b乙班c3030c总计10c30b40bc已知在全部105人中随机抽取1人,成绩优秀的概率为,则下列说法正确的是()A列联表中c的
9、值为30,b的值为35B列联表中c的值为15,b的值为50C有97.5%以上的把握认为成绩与班级有关系D没有97.5%以上的把握认为成绩与班级有关系解析:选C.由题意,知成绩优秀的学生人数是10530,成绩不优秀的学生人数是1053075,所以c20,b45,选项A,B错误因为K2的观测值k6.1095.024,因此有97.5%以上的把握认为成绩与班级有关系二、填空题:本大题共4小题,每小题5分,共20分把答案填在题中横线上13给出下列实际问题:一种药物对某种病的治愈率;两种药物治疗同一种病是否有关系;吸烟者得肺病的概率;吸烟人群是否与性别有关系;上网与青少年的犯罪率是否有关系其中,用独立性检
10、验可以解决的问题有_解析:独立性检验主要是对两个分类变量是否有关系进行检验,主要涉及两种变量对同一种事情的影响,或者是两种变量在同一问题上体现的区别等答案:14以下三个命题:若两个变量的线性相关性越强,则它们的相关系数的值越接近于1;在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高;对分类变量与Y的随机变量K2的观测值k来说,k越小,判断“与Y有关系”的把握越大其中假命题的序号为_解析:线性相关系数r的绝对值越接近于1,两变量的线性相关性越强,但两个变量的线性相关性越强它们的相关系数的值不一定越接近1,也有可能接近1,故命题错误;在残差图中,残差点分布的带状区域的宽度越狭窄,
11、其模型拟合的精度越高;显然错误答案:15已知样本容量为11,计算得回归方程为0.3x,则_,_(精确到0.01)答案:46.365.5516某中学为了解喜欢看世界杯足球赛是否与性别有关,随机调查了部分学生,在被调查的中学生中,男生人数是女生人数的2倍,男生喜欢看世界杯足球赛的人数占男生人数的,女生喜欢看世界杯足球赛的人数占女生人数的.若被调查的男生人数为n,且有95%以上的把握认为是否喜欢看世界杯足球赛与性别有关,则男生的人数至少为_解析:由题意得到如下列联表:喜欢看世界杯足球赛不喜欢看世界杯足球赛总计男生n女生总计n所以K2的观测值k.因为有95%以上的把握认为是否喜欢看世界杯足球赛与性别有
12、关,所以k3.841,即3.841,n10.243.又,为整数,所以n的最小值为12,即男生的人数至少为12.答案:12三、解答题:本大题共6小题,共70分解答应写出文字说明、证明过程或演算步骤17(本小题满分10分)为了研究子女吸烟与父母吸烟的关系,调查了一千多名青少年及其家长,数据如下:父母吸烟父母不吸烟总计子女吸烟23783320子女不吸烟6785221 200总计9156051 520试用等高条形图方法判断父母吸烟对子女吸烟是否有影响解:等高条形图如图所示:由图形可以看出父母吸烟者中子女吸烟的比例要比父母不吸烟者中子女吸烟的比例高,因此可以在某种程度上认为“子女吸烟与父母吸烟有关”18
13、(本小题满分12分)在一次飞机航程中调查男女乘客的晕机情况,在80名男性乘客中,其中有10人晕机,其他70人不晕机;而在30名女性乘客中,有10人晕机,其他20人不晕机(1)列出22列联表;(2)判断能否在犯错误的概率不超过0.025的前提下认为“晕机与性别有关”?解:(1)22列联表如下:晕机不晕机总计男107080女102030总计2090110(2)由列联表中的数据得K2的观测值k6.3665.024,故在犯错误的概率不超过0.025的前提下可以认为“晕机与性别有关”19(本小题满分12分)某运动员训练次数与成绩之间的关系如下表:训练次数x3033353739444650成绩y30343
14、73942464851作出散点图,并求出线性回归方程解:作出散点图如图所示由散点图,可知x,y之间具有线性相关关系所以线性回归方程为1.041 5 x0.003 9.20(本小题满分12分)某机构为研究患肺癌是否与吸烟有关,做了一次相关调查,其中部分数据丢失,但可以确定的是调查的不吸烟的人数与吸烟的人数相同,吸烟患肺癌的人数占吸烟总人数的,不吸烟的人数中,患肺癌的人数与不患肺癌的人数之比为14.(1)若吸烟不患肺癌的有4人,现从患肺癌的人中用分层抽样的方法抽取5人,再从这5人中随机抽取2人进行调查,求这2人都是吸烟患肺癌的概率;(2)若研究得到在犯错误的概率不超过0.001的前提下,认为患肺癌
15、与吸烟有关,则吸烟的人数至少为多少?附:K2,其中nabcd.P(K2k0)0.1000.0500.0100.001k02.7063.8416.63510.828解:(1)设吸烟的人数为x,依题意有x4,所以x20,吸烟的有20人,故吸烟患肺癌的有16人,吸烟不患肺癌的有4人由题意得,不吸烟的有20人,其中不吸烟患肺癌的有4人,不吸烟不患肺癌的有16人用分层抽样的方法从患肺癌的人中抽取5人,则应从吸烟患肺癌的人中抽取4人,分别记为a,b,c,d,从不吸烟患肺癌的人中抽取1人,记为A.从这5人中随机抽取2人,所有可能的结果有(a,b),(a,c),(a,d),(a,A),(b,c),(b,d),
16、(b,A),(c,d),(c,A),(d,A),共10种,其中这2人都是吸烟患肺癌的结果共有6种,所以P,即这2人都是吸烟患肺癌的概率为.(2)法一:设吸烟的人数为5x,由题意可得列联表如下:患肺癌不患肺癌总计吸烟4xx5x不吸烟x4x5x总计5x5x10x由表得,K2的观测值k3.6x,由题意,得3.6x10.828,所以x3.007,因为x为整数,所以x的最小值为4,则5x20,即吸烟的人数至少为20.法二:设吸烟的人数为x,由题意可得列联表如下:患肺癌不患肺癌总计吸烟xxx不吸烟xxx总计xx2x由表得,K2的观测值kx,由题意得x10.828,所以x15.039,因为x为整数且为5的倍
17、数,所以x的最小值为20,即吸烟的人数至少为20.21(本小题满分12分)以下资料是一位销售经理收集到的每年销售额y(千元)和销售经验x(年)的关系:销售经验x/年13446810101113年销售额y/千元809792102103111119123117136(1)依据这些数据画出散点图并作直线784.2x,计算 (yii)2;(2)依据这些数据求回归直线方程并据此计算 (yii)2;(3)比较(1)(2)中的残差平方和 (yii)2的大小解:(1)散点图与直线784.2x的图形如图所示:对x1,3,13,有i82.2,90.6,94.8,94.8,103.2,111.6,120,120,1
18、24.2,132.6, (yii)2179.28.(2) xi7, (xi)2142,yyi108, (xi)(yi)568,所以4,1087480,故804x,对x1,3,13,有i84,92,96,96,104,112,120,120,124,132, (yii)2170.(3)比较可知,第(2)问中求出的残差平方和 (yii)2较小22(本小题满分12分)某电视厂家准备在元旦举行促销活动,现根据近七年的广告费与销售量的数据确定此次广告费支出广告费支出x(万元)和销售量y(万台)的数据如下:年份2011201220132014201520162017广告费支出x1246111319销售量y
19、1.93.24.04.45.25.35.4(1)若用线性回归模型拟合y与x的关系,求出y关于x的线性回归方程;(2)若用ycd模型拟合y与x的关系,可得回归方程1.630.99,经计算线性回归模型和该模型的R2分别约为0.75和0.88,请用R2说明选择哪个回归模型更好;(3)已知利润z与x,y的关系为z200yx.根据(2)的结果回答下列问题:广告费x20时,销售量及利润的预报值是多少?广告费x为何值时,利润的预报值最大?(精确到0.01)参考公式:回归直线x的斜率和截距的最小二乘估计分别为参考数据:2.24.(2)因为0.750.88且R2越大,反映残差平方和越小,模型的拟合效果越好,所以选用1.630.99更好(3)由(2)知,当x20时,销售量的预报值1.630.996.07(万台),利润的预报值z200(1.630.99)201 193.04(万元)z200(1.630.99)xx198326()2198326(99)210 127,所以当99,即x9 801时,利润的预报值最大,故广告费为9 801万元时,利润的预报值最大