1、第一章测评(时间120分钟,满分150分)一、选择题(本大题共12小题,每小题5分,共60分)1.已知下面的22列联表:y1y2总计x1ab73x222c47总计7446120则a+b+c等于()A.96B.97C.98D.99解析根据表中的数据,可得a+b+c+22=120,所以a+b+c=120-22=98.答案C2.以下关于线性回归的判断,正确的个数是()若散点图中所有点都在一条直线附近,则这条直线为回归直线;散点图中的绝大多数点都线性相关,个别特殊点不影响线性回归,如图中的A,B,C点;已知直线方程为=0.50x-0.81,则x=25时,y的估计值为11.69;回归直线方程的意义是它反
2、映了样本整体的变化趋势.A.0B.1C.2D.3解析能使所有数据点都在一条直线附近的直线不止一条,由回归方程的定义知,只有按最小二乘法求得回归系数a,b得到的直线=ax+b才是回归方程,错误;散点图中的绝大多数点都线性相关,个别特殊点不会影响线性回归,故正确;将x=25代入=0.50x-0.81,解得=11.69,正确;散点图中所有点都在回归直线的附近,因此回归直线方程反映了样本整体的变化趋势,故正确.综上所述,正确的有3个.故选D.答案D3.已知某种产品的支出广告额x(单位:万元)与利润额y(单位:万元)之间有如下对应数据:x/万元34567y/万元2030304060则回归直线必过点()A
3、.(5,36)B.(5,35)C.(5,30)D.(4,30)解析由题意可知回归直线方程必过样本点的中心,即(5,36).答案A4.为大力提倡“厉行节约,反对浪费”,某市通过随机询问100名居民是否能做到“光盘”行动,得到如下的列联表:做不到“光盘”能做到“光盘”男4510女3015附:P(K2k0)0.100.050.025k02.7063.8415.024K2=参照附表,得到的正确结论是()A.在犯错误的概率不超过0.01的前提下认为“该市居民能否做到光盘与性别有关”B.在犯错误的概率不超过0.01的前提下认为“该市居民能否做到光盘与性别无关”C.在犯错误的概率不超过0.1的前提下认为“该
4、市居民能否做到光盘与性别有关”D.在犯错误的概率不超过0.1的前提下认为“该市居民能否做到光盘与性别无关”解析由题设知a=45,b=10,c=30,d=15.所以K2的观测值k=3.030 3.又2.7063.030 35.024,查表可得,P(K25.024)=0.025,故x与y之间有关系该推断犯错误的概率不超过0.025.答案C6.已知方程=0.85x-85.7是根据女大学生的身高预报体重的回归方程,其中x,的单位分别是cm,kg,则该方程在样本(165,57)处的残差是()A.54.55B.2.45C.-2.45D.111.55解析该方程在样本(165,57)处的残差为57-(0.85
5、165-85.7)=2.45.答案B7.某考察团对全国某10个城市进行职工人均工资水平x(单位:千元)与居民人均消费水平y(单位:千元)统计调查发现,y与x具有相关关系,回归方程为=0.66x+1.562.若某城市居民人均消费水平为7.675(单位:千元),估计该城市人均消费额占人均工资收入的百分比约为()A.83%B.72%C.67%D.66%解析当居民人均消费水平为7.675时,则7.675=0.66x+1.562,即职工人均工资水平x9.262,人均消费额占人均工资收入的百分比为100%83%.故选A.答案A8.有下列说法:若某商品的销售量y(单位:件)关于销售价格x(单位:元/件)的线
6、性回归方程为=-5x+350,当销售价格为10元时,销售量一定为300件;线性回归直线x+一定过样本点中心();在残差图中,残差点比较均匀落在水平的带状区域中即可说明选用的模型比较合适,与带状区域的宽度无关;在线性回归模型中,相关指数R2表示解释变量对于预报变量变化的贡献率,R2越接近于1,表示回归的效果越好.其中正确的结论有()A.1个B.2个C.3个D.4个解析当销售价格为10元时,销售量的预估值为300件,但预估值与实际值未必相同,错误;由最小二乘法可知,回归直线必过(),正确;残差图中,带状区域越窄,模型拟合度越高,错误;相关指数R2越接近1,拟合度越高,则在线性回归模型中,回归效果越
7、好,正确.可知正确的结论共2个.答案B9.为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价x/元88.28.48.68.89销量y/件908483807568若计算得到的线性回归方程为x+250,则等于()A.20B.30C.-20D.-30解析由题意得=8.5,=80,因为+250,所以80=8.5+250,解得=-20.答案C10.已知x与y之间的几组数据如下表:x123456y021334假设根据上表数据所得线性回归方程为x+.若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y=bx+a,则以下结论正确的是()A.b,aB.b,
8、aC.aD.b,a解析由题表知,代入公式求得=-.将(1,0)和(2,2)分别代入y=bx+a,得b=2,a=-2,所以a.故选C.答案C11.已知变量x,y之间的线性回归方程为=-0.7x+10.3,且变量x,y之间的一组相关数据如下表所示,则下列说法错误的是()x681012y6m32A.变量x,y之间呈现负相关关系B.m=4C.可以预测,当x=11时,y=2.6D.由表格数据知该回归直线必过点(9,4)解析因为=9,=-0.79+10.3=4,所以=4,所以m=5.答案B12.已知两个分类变量X和Y,它们的取值分别为x1,x2和y1,y2,其样本频数分别是a=10,b=21,c+d=35
9、,若“X和Y有关系”此推断犯错误的概率不超过0.1,则c等于()A.4B.5C.6D.7解析由a=10,b=21,c+d=35,可得n=66,d=35-c,a+b=31,a+c=10+c,b+d=56-c,ad=10(35-c),bc=21c.由于“X和Y有关系”此推断犯错误的概率不超过0.1,则随机变量K2的观测值3.841k2.706,得3.8412.706,代入检验,得c=5符合题意.答案B二、填空题(本大题共4小题,每小题5分,共20分)13.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如下表),由最小二乘法求得回归方程=0.67x+54
10、.9.零件数x/个1020304050加工时间y/min62758189现发现表中有一个数据看不清,请推断出该数据的值为.解析设表中有一个模糊不清的数据为m,由表中数据得=30,由最小二乘法求得回归方程=0.67x+54.9,将=30,代入回归方程,得m=68.答案6814.根据如下样本数据:x34567y4.02.5-0.50.5-2.0得到的回归方程为x+,若=7.9,则x每增加1个单位,y就平均个单位.解析由题表中数据可得=5,=0.9,因为x+一定经过点(5,0.9),所以0.9=5+7.9,可得=-1.4,因此x每增加1个单位,y就平均减少1.4个单位.答案减少1.415.独立性检验
11、显示:在犯错误的概率不超过0.1的前提下认为性别与是否喜爱喝酒有关系.则下列说法正确的是.在100名男性中约有90人爱喝酒;若某人爱喝酒,那么此人为男性的可能性为90%;认为性别与是否喜爱喝酒有关判断出错的可能性为0.1;有90%的把握认为10名男性中有9人爱喝酒.解析独立性检验是对两个分类变量有关系的可信程度的判断.答案16.某种产品的广告费支出x(单位:万元)与销售额y(单位:万元)之间有如下的对应数据:x/万元24568y/万元3040605070已知y与x之间具有线性相关关系,若实际销售额不低于82.5万元,则广告费支出最少是万元.解析由题表中数据可得y关于x的回归直线方程为=6.5x
12、+17.5,令6.5x+17.582.5,得x10,故广告费支出最少是10万元.答案10三、解答题(本大题共6小题,共70分)17.(本小题满分10分)某工业基地对在生产同一产品的甲、乙两个厂区,选择了乙厂区进行改革试点,一段时间后,工业基地为了检查甲、乙两个厂区的生产情况,随机地从这两厂区生产的大量产品中各抽取100件作为样本,得到关于产品质量指标值的频数分布表(已知合格产品的质量指标值应在区间(2.55,2.70内,否则为不合格产品):厂区频数(2.50,2.55(2.55,2.60(2.60,2.65(2.65,2.70(2.70,2.75甲厂区1820351512乙厂区12253025
13、8(1)将频率视为概率,由表中的数据分析,若在某个时间段内甲、乙两个厂区均生产了2 000件产品,则在此时间段内甲、乙两个厂区生产出的不合格产品分别为多少件?(2)根据样本数据写出下面22列联表中a,b,c,d的值,能否在犯错误的概率不超过0.15的前提下认为“该工业基地的产品质量与改革有关”,并说明理由.甲厂区(不改革)乙厂区(改革)总计合格品ab不合格品cd总计附:K2=(其中n=a+b+c+d为样本容量).P(K2k0)0.400.250.150.100.050.0250.0100.005k00.7081.3232.0722.7063.8415.0246.6357.879解(1)由表格可
14、知,甲厂区生产的产品的合格率为100%=70%,乙厂区生产的产品的合格率为100%=80%,所以甲、乙两厂区生产的产品的合格率分别为70%,80%,则在该时间段内,甲厂区生产的2 000件产品中,不合格产品有2 000(1-70%)=600件,乙厂区生产的2 000件产品中,不合格产品有2 000(1-80%)= 400件.(2)依题意知a=70,b=80,c=30,d=20,则K2=2.6672.072,所以在犯错误的概率不超过0.15的前提下,可以认为“该工业基地的产品质量与改革有关”.18.(本小题满分12分)某研究机构对高三学生的记忆力x和判断力y进行统计分析,得下表数据:x68101
15、2y2356(1)请画出上表数据的散点图;(2)请根据上表提供的数据,求出y关于x的线性回归方程x+.解(1)散点图如下:(2)由于=9,=4,xiyi=62+83+105+126=158,=62+82+102+122=344,=0.7,=4-0.79=-2.3,故线性回归方程为y=0.7x-2.3.19.(本小题满分12分)网购已成为当今消费者最喜欢的购物方式之一,某机构对A,B,C,D四家同类运动服装网店的关注人数x(单位:千人)与其商品销售件数y(单位:百件)进行统计对比,得到表格:ABCDx3467y11122017由散点图得知,可以用线性回归方程x+来近似刻画它们之间的关系.(1)试
16、建立y关于x的回归方程;(2)在(1)的回归模型中,请用R2说明销售件数的差异有多大程度是由关注人数引起的.(精确到0.01)解(1)由表中数据可得=5,=15,xiyi=320,=110,=2,所以=15-25=5,故线性回归方程为=2x+5.(2)(yi-)2=54,(yi-)2=14,R2=1-=1-0.74,说明销售件数的差异有74%是由关注人数引起的.20.(本小题满分12分)为了解某校学生参加社区服务的情况,采用按性别分层抽样的方法进行调查.已知该校共有学生960人,其中男生560人,从全校学生中抽取了容量为n的样本,得到一周参加社区服务的时间的统计数据如下表:超过1小时不超过1小
17、时男m8女128(1)求m,n;(2)能否在犯错误的概率不超过0.05的前提下认为该校学生一周参加社区服务时间是否超过1小时与性别有关?附:P(K2k0)0.050.0100.001k03.8416.63510.828K2=(n=a+b+c+d).解(1)由已知可得该校有女生400人,根据题意可得,解得m=20,所以n=20+8+12+8=48.(2)由题意得列联表如下:超过1小时的人数不超过1小时的人数总计男20828女12820总计321648根据表中的数据得k=0.6863.841,所以在犯错误的概率不超过0.05的前提下不能认为该校学生一周参加社区服务时间是否超过1小时与性别有关系.2
18、1.(本小题满分12分)二手车经销商小王对其所经营的某一型号二手汽车的使用年数x(0x10)与销售价格y(单位:万元/辆)进行整理,得到如表的对应数据:使用年数246810售价16139.574.5(1)试求y关于x的回归直线方程;(2)已知每辆该型号汽车的收购价格为w=0.05x2-1.75x+17.2(单位:万元),根据(1)中所求的回归方程,预测当x为何值时,小王销售一辆该型号汽车所获得的利润z最大?解(1)由表中数据得(2+4+6+8+10)=6,(16+13+9.5+7+4.5)=10,由最小二乘法求得=-1.45,=10-(-1.45)6=18.7,所以y关于x的回归直线方程为=-
19、1.45x+18.7.(2)根据题意,利润函数为z=y-w=(-1.45x+18.7)-(0.05x2-1.75x+17.2)=-0.05x2+0.3x+1.5,所以当x=-=3时,二次函数z取得最大值;即预测当x=3时,小王销售一辆该型号汽车所获得的利润z最大.22.(本小题满分12分)对某班学生是爱好体育还是爱好文娱进行调查,根据调查得到的数据,所绘制的条形图如下图所示.(1)根据图中数据,制作22列联表;(2)若要采用分层抽样的方法从男生中共抽取5名候选人,再从5人中选两人分别做文体活动协调人,求选出的两人恰好是一人爱好文娱,另一人爱好体育的学生的概率;(3)能否在犯错误的概率不超过0.10的前提下认为性别与是否爱好体育有关系?解(1)根据图中数据,作出22列联表:爱好体育爱好文娱总计男生151025女生51015总计202040(2)要采用分层抽样的方法从男生中共抽取5名候选人,得到5人中有3人爱好体育,2人爱好文娱,再从5人中选两人分别做文体活动协调人,恰好是一人爱好文娱,另一人爱好体育的概率是P=.(3)K2=2.666 72.706,所以在犯错误的概率不超过0.10的前提下不能判断性别与是否爱好体育有关系.