1、单元评估验收(一)(时间:120分钟满分:150分)一、选择题(本大题共12小题,每小题5分,共60分,在每小题给出的四个选项中,只有一项是符合题目要求的)1下列说法中正确的是()A相关关系是一种不确定的关系,回归分析是对相关关系的分析,因此没有实际意义B独立性检验对分类变量关系的研究没有100%的把握,所以独立性检验研究的结果在实际中也没有多大的实际意义C相关关系可以对变量的发展趋势进行预报,这种预报可能会是错误的D独立性检验如果得出的结论有99%的可信度,就意味着这个结论一定是正确的解析:相关关系虽然是一种不确定关系,但是回归分析可以在某种程度上对变量的发展趋势进行预报,这种预报在尽量减小
2、误差的条件下可以对生产与生活起到一定的指导作用,独立性检验对分类变量的检验也是不确定的,但是其结果也有一定的实际意义,故选C.答案:C2对于回归直线方程x,下列说法中不正确的是()A直线必经过点(,)Bx增加1个单位时,y平均增加个单位C样本数据中x0时,可能有yD样本数据中x0时,一定有y解析:回归直线方程是根据样本数据得到的一个近似曲线,故由它得到的值也是一个近似值答案:D3某市政府在调查市民收入增减与旅游愿望的关系时,采用独立性检验法抽查了3 000人,计算发现K2的观测值k6.023,根据这一数据查阅表,市政府关于“市民收入增减与旅游愿望有关系”这一断言犯错误的概率不超过()P(K2k
3、0)0.500.400.250.150.100.050.0250.0100.0050.001k00.4550.7081.3232.0722.7063.8415.0246.6357.87910.828A.0.1B0.05C0.025 D0.005解析:因为K2的观测值k6.0235.024,对应犯错误概率的临界值为0.025,所以这一断言犯错误的概率不超过0.025.答案:C4在一线性回归模型中,计算其相关指数R20.96,下面哪种说法不够妥当()A该线性回归方程的拟合效果较好B解释变量对于预报变量变化的贡献率约为96%C随机误差对预报变量的影响约占4%D有96%的样本点在回归直线上解析:由相关
4、指数R2表示的意义可知A、B、C三种说法都很妥当,相关指数R20.96,其值较大,说明残差平方和较小,绝大部分样本点分布在回归直线附近,不一定有96%的样本点在回归直线上答案:D5下列是x与y之间的一组数据x0123y1357则y关于x的回归方程x,对应的直线必过点()A. B.C(2,2) D(1,2)解析:因为为样本点的中心,故一定在回归直线上答案:A6已知线性回归方程2x相应于点(3,6.5)的残差为0.1,则的值为()A0.5 B0.6C0.5 D0.6解析:因为相应于点(3,6.5)的残差为0.1,所以6.560.1,解得0.6.答案:B7某市政府在调查市民收入增减与旅游愿望的关系时
5、,采用独立性检验法抽查了3 000人,计算发现K2的观测值k6.023,根据这一数据查阅表,市政府断言“市民收入增减与旅游愿望有关系”这一断言犯错误的概率不超过()P(K2k0)0.500.400.250.150.100.050.0250.0100.0050.001k00.4550.7081.3232.0722.7063.8415.0246.6357.87910.828A. 0.1 B0.05C0.025 D0.005解析:因为K2的观测值k6.0235.024,对应犯错误概率的临界值为0.025,所以这一断言犯错误的概率不超过0.025.答案:C8考察棉花种子经过处理跟生病之间的关系得到如表
6、数据:项目种子处理种子未处理总计得病32101133不得病61213274总计93314407根据以上数据,则()A种子经过处理跟是否生病有关B种子经过处理跟是否生病无关C种子是否经过处理决定是否生病D以上都是错误的解析:计算与可知相差很小,故选B.答案:B9根据如下所示的列联表得到如下四个判断:在犯错误的概率不超过0.001的前提下认为患肝病与嗜酒有关;在犯错误的概率不超过0.01的前提下认为患肝病与嗜酒有关;认为患肝病与嗜酒有关的出错的可能为0.001%;没有证据显示患肝病与嗜酒有关分类嗜酒不嗜酒总计患肝病7 775427 817未患肝病2 099492 148总计9 874919 965
7、其中正确命题的个数为()A1 B2C3 D4解析:由列联表可求K2的观测值k56.632由56.63210.8286.635.且P(K210.828)0.001,P(K26.635)0.010.,均正确答案:B10某产品的广告费用x与销售额y的统计数据如下表:广告费用x/万元4235销售额y/万元49263954根据上表可得回归方程x中的为9.4,据此模型预报广告费用为6万元时销售额为()A63.6万元 B65.5万元C67.7万元 D72.0万元解析:3.5,42,因为429.43.59.1,所以回归方程为9.4x9.1,所以当x6时,9.469.165.5.答案:B11两个分类变量X和Y,
8、它们的取值分别为x1,x2和y1,y2,其样本频数分别是a10,b21,cd35.若X与Y有关系的可信程度不小于97.5%,则c等于()A3 B4C5 D6解析:列22列联表如下:项目x1x2总计y1102131y2cd35总计10c21d66故K2的观测值k5.024.把选项A,B,C,D代入验证可知c3.答案:A12.以下关于线性回归的判断,正确的个数是()若散点图中所有点都在一条直线附近,则这条直线为回归直线;散点图中的绝大多数都线性相关,个别特殊点不影响线性回归,如图中的A,B,C点;已知直线方程为0.50x0.81,则x25时,y的估计值为11.69;回归直线方程的意义是它反映了样本
9、整体的变化趋势A0 B1C2 D3解析:能使所有数据点都在它附近的直线不止一条,而据回归直线的定义知,只有按最小二乘法求得回归系数,得到的直线x才是回归直线,所以不对;正确;将x25代入0.50x0.81,得11.69,所以正确;正确答案:D二、填空题(本大题共4小题,每小题5分,共20分把答案填在题中的横线上)13已知下表所示数据的回归直线方程为4x242,则实数a_x23456y251254257a266解析:由题意,得4,(1 028a),代入4x242,可得(1 028a)44242,解得a262.答案:26214某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验
10、根据收集到的数据(如表),由最小二乘法求得回归方程0.67x54.9.零件数x(个)1020304050加工时间y(min)62758189现发现表中有一个数据看不清,请你推断出该数据的值为_解析:由表格知30,得0.673054.975.设表中的“模糊数字”为a.则a62758189755a68.答案:6815若两个分类变量x与y的22列联表为:y1y2总计x1101525x2401656总计503181则“X与Y之间有关系”这个结论出错的概率为_解析:由列联表数据,可求得随机变量K2的观测值k7.2276.635.因为P(K26.635)0.01,所以“x与y之间有关系”出错的概率为0.0
11、1.答案:0.0116已知具有相关关系的两个随机变量的一组观测数据的散点图分布在函数y3e2x1的图象附近,则可通过转换得到的线性回归方程为_解析:由y3e2x1,得ln yln(3e2x1),即ln yln 32x1.令uln y,则线性回归方程为u1ln 32x.答案:u1ln 32x(其中uln y)三、解答题(本大题共6小题,共70分解答时应写出必要的文字说明、证明过程或演算步骤)17(本小题满分10分)某电视台联合报社对“男女同龄退休”这一公众关注的问题进行了民意调查,数据如下表所示:项目赞同反对总计男198217415女476109585总计6743261 000根据表中数据,能否
12、在犯错误的概率不超过0.001的前提下认为对这一问题的看法与性别有关系?P(K210.828)0.001解:假设对“男女同龄退休”这一问题的看法与性别无关,由列联表中的数据,可以得到,K2的观测值k125.16110.828,又P(K210.828)0.001,故能在犯错误的概率不超过0.001的前提下认为对“男女同龄退休”这一问题的看法与性别有关18(本小题满分12分)已知某书店共有韩寒的图书6种,其中价格为25元的有2种,18元的有3种,16元的有1种书店若把这6种韩寒的图书打包出售,据统计每套的售价与每天的销售数量如下表所示:售价x/元105108110112销售数量y/套4030251
13、5(1)根据上表,利用最小二乘法得到回归直线方程3.46x,求;(2)若售价为100元,则每天销售的套数约为多少(结果保留到整数)?解:(1)由题目中的数据可得,108.75,27.5,则27.5(3.46)108.75403.775.(2)由(1)知3.46x403.775,当x100时,3.46100403.77558,故售价为100元时,每天大约可以销售58套图书19(本小题满分12分)有两个分类变量X和Y的取值分别为x1,x2,y1,y2,其22列联表为:分类y1y2x1a20ax215a30a其中a,15a均为大于5的整数,则a取何值时,在犯错误的概率不超过0.1的前提下认为X与Y之
14、间有关系?解:查表可知,要使在犯错误的概率不超过0.1的前提下认为X与Y之间有关系,则k2.706,而K2的观测值为k,由k2.706,得a7.19或a5且15a5,aZ,即a8或a9.故a为8或9时,在犯错误的概率不超过0.1的前提下认为X与Y之间有关系20(本小题满分12分)以下资料是一位销售经理收集到的每年销售额y(千元)和销售经验x(年)的关系:销售经验x/年13446810101113年销售额y/千元809792102103111119123117136(1)依据这些数据画出散点图并作直线784.2x,计算(2)依据这些数据求回归直线方程并据此计算;(3)比较(1) (2)中的残差平
15、方和的大小.解:(1)散点图与直线=78+4.2x的图形如图,,对x1,3,13,有i82.2,90.6,94.8,94.8,103.2,111.6,120,120,124.2,132.6, (yii)2179.28.(2)142,4,1087480,故804x,对x1,3,13,有84,92,96,96,104,112,120,120,124,132,(yii)2较小21(本小题满分12分)有甲、乙两个班进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩后,得到如下列联表分类优秀非优秀总计甲班10乙班30总计105已知在全部105人中随机抽取1人为优秀的概率为.(1)请完成上
16、面的列联表(2)根据列联表中的数据,能否在犯错误的概率不超过0.05的前提下认为“成绩与班级有关系”(3)若按下面的方法从甲班优秀的学生中抽取一人:把甲班10名优秀的学生按2到11进行编号,先后两次抛掷一枚质地均匀的骰子,出现的点数之和为被抽取的序号试求抽到6号或10号的概率参考公式:K2,其中nabcd.附表:P(K2k0)0.150.100.050.0250.010k02.0722.7063.8415.0246.635解:(1)完成列联表如下表所示分类优秀非优秀总计甲班104555乙班203050总计3075105(2)根据列联表中的数据,得到k6.109.因为6.1093.841,因此在
17、犯错误的概率不超过0.05的前提下认为“成绩与班级有关系”(3)设“抽到6号或10号”为事件A,先后两次抛掷一枚质地均匀的骰子,出现的点数为(x,y)所有的基本事件有(1,1),(1,2),(1,3),(6,6),共36个事件A包含的基本事件有:(1,5),(2,4),(3,3),(4,2),(5,1),(4,6),(5,5),(6,4),共8个所以P(A).22(本小题满分12分)(2017全国卷)为了监控某种零件的一条生产线的生产过程,检验员每隔30 min从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm)下面是检验员在一天内依次抽取的16个零件的尺寸:抽取顺序12345678零件尺
18、寸9.9510.129.969.9610.019.929.9810.04抽取次序910111213141516零件尺寸10.269.9110.1310.029.2210.0410.059.95经计算得i9.97,s 0.212, 2.78,其中xi为抽取的第i个零件的尺寸,i1,2,16.(1)求(xi,i)(i1,2,16)的相关系数r,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若|r|0.25,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小)(2)一天内抽检零件中,如果出现了尺寸在(3s,3s)之外的零件,就认为这条生产线在这一天的生产过程可能出
19、现了异常情况,需对当天的生产过程进行检查从这一天抽检的结果看,是否需对当天的生产过程进行检查?在(3s,3s)之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差(精确到0.01)附:样本(xi,yi)(i1,2,16)的相关系数r,0.09.解:(1)因为1,2,3,16的平均数为8.5,所以样本(xi,i)(i1,2,16)的相关系数r0.178,所以|r|0.1780.25,所以可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(2)3s9.9730.2129.334,3s9.9730.21210.606,第13个零件的尺寸为9.22,9.229.334,所以从这一天抽检的结果看,需对当天的生产过程进行检查剔除9.22,这条生产线当天生产的零件尺寸的均值为10.02,标准差s0.09.