1、第二章统计(A)(时间:120分钟满分:150分)一、选择题(本大题共12小题,每小题5分,共60分)1从某年级1 000名学生中抽取125名学生进行体重的统计分析,就这个问题来说,下列说法正确的是()A1 000名学生是总体B每个被抽查的学生是个体C抽查的125名学生的体重是一个样本D抽取的125名学生的体重是样本容量2由小到大排列的一组数据x1,x2,x3,x4,x5,其中每个数据都小于1,那么对于样本1,x1,x2,x3,x4,x5的中位数可以表示为()A.(1x2) B.(x2x1)C.(1x5) D.(x3x4)3某单位有老年人27人,中年人54人,青年人81人,为了调查他们的身体状
2、况的某项指标,需从他们中间抽取一个容量为36的样本,则老年人、中年人、青年人分别应抽取的人数是()A7,11,19 B6,12,18C6,13,17 D7,12,174对变量x,y有观测数据(xi,yi)(i1,2,10),得散点图1;对变量u,v有观测数据(ui,vi)(i1,2,10),得散点图2.由这两个散点图可以判断()A变量x与y正相关,u与v正相关B变量x与y正相关,u与v负相关C变量x与y负相关,u与v正相关D变量x与y负相关,u与v负相关5已知一组数据x1,x2,x3,x4,x5的平均数是2,方差是,那么另一组数3x12,3x22,3x32,3x42,3x52的平均数,方差分别
3、是()A2, B2,1C4, D4,36某学院有4个饲养房,分别养有18,54,24,48只白鼠供实验用某项实验需抽取24只白鼠,你认为最合适的抽样方法是()A在每个饲养房各抽取6只B把所有白鼠都加上编有不同号码的颈圈,用随机抽样法确定24只C从4个饲养房分别抽取3,9,4,8只D先确定这4个饲养房应分别抽取3,9,4,8只,再由各饲养房自己加号码颈圈,用简单随机抽样的方法确定7下列有关线性回归的说法,不正确的是()A相关关系的两个变量不一定是因果关系B散点图能直观地反映数据的相关程度C回归直线最能代表线性相关的两个变量之间的关系D任一组数据都有回归直线方程8已知施肥量与水稻产量之间的回归直线
4、方程为 4.75x257,则施肥量x30时,对产量y的估计值为()A398.5 B399.5C400 D400.59在发生某公共卫生事件期间,有专业机构认为该事件在一段时间内没有发生大规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是()A甲地:总体均值为3,中位数为4B乙地:总体均值为1,总体方差大于0C丙地:中位数为2,众数为3D丁地:总体均值为2,总体方差为310某高中在校学生2 000人,高一与高二人数相同并都比高三多1人为了响应“阳光体育运动”号召,学校举行了“元旦”跑步和登山比赛活动每人都参加而且只参与
5、了其中一项比赛,各年级参与比赛人数情况如下表:高一高二高三跑步abc登山xyz其中abc235,全校参与登山的人数占总人数的.为了了解学生对本次活动的满意程度,从中抽取一个200人的样本进行调查,则高二参与跑步的学生中应抽取()A36人 B60人C24人 D30人11某赛季,甲、乙两名篮球运动员都参加了11场比赛,他们所有比赛得分的情况用如右图所示的茎叶图表示,则甲、乙两名运动员得分的中位数分别为()A19,13 B13,19C20,18 D18,2012从一堆苹果中任取了20个,并得到它们的质量(单位:克)数据分布表如下:分组90,100)100,110)110,120)120,130)13
6、0,140)140,150频数1231031则这堆苹果中,质量不小于120克的苹果数约占苹果总数的()A30% B70%C60% D50%题号123456789101112答案二、填空题(本大题共4小题,每小题5分,共20分)13甲、乙、丙、丁四名射击手在选拔赛中的平均环数及其标准差s如下表所示,则选送决赛的最佳人选应是_甲乙丙丁7887s2.52.52.8314.一组数据23,27,20,18,x,12,它们的中位数是21,即x是_15某市居民20052009年家庭年平均收入x(单位:万元)与年平均支出Y(单位:万元)的统计资料如下表所示:年份20052006200720082009收入x1
7、1.512.11313.315支出Y6.88.89.81012根据统计资料,居民家庭年平均收入的中位数是_,家庭年平均收入与年平均支出有_线性相关关系16某单位为了了解用电量y度与气温x之间的关系,随机统计了某4天的用电量与当天气温.气温()141286用电量(度)22263438由表中数据得回归直线方程 x 中 2,据此预测当气温为5时,用电量的度数约为_三、解答题(本大题共6小题,共70分)17(10分)一批产品中,有一级品100个,二级品60个,三级品40个,用分层抽样的方法,从这批产品中抽取一个容量为20的样本,写出抽样过程18(12分)为了了解学生的体能情况,某校抽取部分学生进行一分
8、钟跳绳次数测试,所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小长方形面积之比为24171593,第二小组频数为12.(1)学生跳绳次数的中位数落在哪个小组内?(2)第二小组的频率是多少?样本容量是多少?(3)若次数在110以上(含110次)为良好,试估计该学校全体高一学生的良好率是多少?19(12分)为了研究三月下旬的平均气温(x)与四月棉花害虫化蛹高峰日(y)的关系,某地区观察了2003年至2008年的情况,得到下面数据:年份200320042005200620072008x()24.429.632.928.730.328.9y19611018已知x与y之间具有线性相关关系
9、,据气象预测该地区在2010年三月下旬平均气温为27,试估计2010年四月化蛹高峰日为哪天?20(12分)下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据.x3456y2.5344.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y关于x的回归直线方程 x ;(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤试根据(2)求出回归直线方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?(参考数值:32.5435464.566.5)21(12分)农科院的专家为了了解新培育的甲、乙两种麦苗的
10、长势情况,从甲、乙两种麦苗的试验田中各抽取6株麦苗测量麦苗的株高,数据如下:(单位:cm)甲:9,10,11,12,10,20乙:8,14,13,10,12,21.(1)在右面给出的方框内绘出所抽取的甲、乙两种麦苗株高的茎叶图;(2)分别计算所抽取的甲、乙两种麦苗株高的平均数与方差,并由此判断甲、乙两种麦苗的长势情况22(12分)从高三抽出50名学生参加数学竞赛,由成绩得到如下的频率分布直方图试利用频率分布直方图求:(1)这50名学生成绩的众数与中位数(2)这50名学生的平均成绩第二章统计(A)1C在初中学过:“在统计中,所有考察对象的全体叫做总体,其中每一个所要考察的对象叫做个体,从总体中抽
11、取的一部分个体叫做总体的一个样本,样本中个体的数目叫做样本容量”因此题中所指的对象应是体重,故A、B错误,样本容量应为125,故D错误2C由题意把样本从小到大排序为x1,x3,x5,1,x4,x2,因此得中位数为(1x5)3B因275481123,366,3612,3618.4C由点的分布知x与y负相关,u与v正相关5D因为数据x1,x2,x3,x4,x5的平均数是2,方差是,所以2, (xi2)2,因此数据3x12,3x22,3x32,3x42,3x52的平均数为: (3xi2)3xi24,方差为: (3xi2)2 (3xi6)29 (xi2)293.6D因为这24只白鼠要从4个饲养房中抽取
12、,因此要用分层抽样决定各个饲养房应抽取的只数,再用简单随机抽样法从各个饲养房选出所需白鼠C虽然用了分层抽样,但在每个层中没有考虑到个体的差异,也就是说在各个饲养房中抽取样本时,没有表明是否具有随机性,故选D.7D根据两个变量具有相关关系的概念,可知A正确,散点图能直观地描述呈相关关系的两个变量的相关程度,且回归直线最能代表它们之间的相关关系,所以B、C正确只有线性相关的数据才有回归直线方程,所以D不正确8B成线性相关关系的两个变量可以通过回归直线方程进行预测,本题中当x30时, 4.7530257399.5.9D由于甲地总体均值为3,中位数为4,即中间两个数(第5、6天)人数的平均数为4,因此
13、后面的人数可以大于7,故甲地不符合乙地中总体均值为1,因此这10天的感染人数总和为10,又由于方差大于0,故这10天中不可能每天都是1,可以有一天大于7,故乙地不符合丙地中中位数为2,众数为3,3出现的最多,并且可以出现8,故丙地不符合故丁地符合10A由题意知高一、高二、高三的人数分别为667,667,666.设a2k,b3k,c5k,则abc2 000,即k120.b3120360.又2 000人中抽取200人的样本,即每10人中抽取一人,则360人中应抽取36人,故选A.11A分别将甲、乙两名运动员的得分从小到大排列,中间位置的分数则为中位数12B由数据分布表可知,质量不小于120克的苹果
14、有103114(个),占苹果总数的100%70%.13乙解析平均数反映平均水平大小,标准差表明稳定性标准差越小,稳定性越好14221513正1640解析(141286)10,(22263438)30, 3021050.当x5时, 255040.17解分层抽样方法:先将总体按其级别分为三层,一级品有100个,产品按00,01,99编号,二级品有60个,产品按00,01,59编号,三级品有40个,产品按00,01,39编号因总体个数样本容量为101,故用简单随机抽样的方法,在一级品中抽10个,二级品中抽6个,三级品中抽4个这样就可得到一个容量为20的样本18解(1)前三组的频率和为,中位数落在第四
15、小组内(2)频率为:0.08,又频率,样本容量150.(3)由图可估计所求良好率约为:100%88%.19解由题意知:29.13,7.5,x5 130.92,xiyi1 222.6, 2.2, 71.6,回归方程为 2.2x71.6.当x27时, 2.22771.612.2,据此,可估计该地区2010年4月12日或13日为化蛹高峰日20解(1)散点图如下:(2)4.5,3.5,xiyi32.5435464.566.5,x3242526286,0.7, 3.50.74.50.35. 0.7x0.35.所求的回归直线方程为 0.7x0.35.(3)现在生产100吨甲产品用煤 0.71000.357
16、0.35,9070.3519.65.生产能耗比技改前降低约19.65吨标准煤21解(1)茎叶图如图所示:(2)甲12,乙13,s(912)2(1012)2(1112)2(1212)2(1012)2(2012)213.67,s(813)2(1413)2(1313)2(1013)2(1213)2(2113)216.67.因为甲乙,所以乙种麦苗平均株高较高,又因为s0.5,中位数应位于第四个小矩形内设其底边为x,高为0.03,令0.03x0.2得x6.7,故中位数约为706.776.7.(2)样本平均值应是频率分布直方图的“重心”,即所有数据的平均值,取每个小矩形底边的中点值乘以每个小矩形的面积即可平均成绩为45(0.00410)55(0.00610)65(0.0210)75(0.0310)85(0.02110)95(0.01610)74.