1、第2章统计(A)(时间:120分钟满分:160分)一、填空题(本大题共14小题,每小题5分,共70分)1从某年级1 000名学生中抽取125名学生进行体重的统计分析,就这个问题来说,下列说法正确的是_1 000名学生是总体;每个被抽查的学生是个体;抽查的125名学生的体重是一个样本;抽取的125名学生的体重是样本容量2由小到大排列的一组数据x1,x2,x3,x4,x5,其中每个数据都小于1,那么对于样本1,x1,x2,x3,x4,x5的中位数可以表示为_3某单位有老年人27人,中年人54人,青年人81人,为了调查他们的身体状况的某项指标,需从他们中间抽取一个容量为36的样本,则老年人、中年人、
2、青年人分别应抽取的人数是_4已知一组数据x1,x2,x3,x4,x5的平均数是2,方差是,那么另一组数3x12,3x22,3x32,3x42,3x52的平均数,方差分别是_5某学院有4个饲养房,分别养有18,54,24,48只白鼠供实验用某项实验需抽取24只白鼠,你认为最合适的抽样方法是_在每个饲养房各抽取6只;把所有白鼠都加上编有不同号码的颈圈,用随机抽样法确定24只;从4个饲养房分别抽取3,9,4,8只;先确定这4个饲养房应分别抽取3,9,4,8只,再由各饲养房自己加号码颈圈,用简单随机抽样的方法确定6下列有关线性回归的说法,不正确的是_相关关系的两个变量不一定是因果关系;散点图能直观地反
3、映数据的相关程度;回归直线最能代表线性相关的两个变量之间的关系;任一组数据都有线性回归方程7已知施肥量与水稻产量之间的线性回归方程为 4.75x257,则施肥量x30时,对产量y的估计值为_8某高中在校学生2 000人,高一与高二人数相同并都比高三多1人为了响应“阳光体育运动”号召,学校举行了“元旦”跑步和登山比赛活动每人都参加而且只参与了其中一项比赛,各年级参与比赛人数情况如下表:高一高二高三跑步abc登山xyz其中abc235,全校参与登山的人数占总人数的.为了了解学生对本次活动的满意程度,从中抽取一个200人的样本进行调查,则高二参与跑步的学生中应抽取_人9某赛季,甲、乙两名篮球运动员都
4、参加了11场比赛,他们所有比赛得分的情况用如图所示的茎叶图表示,则甲、乙两名运动员得分的中位数分别为_10从一堆苹果中任取了20个,并得到它们的质量(单位:克)数据分布表如下:分组90,100)100,110)110,120)120,130)130,140)140,150频数1231031则这堆苹果中,质量不小于120克的苹果数约占苹果总数的_11甲、乙、丙、丁四名射击手在选拔赛中的平均环数及其标准差s如下表所示,则选送决赛的最佳人选应是_.甲乙丙丁7887s2.52.52.8312.一组数据23,27,20,18,x,12,它们的中位数是21,则x为_13某市居民20052009年家庭年平均
5、收入x(单位:万元)与年平均支出Y(单位:万元)的统计资料如下表所示:年份20052006200720082009收入x11.512.11313.315支出Y6.88.89.81012根据统计资料,居民家庭年平均收入的中位数是_,家庭年平均收入与年平均支出有_(填“正”或“负”)线性相关关系14某单位为了了解用电量y度与气温x之间的关系,随机统计了某4天的用电量与当天气温.气温()141286用电量(度)22263438由表中数据得线性回归方程 bxa中b2,据此预测当气温为5时,用电量的度数约为_二、解答题(本大题共6小题,共90分)15(14分)一批产品中,有一级品100个,二级品60个,
6、三级品40个,分别用系统抽样和分层抽样的方法,从这批产品中抽取一个容量为20的样本,写出抽样过程16(14分)为了了解学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为24171593,第二小组频数为12.(1)学生跳绳次数的中位数落在哪个小组内?(2)第二小组的频率是多少?样本容量是多少?(3)若次数在110以上(含110次)为良好,试估计该学校全体高一学生的良好率是多少?17(14分)为了研究三月下旬的平均气温(x)与四月棉花害虫化蛹高峰日(y)的关系,某地区观察了2003年至2008年的情况,得到下面数据:
7、年份200320042005200620072008x()24.429.632.928.730.328.9y19611018已知x与y之间具有线性相关关系,据气象预测该地区在2010年三月下旬平均气温为27,试估计2010年四月化蛹高峰日为哪天?18(16分)下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据.x3456y2.5344.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程 bxa;(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤试根据(2)求出线性回归方程,预测生
8、产100吨甲产品的生产能耗比技改前降低多少吨标准煤?(参考数值:32.5435464.566.5)19(16分)农科院的专家为了了解新培育的甲、乙两种麦苗的长势情况,从甲、乙两种麦苗的试验田中各抽取6株麦苗测量麦苗的株高,数据如下:(单位:cm)甲:9,10,11,12,10,20乙:8,14,13,10,12,21.(1)在右面给出的方框内绘出所抽取的甲、乙两种麦苗株高的茎叶图;(2)分别计算所抽取的甲、乙两种麦苗株高的平均数与方差,并由此判断甲、乙两种麦苗的长势情况20(16分)从高三抽出50名学生参加数学竞赛,由成绩得到如下的频率分布直方图试利用频率分布直方图求:(1)这50名学生成绩的
9、众数与中位数(2)这50名学生的平均成绩第2章统计(A)1解析在初中学过:“在统计中,所有考察对象的全体叫做总体,其中每一个所要考察的对象叫做个体,从总体中抽取的一部分个体叫做总体的一个样本,样本中个体的数目叫做样本容量”因此题中所指的对象应是体重,故、错误,样本容量应为125,故错误2.(1x5)解析由题意把样本从小到大排序为x1,x3,x5,1,x4,x2,因此得中位数为(1x5)36,12,18解析因275481123,366,3612,3618.44,3解析因为数据x1,x2,x3,x4,x5的平均数是2,方差是,所以2, (xi2)2,因此数据3x12,3x22,3x32,3x42,
10、3x52的平均数为: (3xi2)3xi24,方差为: (3xi2)2 (3xi6)29 (xi2)293.5解析因为这24只白鼠要从4个饲养房中抽取,因此要用分层抽样决定各个饲养房应抽取的只数,再用简单随机抽样法从各个饲养房选出所需白鼠虽然用了分层抽样,但在每个层中没有考虑到个体的差异,也就是说在各个饲养房中抽取样本时,没有表明是否具有随机性6解析根据两个变量具有相关关系的概念,可知正确,散点图能直观地描述呈相关关系的两个变量的相关程度,且回归直线最能代表它们之间的相关关系,所以、正确只有线性相关的数据才有线性回归方程,所以不正确7399.5解析成线性相关关系的两个变量可以通过线性回归方程进
11、行预测,本题中当x30时, 4.7530257399.5.836解析由题意知高一、高二、高三的人数分别为667,667,666.设a2k,b3k,c5k,则abc2 000,即k120.b3120360.又2 000人中抽取200人的样本,即每10人中抽取一人,则360人中应抽取36人919,13解析分别将甲、乙两名运动员的得分从小到大排列,中间位置的分数则为中位数1070%解析由数据分布表可知,质量不小于120克的苹果有103114(个),占苹果总数的100%70%.11乙解析平均数反映平均水平大小,标准差表明稳定性标准差越小,稳定性越好12221313正1440解析(141286)10,(
12、22263438)30,ab3021050.当x5时, 255040.15解(1)系统抽样方法:先将200个产品随机编号,001,002,200,再将200个产品按001010,011020,191200,分成20组,每组10个产品,在第1组内用简单随机抽样确定起始的个体编号,按事先确定的规则,从每组中分别抽取样本,这样就得到一个容量为20的样本(2)分层抽样方法:先将总体按其级别分为三层,一级品有100个,产品按00,01,99编号,二级品有60个,产品按00,01,59编号,三级品有40个,产品按00,01,39编号因总体个数样本容量为101,故用简单随机抽样的方法,在一级品中抽10个,二
13、级品中抽6个,三级品中抽4个这样就可得到一个容量为20的样本16解(1)前三组的频率和为,中位数落在第四小组内(2)频率为:0.08,又频率,样本容量150.(3)由图可估计所求良好率约为:100%88%.17解由题意知:29.13,7.5,x5 130.92,xiyi1 222.6,b2.2,ab71.6,回归方程为 2.2x71.6.当x27时, 2.22771.612.2,据此,可估计该地区2010年4月12日或13日为化蛹高峰日18解(1)散点图如下:(2)4.5,3.5,xiyi32.5435464.566.5,x3242526286,b0.7,ab3.50.74.50.35. 0.
14、7x0.35.所求的线性回归方程为 0.7x0.35.(3)现在生产100吨甲产品用煤y0.71000.3570.35,9070.3519.65.生产能耗比技改前降低约19.65吨标准煤19解(1)茎叶图如图所示:(2)甲12,乙13,s(912)2(1012)2(1112)2(1212)2(1012)2(2012)213.67,s(813)2(1413)2(1313)2(1013)2(1213)2(2113)216.67.因为甲乙,所以乙种麦苗平均株高较高,又因为s0.5,中位数应位于第四个小矩形内设其底边为x,高为0.03,令0.03x0.2得x6.7,故中位数约为706.776.7.(2)样本平均值应是频率分布直方图的“重心”,即所有数据的平均值,取每个小矩形底边的中点值乘以每个小矩形的面积即可平均成绩为45(0.00410)55(0.00610)65(0.0210)75(0.0310)85(0.02110)95(0.01610)74.