1、第九章 统计、统计案例(时间:120分钟满分:150分)一、 选择题(每小题5分,共60分)1. (2013湖南高考)某学校有男、女学生各500名,为了解男、女学生在学习兴趣与业余爱好方面是否存在显著差异,拟从全体学生中抽取100名学生进行调查,则宜采用的抽样方法是(D)A. 抽签法 B. 随机数法 C. 系统抽样法 D. 分层抽样法 由于被抽取的个体的属性具有明显差异,因此宜采用分层抽样法2. 设(x1,y1),(x2,y2),(xn,yn)是变量x和y的n个样本点,直线l是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论正确的是(C)A. x和y正相关B. x和y的相关系数为
2、直线l的斜率C. x和y的相关系数在1到0之间D. 当n为偶数时,分布在l两侧的样本点的个数一定相同 由图知,回归直线的斜率为负值,x与y是负相关,且相关系数在1到0之间,C正确3. 某商场有四类食品,其中粮食类、植物油类、动物性食品类及果蔬类分别有40种、10种、30种、20种,现从中抽取一个容量为20的样本进行食品安全检测若采用分层抽样的方法抽取样本,则抽取的植物油类与果蔬类食品种数之和是(C)A. 4 B. 5 C. 6 D. 7 四类食品的每一种被抽到的概率为,则植物油类和果蔬类食品被抽到的种数之和为(1020)6.4. 为了了解某校高三400名学生的数学学业水平测试成绩,制成样本的频
3、率分布直方图如下图所示规定不低于60分为及格,不低于80分为优秀,则及格率与优秀人数分别是(C)A. 60%,60 B. 60%,80 C. 80%,80 D. 80%,60 由频率分布直方图可知,及格率为(0.0250.0350.0100.010)1080%,优秀人数为(0.0100.010)1040080.5. (2013哈尔滨四校统考)甲、乙、丙、丁四人参加某运动会射击项目选拔赛,四人的平均成绩和方差如下表所示:甲乙丙丁平均环数x8.38.88.88.7方差s23.53.62.25.4从这四个人中选择一人参加该运动会射击项目比赛,最佳人选是(C)A. 甲 B. 乙C. 丙 D. 丁 由题
4、目表格中数据可知,丙平均环数最高,且方差最小,说明丙技术稳定,且成绩好,故选C.6. (2013江南十校联考)一次数学测验后,从甲、乙两班各抽取9名同学的成绩进行统计分析,绘成茎叶图如图所示据此估计两个班成绩的中位数的差的绝对值为(D)A. 8 B. 5C. 4 D. 2 甲、乙两班成绩按大小顺序排列,处在最中间的数分别为87,89,故它们之差的绝对值是2.7. (2013西宁模拟)已知一组数据:a1,a2,a3,a4,a5,a6,a7构成公差为d的等差数列,且这组数据的方差等于1,则公差d等于(B)A. B. C. D. 无法求解 这组数据的平均数为a4,这组数据的方差等于1,(a1a4)2
5、(a2a4)2(a3a4)2(a4a4)2(a5a4)2(a6a4)2(a7a4)21,即4d21,解得d.8. (2013衡阳联考)已知x与y之间的一组数据:x0123ym35.57已求得关于y与x的线性回归方程2.2x0.7,则m的值为(D)A. 1 B. 0.85C. 0.7 D. 0.5 回归直线必过样本中心点(1.5,y),故y4,m35.5716,得m0.5.9. (2013衢州一中期中)下图是样本容量为200的频率分布直方图根据样本的频率分布直方图估计,样本数据落在(2,14)内的概率约为(B)A. 0.24 B. 0.76 C. 0.12 D. 0.38 由频率分布直方图中长方
6、形的面积表示频率,知(2,14)中小长方形的面积为1(0.030.03)40.76.10. 2012年2月,国内某网站就“你认为皮纹测试即可测出孩子的潜能及发展方向是科学还是不科学”向广大中学生和大学生网民征集看法根据回收大学生50人与中学生50人的100份有效帖中,统计了不同年龄段的学生对“皮纹测试”的看法,把所得数据制成如下列联表:不科学科学合计大学生401050中学生203050合计6040100参考数据:P(K2k)0.150.100.050.0250.010k2.0722.7063.8415.0246.635则利用独立性检验,判断相信“认为皮纹测试是否科学与学生所处的阶段有关”的把握
7、是(D)A. 不超过90% B. 不超过92%C. 超过95% D. 超过99% K216.676.635,有超过99%的把握判断相信“认为皮纹测试是否科学与学生所处的阶段有关”11. 甲、乙两名同学在几次数学测试中,成绩统计用茎叶图表示如下,若甲、乙两人的平均成绩分别是x甲,x乙,则下列结论正确的是(A)A. x甲x乙,甲比乙成绩稳定 B. x甲x乙,乙比甲成绩稳定C. x甲x乙;再比较方差:甲的方差为(2)2(1)20212222,乙的方差为(5)2021212322,故甲比乙成绩稳定12. 近年,多家洋快餐企业爆出“老油门”事件(煎炸食品所用油长期不更新,从而导致过氧化值、酸值超标),令
8、世人震惊我国某研究机构为此开发了一种用来检测过氧化值、酸值是否超标的新试剂,把500组过氧化值、酸值超标的食品与另外500组上述未超标的食品作比较,提出假设H0:“这种试剂不能起到检测出过氧化值、酸值超标的作用”,并计算出P(K26.635)0.01.对此四名同学作出了以下判断:P:有99%的把握认为“这种试剂能起到检测出过氧化值、酸值超标的作用”;Q:随意抽出一组食品,它有99%的可能性是过氧化值、酸值超标;R:这种试剂能起到检测出过氧化值、酸值超标的作用的有效率为99%;S:这种试剂能起到检测出过氧化值、酸值超标的作用的有效率为1%.则上述判断正确的个数是(A)A. 1 B. 2 C. 3
9、 D. 4 本题中提出假设H0:“这种试剂不能起到检测出过氧化值、酸值超标的作用”,并计算出P(K26.635)0.01,在一定程度上,说明假设不合理,我们就有99%的把握拒绝假设,故易知P的判断正确,Q,R,S的判断错误二、 填空题(每小题5分,共20分)13. 面对竞争日益激烈的消费市场,众多商家不断扩大自己的销售市场,以降低生产成本某白酒酿造企业市场部对该企业9月份的产品销量x(千箱)与单位成本y(元)的资料进行线性回归分析,结果如下:x,y71,x79,xiyi1481,b1.8182,71(1.8182)77.36,则销量每增加1000箱,单位成本下降_1.8182_元 由题意可得线
10、性回归方程为1.8182x77.36,销量每增加1 000箱,则单位成本下降1.8182元14. 某企业三月中旬生产A,B,C三种产品共3 000件,根据分层抽样的结果,企业统计员制作了如下的统计表格:由于不小心,表格中A,C产品的有关数据已被污染看不清楚,统计员记得A产品的样本容量比C产品的样本容量多10,根据以上信息,可得C的产品数量是_800_件 由于B种产品共1 300件,分层抽样取了130件,即每个个体被抽到的概率为,而A,C两种产品共有1 700件,按分层抽样应共抽取1 700170(件),设C抽取了c件,则A抽取了(c10)件,则有cc10170,得c80,即C抽取了80件,而每
11、个个体被抽到的概率为,故C产品共有80800(件)15. 最近网络上流行一种“QQ农场游戏”,这种游戏通过虚拟软件模拟种植与收获的过程为了了解本班学生对此游戏的态度,高三(6)班计划在全班60人中展开调查,根据调查结果,班主任计划采用系统抽样的方法抽取若干名学生进行座谈,为此先对60名学生进行编号01,02,03,60,已知抽取的学生中最小的两个编号为03,09,则抽取的学生中最大的编号为_57_ 由最小的两个编号为03,09可知,抽样间距为6,因此抽取人数的比例为,即抽取10名同学,其编号构成首项为3,公差为6的等差数列,故最大编号为3(101)657.16. (2013武汉武昌联考)已知某
12、单位有40名职工,现要从中抽取5名职工,将全体职工随机按140编号,并按编号顺序平均分成5组按系统抽样方法在各组内抽取一个号码(1)若第1组抽出的号码为2,则所有被抽出职工的号码为_2,10,18,26,34_;(2)分别统计这5名职工的体重(单位:kg),获得体重数据的茎叶图如图所示,则该样本的方差为_62_ (1)由题意知被抽出职工的号码为2,10,18,26,34.(2)由题中茎叶图知5名职工体重的平均数x69,则该样本的方差s2(5969)2(6269)2(7069)2(7369)2(8169)262. 三、 解答题(共70分)17. (10分)某单位有2 000名职工,老年、中年、青
13、年分布在管理、技术开发、营销、生产各部门中,如下表所示:管理技术开发营销生产共计老年40404080200中年80120160240600青年401602807201 200共计1603204801 0402 000(1)若要抽取40人调查身体状况,则应怎样抽样?(2)若要开一个25人的讨论单位发展与薪金调整方面的座谈会,则应怎样抽选出席人?(3)若要抽20人调查对某运动会筹备情况的了解,则应怎样抽样? (1)用分层抽样,并按老年4人,中年12人,青年24人抽取(3分)(2)用分层抽样,并按管理2人,技术开发4人,营销6人,生产13人抽取(6分)(3)用系统抽样,对2 000人随机编号,号码从
14、00012000,每100号分为一组,从第一组中用随机抽样抽取一个号码,然后将这个号码分别加100,200,1 900,得到容量为20的样本(10分)18. (10分)甲、乙两位学生参加数学竞赛培训,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取8次,记录如下:甲:82,81,79,78,95,88,93,84;乙:92,95,80,75,83,80,90,85.(1)用茎叶图表示这两组数据;(2)现要从中选派一人参加数学竞赛,从统计学的角度(在平均数、方差或标准差中任意选两个)考虑,你认为选派哪位学生参加合适?请说明理由 (1)作出茎叶图如下:(5分)(2)派甲参赛比较合适理由如下:x
15、甲(70280490289124835)85,x乙(70180490350035025)85,(7分)s(7885)2(7985)2(8185)2(8285)2(8485)2(8885)2(9385)2(9585)235.5,s(7585)2(8085)2(8085)2(8385)2(8585)2(9085)2(9285)2(9585)241.x甲x乙,ss,甲的成绩比较稳定,派甲参赛比较合适(10分)19. (12分)某市2013年4月1日4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):61,76,70,56,81,91,92,91,75,81,88,67,101,103
16、,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45.(1)作出频率分布表;(2)作出频率分布直方图;(3)根据国家标准,污染指数在050之间时,空气质量为优;在51100之间时,为良;在101150之间时,为轻微污染;在151200之间时,为轻度污染请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价 (1)频率分布表如下:分组频数频率41,51)251,61)161,71)471,81)681,91)1091,101)5101,1112(4分)(2)频率分布直方图如下:(10分)(3)(答对下述两条中的一条即可)该市一个月中空气污染指数有
17、2天处于优的水平,占当月天数的.有26天处于良的水平,占当月天数的.处于优或良的天数共有28天,占当月天数的.说明该市空气质量基本良好;轻微污染有2天,占当月天数的.污染指数在80以上的接近轻微污染的天数有15天,加上处于轻微污染的天数,共有17天,占当月天数的,超过50%,说明该市空气质量有待进一步改善(12分)20. (12分)某学校为了了解学生的日平均睡眠时间(单位:h),随机选择了n名同学进行调查,下表是这n名同学的睡眠时间的频率分布表序号(i)分组(睡眠时间)频数(人数)频率14,5)60.1225,6)0.2036,7)a47,8)b58,90.08(1)求n的值若a20,将表中数
18、据补全,并画出频率分布直方图;(2)统计方法中,同一组数据常用该组区间的中点值(例如区间4,5)的中点值是4.5)作为代表若据此计算上述数据的平均值为6.52,求a,b的值,并由此估计该学校学生的日平均睡眠时间在7h以上的概率 (1)由频率分布表,可得n50.(1分)补全数据如下表:序号(i)分组(睡眠时间)频数(人数)频率14,5)60.1225,6)100.2036,7)200.4047,8)100.2058,940.08(3分)频率分布直方图如下:(6分)(2)由题意得解得a15,b15.(10分)设“该学校学生的日平均睡眠时间在7 h以上”为事件A,则P(A)0.38.故该学校学生的日
19、平均睡眠时间在7 h以上的概率约为0.38.(12分)21. (12分)(2013深圳调研)一次考试中,五名学生的数学、物理成绩如下表所示:学生A1A2A3A4A5数学x(分)8991939597物理y(分)8789899293(1)要从5名学生中选2人参加一项活动,求选中的学生中至少有一人的物理成绩高于90分的概率;(2)请在所给的直角坐标系中画出它们的散点图,并求这些数据的线性回归方程x.参考公式:回归直线方程bx,其中b,ybx. (1)从5名学生中任取2名学生的所有情况为(A4,A5),(A4,A1),(A4,A2),(A4,A3),(A5,A1),(A5,A2),(A5,A3),(A
20、1,A2),(A1,A3),(A2,A3),共10种情况(3分)其中至少有一人物理成绩高于90分的情况有:(A4,A5),(A4,A1),(A4,A2),(A4,A3),(A5,A1),(A5,A2),(A5,A3),共7种情况,故从5人中选2人,选中的学生中至少有一人的物理成绩高于90分的概率P.(5分)(2)散点图如图所示(6分)由表中数据可求得x93,y90,(8分) (xix)(yiy)30, (xix)2(4)2(2)202224240,b0.75,aybx20.25,(11分)故y关于x的线性回归方程是0.75x20.25.(12分)22. (14分)某高中从本校2013届高一新生
21、的中考数学成绩中随机抽取100名学生的成绩,按成绩分组:第1组75,90),第2组90,105),第3组105,120),第4组120,135),第5组135,150,得到的频率分布直方图如图所示(1)若成绩在90分(包括90分)至135分(不包括135分)为“常态”,120分以上(包括120分)为优秀,求“常态”率与“优秀”率;(2)若从这100名学生的成绩中用分层抽样法抽取20名学生的成绩,求第3、4、5组分别应抽的成绩份数;(3)为了调查这些学生是否喜爱数学与性别的关系,随机抽出20名学生作为样本,调查结果如下表所示:男女不喜爱25喜爱103用独立性检验的方法分析有多大的把握认为高一新生
22、喜爱数学与性别有关?参考公式和数据:K2.P(K2k)0.150.100.050.0250.0100.0050.001k2.072.713.845.026.647.8810.83 (1)90分(包括90分)至135分(不包括135分)为“常态”,“常态”率为1150.85.120分以上(包括120分)为“优秀”,“优秀”率为150.3.(5分)(2)第3组的成绩份数为1510030;第4组的成绩份数为1510020;第5组的成绩份数为1510010.从这100名学生的成绩中用分层抽样法抽取20名学生的成绩,则第3组应抽6份,第4组应抽4份,第5组应抽2份(9分)(3)K24.433.84.故有95%的把握认为高一新生喜爱数学与性别有关(14分)