1、统计、统计案例一、选择题1(2011年高考重庆卷)从一堆苹果中任取10只,称得它们的质量如下:12512012210513011411695120134则样本数据落在内的频率为()A0.2 B0.3C0.4 D0.5解析:选C.落在内的样本数据为120,122,116,120,共4个,故所求频率为0.4.2(2011年高考福建卷)某校选修乒乓球课程的学生中,高一年级有30名,高二年级有40名现用分层抽样的方法在这70名学生中抽取一个样本,已知在高一年级的学生中抽取了6名,则在高二年级的学生中应抽取的人数为()A6 B8C10 D12解析:选B.设样本容量为N,则N6,N14,高二年级所抽人数为
2、148.3(2011年山东临沂调研)某商场在五一促销活动中,对5月1日9时至14时的销售额进行统计,其频率分布直方图如图,已知9时至10时的销售额为2.5万元,则11时至12时的销售额为()A6万元 B8万元C10万元 D12万元解析:选C.由频率分布直方图可知,11时至12时的销售额占全部销售额的,即销售额为2510万元4(2011年高考陕西卷)设(x1,y1),(x2,y2),(xn,yn)是变量x和y的n个样本点,直线l是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论中正确的是()Ax和y的相关系数为直线l的斜率Bx和y的相关系数在0到1之间C当n为偶数时,分布在l两侧的
3、样本点的个数一定相同D直线l过点(,)解析:选D.因为相关系数是表示两个变量是否具有线性相关关系的一个值,它的绝对值越接近1,两个变量的线性相关程度越强,所以A、B错误C中n为偶数时,分布在l两侧的样本点的个数可以不相同,所以C错误根据回归直线方程一定经过样本中心点可知D正确所以选D.5已知一组正数x1,x2,x3,x4的方差为s2(xxxx16),则数据x12,x22,x32,x42的平均数为()A2 B3C4 D6解析:选C.设x1,x2,x3,x4的平均值为,则s2(x1)2(x2)2(x3)2(x4)2(xxxx42)4216.2,x12,x22,x32,x42的平均数为4.二、填空题
4、6.如图是某赛季甲、乙两名篮球运动员每场比赛得分的茎叶图,则甲、乙两人比赛得分的中位数之和是_解析:甲比赛得分的中位数为28,乙比赛得分的中位数为36,所以甲、乙两人比赛得分的中位数之和为283664.答案:647以下四个命题,其中正确的是_从匀速传递的产品生产流水线上,质检员每20分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;两个随机变量相关性越强,则相关系数的绝对值越接近于1;在回归直线方程0.2x12中,当解释变量x每增加一个单位时,预报变量平均增加0.2单位;对分类变量X与Y,它们的随机变量K2(2)的观测值k来说,k越小,“X与Y有关系”的把握程度越大解析:是系统抽样;
5、对于,随机变量K2(2)的观测值k越小,说明两个变量有关系的把握程度越小答案:8第二十届世界石油大会将于2011年12月4日8日在卡塔尔首都多哈举行,能源问题已经成为全球关注的焦点某工厂经过技术改造后,降低了能源消耗,经统计该厂某种产品的产量x(单位:吨)与相应的生产能耗y(单位:吨)有如下几组样本数据:x3456y2.5344.5根据相关性检验,这组样本数据具有线性相关关系,通过线性回归分析,求得回归直线的斜率为0.7.已知该产品的年产量为10吨,则该工厂每年大约消耗的汽油为_吨解析:由题知,4.5,3.5,故样本数据的中心点为A(4.5,3.5)设回归直线方程为y0.7xb,将中心点坐标代
6、入得: 3.50.74.5b,解得b0.35,故回归直线方程为y0.7x0.35,所以当x10时,y0.7100.357.35,即该工厂每年大约消耗的汽油为7.35吨答案:7.35三、解答题9某公司有一批专业技术人员,对他们进行年龄状况和接受教育程度(学历)的调查,其结果(人数分布)如下表:学历35岁以下3550岁50岁以上本科803020研究生x20y(1)用分层抽样的方法在3550岁年龄段的专业技术人员中抽取一个容量为5的样本,将该样本看成一个总体,从中任取2人,求至少有1人的学历为研究生的概率;(2)在这个公司的专业技术人员中按年龄状况用分层抽样的方法抽取N个人,其中35岁以下48人,5
7、0岁以上10人,再从这N个人中随机抽取出1人,此人的年龄为50岁以上的概率为,求x、y的值解:(1)用分层抽样的方法在3550岁中抽取一个容量为5的样本,设抽取学历为本科的人数为m,解得m3.抽取了学历为研究生的有2人,分别记作S1、S2;学历为本科的有3人,分别记作B1、B2、B3.从中任取2人的所有基本事件共10个:(S1,B1),(S1,B2),(S1,B3),(S2,B1),(S2,B2),(S2,B3),(S1,S2),(B1,B2),(B2,B3),(B1,B3)其中至少有1人的学历为研究生的基本事件有7个:(S1,B1),(S1,B2),(S1,B3),(S2,B1),(S2,B
8、2),(S2,B3),(S1,S2)从中任取2人,至少有1人的学历为研究生的概率为.(2)依题意得:,解得N78.3550岁中被抽取的人数为78481020.,x40,y5.10.某市教育行政部门为了对2011届高中毕业生学业水平进行评价,从该市高中毕业生中抽取1000名学生学业水平考试数学成绩为样本进行统计,已知该样本中的每个值都是40,100中的整数,且在40,50),50,60),60,70),70,80),80,90),90,100上的频率分布直方图如图所示记这1000名学生学业水平考试数学平均成绩的最小可能值为a,最大可能值为B.(1)求a,b的值;(2)从这1000名学生中任取1人
9、,试根据直方图估计其成绩位于a,b中的概率(假设各小组数据平均分布在相应区间内的所有整数上)解:(1)a0.05400.1500.25600.35700.15800.19067.5,b0.05490.1590.25690.35790.15890.110076.6.(2)由于分数是整数,故成绩为68,69的频率是0.25,成绩为70,71,76的频率为0.35,故成绩在a,b上的频率是0.250.350.295,以样本的这个频率估计总体分布的概率得出,从这1000名学生中任取1人,根据直方图估计其成绩位于a,b中的概率为0.295.11(2011年福建质检)某中学将100名高一新生分成水平相同的
10、甲、乙两个“平行班”,每班50人陈老师采用A、B两种不同的教学方式分别在甲、乙两个班级进行教改实验为了了解教学效果,期末考试后,陈老师分别从两个班级中各随机抽取20名学生的成绩进行统计,作出茎叶图如下记成绩不低于90分为“成绩优秀”(1)在乙班样本的20个个体中,从不低于86分的成绩中随机抽取2个,求抽出的两个均“成绩优秀”的概率;(2)由以上统计数据填写下面列联表,并判断是否有90%的把握认为:“成绩优秀”与教学方式有关解:(1)设“抽出的两个均成绩优秀”为事件A.从不低于86分的成绩中随机抽取2个的基本事件为(86,93),(86,96),(86,97),(86,99),(86,99),(
11、93,96),(93,97),(93,99),(93,99),(96,97),(96,99),(96,99),(97,99),(97,99),(99,99),共15个而事件A包含基本事件:(93,96),(93,97),(93,99),(93,99),(96,97),(96,99),(96,99),(97,99),(97,99),(99,99),共10个所以所求概率为P(A).(2)由已知数据得甲班(A方式)乙班(B方式)总计成绩优秀156成绩不优秀191534总计202040根据列联表中数据,得K2(2)3.137,由于3.1372.706,所以有90%的把握认为“成绩优秀”与教学方式有关高考资源网()来源:高考资源网版权所有:高考资源网(www.k s 5 )版权所有:高考资源网()版权所有:高考资源网()高考资源网()来源:高考资源网版权所有:高考资源网(www.k s 5 )版权所有:高考资源网()版权所有:高考资源网()