1、新课标全国卷有关统计与概率的考查以 2 道客观题考查排列、组合、二项式定理、抽样方法、茎叶图、直方图、回归分析、独立检验、古典概率、条件概率和几何概率,以一道解答题的第 1 小问考查互斥事件,独立事件的概率计算,第 2 小问考查离散型随机变量的分布列和数学期望、方差,试题结构和题设情境有与有关数据分析和统计综合的趋势全卷统计与概率的考查分值比较稳定,近五年均为 22 分,试题难度属容易题和中档题,是考生的主要得分点之一第7讲 统计与统计案例1考题展望高考对这部分内容注重基础知识和基本方法的考查,要求考生理解数据处理的几种基本思想、方法和作用,并能运用所学知识、方法去解决实际问题,对独立检验、回
2、归分析的理论推导不作要求;命题时常以一道客观题考查抽样方法、频率分布直方图、茎叶图、用样本估计总体、变量间的相关关系、线性回归方程、回归分析和独立检验等考点中的一个或二个,试题难度中档偏易,同时将数据收集和处理渗透到解答题中,以其为载体,考查概率和离散型随机变量的分布列和数学期望2高考真题考题1(2013 全国)为了解某地区的中小学生视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已了解到该地区小学初中高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大,在下面的抽样方法中,最合理的抽样方法是()A简单随机抽样B按性别分层抽样C按学段分层抽样D系统抽样【解析】选 C.我们常
3、用的抽样方法有:简单随机抽样、分层抽样和系统抽样,而事先已经了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大了解某地区中小学生的视力情况,按学段分层抽样,这种方式具有代表性,比较合理【命题立意】本题主要考查三种抽样方法及其特征考题2(2014 全国)从某企业生产的某种产品中抽取500 件,测量这些产品的一项质量指标值,由测量结果得如图所示的频率分布直方图:(1)求这 500 件产品质量指标值的样本平均数 x 和样本方差 s2(同一组中的数据用该组区间的中点值作代表);(2)由直方图可以认为,这种产品的质量指标值 Z 服从正态分布 N(,2),其中 近似为样
4、本平均数,2 近似为样本方差 s2.利用该正态分布,求 P(187.8Z212.2);某用户从该企业购买了 100 件这种产品,记 X 表示这 100 件产品中质量指标值位于区间(187.8,212.2)的产品件数,利用的结果,求 E(X)附:15012.2.若 ZN(,2),则 P(Z)0.682 6,P(2Z2)0.954 4.x【解析】(1)抽取产品的质量指标值的样本平均数 x 和样本方差 s2 分别为 x1700.021800.091900.222000.332100.242200.082300.02200.s2(30)20.02(20)20.09(10)20.2200.331020.
5、242020.083020.02150.(2)由(1)知,ZN(200,150),从而 P(187.8Z212.2)P(20012.2Z0)是参数,则称 服从参数为,的正态分布,用N(,2)表示f(x)的图象称为正态曲线(2)正态分布的性质:1)f(x)0,即曲线在 x 轴上方;2)曲线 yf(x)是一条关于直线 x 对称,在 x 处取得最大值的连续的形曲线当 一定时,越大,曲线越“矮胖”,表示总体的分布越分散;反过来,越小,曲线越“瘦高”,表示总体的分布越集中,而且随机变量的取值集中在 附近4线性回归(1)两变量的线性相关变量与变量之间的关系常见的有两类:一类是确定性的函数关系;另一类是变量
6、间存在关系,但又不具备函数关系所要求的确定性,它们的关系带有随机性如果一个变量的值由小变大,另一个变量的值也由小变大,这种相关称为正相关;如果一个变量的值由小变大时,另一个变量的值由大变小,这种相关称为负相关(2)求线性回归方程的步骤第一步:先把数据制成表,从表中计算出第二步:计算回归方程的系数a,b,第三步:写出回归直线方程ybxa.5独立性检验22 列联表:列出的两个分类变量 X 和 Y,它们的取值分别为x1,x2和y1,y2的样本频率表称为 22 列联表.分类y1y2总计 x1ababx2cdcd总计acbdabcd 构造随机变量 K2n(adbc)2(ab)(cd)(ac)(bd)(其
7、中 nabcd)得到 K2 的观察值 k 常与以下几个临界值加以比较:如果 k2.706,就有 90%的把握认为两分类变量 X 和 Y有关系;如果 k3.841,就有 95%的把握认为两分类变量 X 和 Y有关系;如果 k2.706,就认为没有充分的证据说明变量 X 和 Y有关系1抽样方法及应用例1(1)现要完成下列 3 项抽样调查:从 10 盒酸奶中抽取 3 盒进行食品卫生检查科技报告厅有 32 排,每排有 40 个座位,有一次报告会恰好坐满了听众,报告会结束后,为了听取意见,需要请 32 名听众进行座谈高新中学共有 160 名教职工,其中一般教师 120 名,行政人员 16 名,后勤人员
8、24 名,为了了解教职工对学校在校务公开方面的意见,拟抽取一个容量为 20 的样本较为合理的抽样方法是()A简单随机抽样,系统抽样,分层抽样B简单随机抽样,分层抽样,系统抽样C系统抽样,简单随机抽样,分层抽样D分层抽样,系统抽样,简单随机抽样【解析】选 A.对于,个体没有差异且总数不多可用随机抽样法,是简单随机抽样;对于,将总体分成均衡的若干部分指的是将总体分段,在第 1 段内采用简单随机抽样确定一个起始编号,在此编号的基础上加上分段间隔的整数倍即为抽样编号,是系统抽样;对于,个体有明显的差异,所以选用分层抽样,故选 A.【点评】本小题考查抽样方法的应用,属基础题(2)用系统抽样法要从 160
9、名学生中抽取容量为 20的样本,将 160 名学生随机地从 1160 编号,按编号顺序平均分成 20 组(18 号,916 号,153160号),若第 16 组抽出的号码为 126,则第 1 组中用抽签的方法确定的号码是_【解析】6 设第 1 组抽取的号码为 b,则第 n 组抽取的号码为 8(n1)b,8(161)b126,b6,故第 1 组抽取的号码为 6.【点评】本小题考查系统抽样的操作方法,属基础题2正态分布例2设两个正态分布 N(1,21)(10)和N(2,22)(20)的密度函数图象如图所示,则有()A 1 2,1 2B 1 2C 1 2,1 2,1 2【解析】选 A.对应 1 的曲
10、线对称轴靠左边,知 12;又对应1 的曲线更陡峭一些,知 1s2乙可知乙的成绩较稳定,从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高【点评】数据收集和处理应结合题设情境,分析数据所具有的实际意义,然后应用统计方法对其进行处理,为解决实际问题服务数据收集和处理时,仔细阅读理解题意是关键4线性回归分析例4一商场对每天进店人数和商品销售件数进行了统计对比,得到如下表格:人数 xi10152025303540 件数 yi471215202327其中 i1,2,3,4,5,6,7.(1)以每天进店人数为横轴,每天商品销售件数为纵轴,画出散点图;(2
11、)求回归直线方程(结果保留到小数点后两位)(3)预测进店人数为 80 人时,商品销售的件数(结果保留整数)【解析】(1)散点图如图 【点评】线性回归方程的系数公式不要求记忆,但要会用公式求线性回归方程,要求会用线性回归方程及其算法思想 a yb x4.07,回归直线方程是y0.78x4.07.(3)进店人数为 80 人时,商品销售的件数 y0.78804.0758.5独立性检验例5某工厂有 25 周岁以上(含 25 周岁)的工人 300名,25 周岁以下的工人 200 名为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取了 100 名工人,先统计了他们某月的日平均生产件数,
12、然后按工人年龄在“25 周岁以上(含 25 周岁)”和“25 周岁以下”分为两组,再将两组工人的日平均生产件数分成 5 组:50,60),60,70),70,80),80,90),90,100分别加以统计,得到如下图所示的频率分布直方图(1)从样本中日平均生产件数不足 60 件的工人中随机抽取 2 名,求至少抽到一名“25 周岁以下组”的工人的概率(2)规定日平均生产件数不少于 80 件者为“生产能手”,请你根据已知条件完成 22 列联表,并判断是否有 90%以上的把握认为“生产能手与工人的年龄有关”?【解析】(1)由已知得,样本中 25 周岁以上的工人有 60 名,25 周岁以下的工人有 4
13、0 名,附表及公式:P(K2k)0.100 0.050 0.0100.001 k2.706 3.841 6.635 10.828K2n(adbc)2(ab)(cd)(ac)(bd)所以样本中日平均生产件数不足 60 件的工人中,25 周岁以上的工人有 600.053(名),记为 A1,A2,A3;25 周岁以下的工人有 400.052(名),记为 B1,B2.从中随机抽取 2 名工人,所有可能的结果为(A1,A2),(A1,A3),(A2,A3),(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2),共 10种 其中,至少抽到一名 25
14、 周岁以下的工人的可能的结果为(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2),共 7 种 故所求概率 P 710.(2)由频率分布直方图可知,在抽取的 100 名工人中,“25 周岁以上组”的生产能手有 600.2515(名),“25 周岁以下组”的生产能手有 400.37515(名),据此可得 22 列联表如下:生产能手非生产能手合计 25 周岁以上154560 25 周岁以下152540 合计3070100 所以 K2n(adbc)2(ab)(cd)(ac)(bd)100(15251545)26040307025141.79.
15、【点评】独立性检验仅限于 22 的列联表,收集数据是解题的关键同时计算 K2 的值后,认定可能性的百分率是 1P(K2k)的大小因为 1.79 x乙,s 甲s 乙B.x甲 x乙,s 甲s 乙C.x甲s 乙D.x甲 x乙,s 甲 x乙,s 甲s 乙5对于下列表格所示的五个散点,已知求得的线性回归直线方程为y0.8x155.x196197 200 203204 y1367m则实数 m 的值为()A8 B8.2C8.4 D8.5【解析】选 A.本题主要考查统计的相关知识,意在考查考生的运算求解能力依题意得 x15(196197200203204)200,y15(1367m)17m5,回归直线必经过样
16、本中心点(x,y),于是有17m50.8200155,由此解得 m8,选 A.6已知随机变量 服从正态分布 N(2,2),P(4)0.84,则 P(0)_【解析】0.16 P(0)P(4)10.840.16.7某校为了了解学生的课外阅读情况,随机抽查了 50 名学生,得到他们某一天各自课外阅读的时间数据如图所示,根据条形图可得到这 50 名学生该天每人的平均课外阅读时间为_h.【解析】0.9 平均课外阅读时间为(050.5201101.51025)500.9 h.8已知总体的各个体的值由小到大依次为 2,3,3,7,a,b,12,13.7,18.3,20,且总体的中位数为10.5,若要使该总体
17、的方差最小,则 a、b 的取值分别是_、_【解析】10.5 10.5 因为中位数为 10.5,故 ab21,平均数为 10,要使方差最小,只需(a10)2(b10)2 最小即可,故ab10.5.9某中学团委组织了“我对祖国知多少”的知识竞赛,从参加考试的学生中抽出 60 名学生,将其成绩(均为整数)分成六组40,50),50,60),90,100,其部分频率分布直方图如图所示观察图形,回答下列问题(1)求成绩在70,80)的频率,并补全这个频率分布直方图;(2)估计这次考试的及格率(60 分及以上为及格)和平均分;(计算时可以用组中值代替各组数据的平均值)(3)从成绩在40,50)和90,10
18、0的学生中选两人,求他们在同一分数段的概率【解析】(1)因为各组的频率和等于 1,故成绩在70,80)的 频 率 是 1 (0.025 0.0152 0.01 0.005)100.3.频率分布直方图如图所示:(2)依题意,60 分及以上的分数在60,70),70,80),80,90),90,100这四个组,其频率和为(0.0150.030.0250.005)100.75.所以估计这次考试的及格率是 75%.利用组中值估算学生成绩的平均分,则有 45 0.1 550.15 650.15 75 0.3 850.25950.0571.所以估计这次考试的平均分是 71 分(3)成绩在40,50)的人数是 600.16,成绩在90,100的人数是 600.053,所以从成绩在40,50)与90,100的学生中选两人,他们在同一分数段的概率是 P15336 12.10以下是在某地的旧房屋的销售价格 Y 和房屋的面积 x 的数据:房屋面积(m2)11511080135105 销售价格(万元)24.821.618.429.222(1)画出数据对应的散点图;(2)求线性回归方程,并在散点图中画出回归直线;(3)据(2)的结果估计当房屋面积为 150 m2 时的销售价格回归直线如图(3)据(2),当 x150 m2 时,销售价格的估计值为:y0.196 21501.814 231.244 2(万元)