1、数学必修3(苏教版)某单位有老年人28人,中年人54人,青年人81人,为了调查他们的身体状况,从他们中抽取容量为36的样本,最适合抽取样本的方法是_解析:总体人数为285481163(人),样本容量为36.若按36163取样,无法得到整数解故考虑先剔除1人,抽样比变为3616229,则中年人取5412(人);青年人取8118(人);先从老年人中剔除1人,老年人取276(人)这样组成容量为36的样本答案:先从老年人中剔除1人,再用分层抽样规律总结:根据简单随机抽样、系统抽样、分层抽样三种抽样方法的共同点、适用范围和各自特点,恰当选取抽样方法在抽取样本时,要按照各种抽样方法的步骤进行三种抽样方法的
2、比较见下表:类别共同点相互联系适用范围各自特点简单随机抽样(1)抽样过程中每个个体被抽到的机会相等(2)抽样过程都是不放回抽样来源:学科网来源:Zxxk.Com来源:Z.xx.k.Com总体中的个数较少从总体中逐个抽取系统抽样来源:Zxxk.Com在起始部分抽样时采用简单随机抽样总体中的个数较多将总体均分成几部分,按事先确定的规则在各部分抽取分层抽样每层抽样时采用简单随机抽样或系统抽样总体由差异明显的几部分组成将总体分成几层,分层进行抽取变式训练1为调查小区平均每户居民的月用水量,下面是3名学生设计的方案:学生甲:我把这个用水量调查表放在互联网上,只要登录网站的人就可以看到这张表,他们填的表可
3、以很快地反馈到我的电脑中,这样就可以很快估算出小区平均每户居民的月用水量;学生乙:我给我们小区居民的每一个住户发一张用水调查表,只要一两天就可以统计出小区平均每户居民的月用水量;学生丙:我在小区的电话号码本上随机地选出一定数量的电话号码,然后逐个给这些住户打电话,问一下他们的月用水量,然后就可以估算出小区平均每户居民的月用水量请你分析上述3名学生设计的调查方案能够准确地获得小区平均每户居民的月用水量吗?为什么?你有何建议?解析:学生甲的方案得到的样本不能够反映不上网的居民的月用水量情况,其所得到的样本代表性差,不能很准确地获得小区平均每户居民的月用水量;学生乙的方案实际上是普查,花费的人力、物
4、力、时间更多一些,但是如果统计过程不出错,可以准确地得到小区平均每户居民的月用水量;学生丙的方案是一种随机抽样法,在所在小区的每户居民都装有电话的前提下,建议采用随机抽样法获得数据,即用学生丙的方案,既节省人力、物力、时间,又可以得到比较精确的结果有1个容量为100的样本,数据的分组及各组的频数如下:12.5,15.5)6,15.5,18.5)16,18.5,21.5)18,21.5,24.5)22,24.5,27.5)20,27.5,30.5)10,30.5,33.58.(1)列出样本的频率分布表(含累计频率);(2)画出频率分布直方图和累积频率分布图;(3)根据累积频率分布估计小于30的数
5、据约占多大百分比分析:按照画频率分布直方图的要求操作解析:(1)样本的频率分布表如下:分组频数频率累计频率12.515.560.060.0615.518.5160.160.2218.521.5180.180.4021.524.5220.220.6224.527.5200.200.8227.530.5100.100.9230.533.580.081.00合计1001.00(2)频率分布直方图如图(1)所示,累积频率分布图如图(2)所示(3)在累积频率分布图中找到横坐标为30的点,然后量出这个点的纵坐标约为0.90,这说明小于30的数据约占90%.规律总结:(1)频率分布表列出的是各个区间内取值的
6、频率;(2)频率分布直方图是用矩形的面积的大小来表示各个区间内取值的机会的,可直观地看出在各个区间内机会的差异用样本估计总体一般分两种:一种是用样本的频率分布估计总体的分布,另一种是用样本的数字特征(如平均数、方差等)估计总体的数字特征用样本频率分布估计总体的分布就是利用样本的频率分布表和频率分布直方图对总体情况做出估计,有时也利用频率分布折线图和茎叶图对总体估计直方图能够很容易地表示大量数据,非常直观地表明分布的形状,使我们能够看到分布表中看不清楚的数据模式,这样根据样本的频率分布我们可以大致估计出总体的分布,但是,当总体的个体数较多时,所需抽样的样本容量也不能太小,随着样本容量的增加,频率
7、分布折线图会越来越接近于一条光滑曲线,统计中称这条曲线为总体密度曲线,它能给我们提供更加精细的信息在样本数据较少时,用茎叶图表示;数据的效果较好,它不但可以保留所有信息,而且可以随时记录,这给数据的记录和表示都能带来方便变式训练2李老师为了分析期中数学考试情况,从全级1 500人中抽了50人,将分数分为5组,第一组到第三组的频数分别是10,23,11,第四组的频率是0.08,那么落在第五组90100分的频数是多少?频率是多少?全级学生分数在90100分的大约有多少人?解析:第四组的频数为0.08504,则第五组的频数为5010231142,频率为0.04,故全级分数在90100的约有0.041
8、 50060(人)甲、乙两种冬小麦试验品种连续5年的平均单位面积产量如下(单位:t/hm2):品种第1年第2年第3年第4年第5年甲9.89.910.11010.2乙9.410.310.89.79.8试根据这组数据估计哪一种小麦品种的产量比较稳定分析:与样本的稳定和波动有关的数字特征是方差只需计算方差即可解析:甲品种的样本平均数为10,样本方差为(9.810)2(9.910)2(10.110)2(1010)2(10.210)250.02,乙品种的样本平均数也为10,样本方差为(9.410)2(10.310)2(10.810)2(9.710)2(9.810)250.240.02.所以,由这组数据可
9、以认为甲种小麦的产量比较稳定规律总结:用样本数字特征估计总体的数字特征就是为了从整体上更好地把握总体的规律,我们还可以通过样本数据的众数、中位数、平均数和标准差等数字特征对总体的数字特征做出估计众数就是样本数据中出现最多的那个值;中位数就是把样本数据分成相同数目的两部分,其中一部分比这个数小,另一部分比这个数大的那个数;平均数就是所有样本数据的平均值;标准差是反映样本数据分散程度大小的最常用统计量,其计算公式如下:s.有时也用标准差的平方s2方差来代替标准差,实质一样变式训练3在一次歌手大奖赛上,七位评委为歌手打出的分数如下:9.4,8.4,9.4,9.9,9.6,9.4,9.7.现去掉一个最
10、高分和一个最低分后,所剩数据的平均值和方差分别为_,_解析:最高分是9.9,最低分是8.4,去掉后的数据为9.4,9.4,9.6,9.4,9.7,它们的平均数是:x9.5,方差为:s20.016.在10年期间,一城市居民的年收入与某种商品的销售额之间的关系有如下数据:第n年12345678910城市居民年收入x/亿元32.231.132.935.837.138.039.043.044.646.0某商品销售额y/万元25.030.034.037.039.041.042.044.048.051.0(1)画出散点图;(2)如果散点图中的各点大致分布在一条直线的附近,求y与x之间的回归直线方程分析:两
11、个随机变量是否具有线性相关关系有两种方法判断:一是从散点图中直观地看;二是看相关系数r,目前以第一种方法进行判断解析:(1)散点图如下图:(2)由(1)知城市居民的年收入与该商品的销售额之间存在着显著的线性相关关系列表:I12345678910xi32.331.132.935.837.138.039.043.044.646.0yi25.030.034.037.039.041.042.044.048.051.0xiyi8059331 118.61 324.61 446.91 5581 6381 8922 140.82 346x37.97,y39.1,x14 663.67,xiyi15 202.9
12、通过计算得:b1.447,aybx39.11.44737.9715.843,因此所求的回归直线方程是y1.447x15.843.规律总结:(1)分析两个变量的相关关系时,我们可根据样本数据散点图确定两个变量之间是否存在相关关系,还可利用最小二乘法求出回归直线方程把样本数据表示的点在直角坐标系中作出,构成的图叫散点图从散点图上,我们可以分析出两个变量是否存在相关关系如果这些点大致分布在通过散点图中心的一条直线附近,那么就说这两个变量之间具有线性相关关系,这条直线叫做回归直线,直线方程叫做回归直线方程(2)求回归直线方程的方法及步骤“表格”法的步骤:a先把数据制成表,从表中计算出,;b计算回归系数
13、a,b.公式为:c.写出回归直线方程y=bxa.利用工作表软件求法的步骤:调状态输入数据按键得结果写出所得方程(3)画样本频率分布直方图的步骤:求极差决定组距与组数分组列频率分布表画频率分布直方图变式训练4为了研究重量x(单位:克)对弹簧长度y(单位:厘米)的影响,对不同重量的6根弹簧进行测量,得如下数据:x51015202530y7.258.128.959.9010.911.8(1)画出散点图;(2)如果散点图中的各点大致分布在一条直线的附近,求y与x之间的线性回归方程解析:(1)画出散点图如下:(2)从散点图可知,两个变量之间有线性相关关系此题中,n6,计算可得xi105,xi22 275
14、,yi56.92,xiyi1 076.2,从而得x17.5,y9.487,计算得b0.183,a6.285.于是得到线性回归方程y6.2850.183x.5一台机器按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点零件的多少,随机器的运转速度而变化,下表为抽样试验的结果:转速x(转/秒)1614128每小时生产有缺点的零件数y(件)11985(1)画散点图;(2)如果y对x有线性相关关系,求回归方程;(3)若实际生产中,允许每小时生产的产品中有缺点的零件最多为10个,那么机器的运转速度应控制在什么范围内(保留1位小数)?解析:(1)散点图如下图所示:(2)由散点图可知,两变量之间具有线性相关关系,列表,计算:i1234xi1614128yi11985xiyi1761269640xi22561961446412.5,8.25,=660,xiyi438设所求回归方程为bxa,则由上表可得b,ab8.2512.5,回归方程为x.(3)由y10得x10,解得x14.9,所以机器的运转速度应控制在14.9转/秒内