1、第一章 统 计习题课 抽样方法、用样本估计总体 抽样方法 某公路设计院有工程师 6 人,技术员 12 人,技工 18 人,要从这些人中抽取 n 个人参加市里召开的科学技术大会如果采用系统抽样和分层抽样的方法抽取,不用剔除个体,如果参会人数增加 1 个,则在采用系统抽样时,需要在总体中先剔除1 个个体,求 n.解:总体容量为 6121836.当样本容量是 n 时,由题意知,系统抽样的间隔为36n,分层抽样的比例是 n36,抽取的工程师人数为 n366n6,技术员人数为 n3612n3,技工人数为 n3618n2,所以 n 应是 6 的倍数,36 的约数,即 n6,12,18.由条件增加 1 人时
2、知,只有 n6 符合(1)随机抽样各种方法中,每个个体被抽到的概率都是相等的(2)系统抽样又称“等距”抽样,被抽到的各个号码间隔相同;分层抽样满足:各层抽取的比例都等于样本容量在总体容量中的比例 1.(1)某中学有高中生 3 500 人,初中生 1 500 人,为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为 n 的样本,已知从高中生中抽取 70 人,则 n 为()A100 B150C200D250(2)从编号为 0,1,2,79 的 80 件产品中,采用系统抽样的方法抽取容量是 5 的样本,若编号为 28 的产品在样本中,则该样本中产品的最大编号为_解析:(1)法一:由题意可
3、得 70n703 5001 500,解得 n100,故选 A.法二:由题意,抽样比为 703 500 150,总体容量为 3 5001 5005 000,故 n5 000 150100.(2)根据系统抽样的特点,共有 80 件产品,抽取 5 件样品,则可得组距为805 16.又其中有 1 件编号为 28,则与之相邻的为12 和 44,故所取 5 个数依次为 12,28,44,60,76,即最大的为 76.答案:(1)A(2)76 统计图表和数据特征的综合应用 某车间 20 名工人年龄数据如下表:年龄(岁)工人数(人)191283293305314323401 合计20(1)求这 20 名工人年
4、龄的众数与极差;(2)以十位数为茎,个位数为叶,作出这 20 名工人年龄的茎叶图;(3)求这 20 名工人年龄的方差解:(1)这 20 名工人年龄的众数为:30;这 20 名工人年龄的极差为:401921.(2)以十位数为茎,个位数为叶,作出这 20 名工人年龄的茎叶图如图:1 9 2 8 8 8 9 9 93 0 0 0 0 0 1 1 1 1 2 2 24 0(3)这 20 名工人年龄的平均数为:(1928329330531432340)2030;所以这 20 名工人年龄的方差为:120(3019)2 320(3028)2 320(3029)2 520(3030)2 420(3031)2
5、320(3032)2 120(3040)212.6.(1)反映样本数据分布的主要方式:频率分布表、频率分布直方图、茎叶图在具体问题中要能够根据公式求解数据的平均数、众数和中位数、方差等(2)由样本数据估计总体时,样本方差越小,数据越稳定,波动越小 2.从某企业生产的某种产品中抽取 100 件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:质量指标值分组7585859595105105115115125频数62638228(1)作出这些数据的频率分布直方图;(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);(3)根据以上抽样调查数据,能否认为该企业
6、生产的这种产品符合“质量指标值不低于 95 的产品至少要占全部产品 80%”的规定?解:(1)(2)质量指标值的样本平均数为 x800.06900.261000.381100.221200.08100.质量指标值的样本方差为 s2(20)20.06(10)20.2600.381020.222020.08104.所以这种产品质量指标值的平均数的估计值为 100,方差的估计值为 104.(3)质量指标值不低于 95的产品所占比例的估计值为 0.380.220.080.68.由于该估计值小于 0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于 95 的产品至少要占全部产品 80%”的规定思
7、想方法转化与化归思想在统计中的应用 对 10 名高三男生的身高进行测量后得到如下一组数据(单位:cm):168 175 171 182 170 173 169 174 178 180计算它们的标准差【解】设原样本数据为 xi(i1,2,10)因为最大值为182,最小值为 168,且1821682175,令 yixi175,则得到另一组数据:yi:7 0 4 7 5 2 6 1 3 5 所以 y(7047526135)110(10)1101(cm)所以 s2y 110(3619641612501636)11020420.4(cm2),所以 sy 20.44.52(cm)因为 sxsy,所以 10
8、 名高三男生身高的标准差约为 4.52 cm.将图表信息转化为数字特征估计总体是统计学的基本方法,本例由于样本数据较大,且相对集中,考虑整体代换,使数据变小,方便计算由方差公式可以证明 sxsy,通过转化,一组数据较大难以计算方差的问题便顺利地得到了解决,这也正是化归思想的功效1为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为 1213,1314,1415,1516,1617,将其按从左到右的顺序分别编号为第一组,第二组,第五组,如图所示的是根据试验数据制成的频率分布直方图已知第一组与第二组共有 20人,第三组中没有疗效的有 6 人,则第三
9、组中有疗效的人数为()A6 B8C12D18解析:选 C.志愿者的总人数为20(0.160.24)150,所以第三组人数为 500.3618,有疗效的人数为 18612.2设样本数据 x1,x2,x10 的平均数和方差分别为 1 和 4,若 yixia(a 为非零常数,i1,2,10),则 y1,y2,y10 的平均数和方差分别为()A1a,4B1a,4aC1,4D1,4a解析:选 A.x1x2x10101,yixia,所以 y1,y2,y10 的平均数为 1a,方差不变仍为 4.故选 A.3某校高一、高二、高三分别有学生人数为 495、493、482,现采用系统抽样方法,抽取 49 人做问卷
10、调查,将高一、高二、高三学生依次随机按 1,2,3,1470 编号,若第 1 组由简单随机抽样方法抽取的号码为 23,则高二应抽取的学生人数为_解析:由系统抽样方法,知按编号依次每 30 个编号作为一组,共分 49 组,高二学生的编号为 496 到 988,在第 17 组到第 33组内,第 17 组抽取的编号为 163023503,为高二学生,第 33 组抽取的编号为 323023983,为高二学生,故共抽取高二学生人数为 331617.答案:174调查某班学生的平均身高,从 50 名学生中抽取 110,问:应采取哪种抽样方法?如果知道男、女生的身高有显著不同(男生30 人,女生 20 人),又该采取哪种抽样方法?解:可以用简单随机抽样法,先将 50 名同学的姓名按 1 至 50编号,然后采用抽签法抽得 5 名同学,也可以用随机数表法抽得 5 名同学当男、女身高有显著不同时,可采取分层抽样法,男生抽 3 人,女生抽 2 人本部分内容讲解结束 按ESC键退出全屏播放