1、5.2 数学探究活动:由编号样本估计总数及其模拟案例估计考生总数情境某大学美术系平面设计专业的报考人数连创新高,今年报名刚结束,某考生想知道报考人数考生的考号按0001,0002,的顺序从小到大依次排列,这位考生随机地了解了50个考生的考号,具体如下:0400 0904 0747 0090 0636 0714 0017 0432 0403 02760986 0804 0697 0419 0735 0278 0358 0434 0946 01230647 0349 0105 0186 0079 0434 0960 0543 0495 09740219 0380 0397 0283 0504 01
2、40 0518 0966 0559 09100658 0442 0694 0065 0757 0702 0498 0156 0225 0327请给出一种方法,根据这50个随机抽取的考号,帮助这位考生估计考生总数根据样本数据估计总体总数的方法有多种,例如,用给出数据的最大值986(与0986对应)估计考生总数;用数据的最大值与最小值的和(986171003)估计考生总数;借助数据中的部分数据的信息(如平均值、中位数等)估计考生的总数;等等 下面给出了平均值估计和区间长度估计两种方法设考生总数为N,即N是最大考号方法一随机抽取的50个数的平均值应该和所有考号的平均值接近,即用样本的平均值估计总体的
3、平均值这50个数的算术平均值是2457150491.42,它应该与接近因此,估计今年报考这所大学美术系平面设计专业的考生总数为N491.422983.类似地,可以通过样本中位数得到N的估计方法二把这50个数据从小到大排列,这50个数把区间0,N分成51个小区间由于N未知,除了最右边的区间外,其他区间都是已知的可以利用这些区间长度来估计N.由于这50个数是随机抽取的,一般情况下可以认为最右边区间的长度近似等于0,N长的,并且可以用前50个区间的平均长度近似代替这个区间的长度因为这50个区间长度的和,恰好是这50个数中的最大值986同,因此得到N511006.从模拟结果可以看出,三种方法都存在误差,但还是很接近真实值,相比较而言,用区间长度估计法,误差稍小一些样本容量大一些,估计值会更接近真实值