1、第四十八讲随机抽样、用样本估计总体、变量间的相互关系、统计案例班级_姓名_考号_日期_得分_一、选择题:(本大题共6小题,每小题6分,共36分,将正确答案的代号填在题后的括号内)1一个单位有职工160人,其中业务人员96人,管理人员40人,后勤服务人员24人,为了了解职工的收入情况,要从中抽取一个容量为20的样本,如何去抽取?解法一:将160人从1至160编号,然后将用白纸做成有1160号的160个号签放入箱内搅匀,最后从中取20个签,与签号相同的20个人被选出解法二:将160人从1至160编号,按编号顺序分成20组,每组8人,令18号为第一组,916号为第二组,153160号为第20组从第一
2、组中用抽签方式抽到一个为k号(1k8),其余组是(k8n)号(n1,2,3,19),如此抽到20人解法三:按2016018的比例,从业务员中抽取12人,从管理人员中抽取5人,从后勤人员中抽取3人,都用简单随机抽样法从各类人员中抽取所需人数,他们合在一起恰好抽到20人以上的抽样方法,依次是简单随机抽样、分层抽样、系统抽样的顺序是()A解法一、解法二、解法三B解法二、解法一、解法三C解法一、解法三、解法二D解法三、解法一、解法二解析:解法二为简单随机抽样,解法二为系统抽样,解法三为分层抽样,故选C.答案:C2一个样本a,3,5,7的平均数是b,且a、b是方程x25x40的两根,则这个样本的方差是(
3、)A3B4C5 D6解析:x25x40的两根是1,4.当a1时,a,3,5,7的平均数是4,当a4时,a,3,5,7的平均数不是1.a1,b4.则方差s2(14)2(34)2(54)2(74)25,故选C.答案:C3为了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况,得到频率分布直方图如图所示,由于不慎将部分数据丢失,但知道前4组的频数成等比数列,后6组的频数成等差数列,设最大频率为a,视力从4.6到5.0之间的学生数为b,则a,b的值分别为()A0.27,78 B0.27,83C2.7,78 D2.7,83解析:由图知共有9组,故后6组的频率是以2.70.10.27为首
4、项,d为公差的等差数列,又各组频率之和为0.010.030.090.27615d1,故d0.05.所以各组的频率依次为0.01,0.03,0.09,0.27,0.22,0.17,0.12,0.07,0.02,故a0.27,b(0.270.220.170.12)10078,故选A.答案:A4下列有关线性回归的说法,不正确的是()A相关关系的两个变量不是因果关系B散点图能直观地反映数据的相关程度C回归直线最能代表线性相关的两个变量之间的关系D任一组数据都有回归方程解析:根据两个变量属相关关系的概念,可知A正确;散点图能直观地描述呈相关关系的两个变量的离散程度,且回归直线最能代表它们之间的相关关系,
5、所以B、C正确;只有线性相关的数据才有回归直线,所以D不正确答案:D5利用独立性检验来考虑两个分类变量X和Y是否有关系时,通过查阅下表来确定断信“X和Y有关系”的可信度如果k5.024,那么就有把握认为“X和Y有关系”的百分比为()P(K2k)0.500.400.250.150.100.050.0250.0100.0050.001k0.4550.7081.3232.0722.7063.845.0246.6357.87910.83A.25% B75%C2.5% D97.5%解析:k5.024时,“X和Y无关系”的可信度0.025,所以“X和Y有关系”百分比97.5%.答案:D6下面是一个22列联
6、表y1y2总计x1a2173x222527总计b46则表中a,b处的值分别为()A94,96 B52,50C52,54 D54,52解析:a2173,a52.又a2b知b54,故选C.答案:C二、填空题:(本大题共4小题,每小题6分,共24分,把正确答案填在题后的横线上)7某企业三月中旬生产A、B、C三种产品共3000件,根据分层抽样的结果,企业统计员制作了如下的统计表格:产品类别ABC产品数量(件)1300样本容量130由于不小心,表格中A、C产品的有关数据已被污染得看不清楚,统计员只记得A产品的样本容量比C产品的样本容量多10.根据以上信息,可得C产品的数量是_件解析:设样品的容量为x,则
7、1300130,所以x300.所以A产品和C产品在样本中共有300130170(件)设C产品的样本容量为y,则y(y10)170,所以y80.所以C产品的数量为80800(件)答案:8008已知总体的各个体的值由小到大依次为2,3,3,7,a,b,12,13.7,18.3,20,且总体的中位数为10.5,若要使该总体的方差最小,则a,b的取值是_和_解析:由题意ab21,故平均数10.欲使方差最小,只需使(a10)2(b10)2最小,又(a10)2(b10)2a2b220(ab)200a2b2220(ab)22ab2202212ab22122,当且仅当a10.5,b10.5时最小,故a10.5
8、,b10.5时,s2最小答案:10.510.59某地教育部门为了调查学生在数学答卷中的有关信息,从上次考试的10000名考生的数学试卷中用分层抽样的方法抽取500人,并根据这500人的数学成绩画出样本的频率分布直方图(如图),则10000人的数学成绩在140,150段的约是_人解析:设500人的数学成绩在140,150段的人数为x,10000人的数学成绩在140,150段的人数为n.由样本频率分布直方图知数学成绩在140,150段的频率最小矩形的面积,即为0.008100.08,x40.又样本的个数占总个数的,即每组的抽样比为,n800.10000人的数学成绩在140,150段的约是800人答
9、案:80010某肉食鸡养殖小区某种病的发病鸡只数呈上升趋势,统计近4个月这种病的新发病鸡只数的线性回归分析如下表所示:如果不加控制,仍按这个趋势发展下去,请预测从9月初到12月底的4个月时间里,该养殖小区这种病的新发病鸡总只数约为_解析:由上表可得:94.7x1924.7,当x分别取9,10,11,12时,得估计值分别为:2777,2871.7,2966.4,3061.1,则总只数约为27772871.72966.43061.111676.答案:11676三、解答题:(本大题共3小题,11、12题13分,13题14分,写出证明过程或推演步骤)11一个地区共有5个乡镇30000人,其中人口比例为
10、32514,要从这30000人中抽取300个人进行某种传染病分析,因考虑该传染病与不同地理位置及水土有关,问应采取什么样的抽样方法?写出抽样过程解:应采用分层抽样的方法具体抽样过程如下:(1)计算抽样比:;(2)计算各乡镇人口数分别为:300006000,300004000,3000010000,300002000,300008000;(3)计算各乡镇抽取的人口数分别为:600060,400040,10000100,200020,800080;(4)用系统抽样的方法依次从五个乡镇中抽出60人,40人,100人,20人,80人;(5)将抽取的个体合在一起,就构成所要抽取的一个样本12据报道,某公
11、司的33名职工的月工资(以元为单位)如下:职务董事长副董事长董事总经理经理管理员职员人数11215320工资5500500035003000250020001500(1)求该公司职工月工资的平均数、中位数、众数;(2)假设副董事长的工资从5000元提升到20000元,董事长的工资从5500元提升到30000元,那么新的平均数、中位数、众数又是什么?(精确到元)(3)你认为哪个统计量更能反映这个公司员工的工资水平?结合此问题谈一谈你的看法解:(1)平均数是150015005912091(元)中位数是1500元,众数是1500元(2)平均数是1500150017883288(元)中位数是1500元
12、,众数是1500元(3)在这个问题中,中位数或众数均能反映该公司员工的工资水平因为公司中少数人的工资额与大多数人的工资额差别较大,这样导致平均数与中位数偏差数大,所以平均数不能反映这个公司员工的工资水平13要分析学生初中升学的数学成绩对高一年级数学学习有什么影响,在高一年级学生中随机抽选10名学生,分析他们入学的数学成绩和高一年级期末数学考试成绩,如下表所示:x63674588817152995876y65785282828973985675表中x是学生入学数学成绩,y是指高一年级期末考试数学成绩(1)画出散点图;(2)求回归直线方程;(3)若某学生王明亮的入学数学成绩为80分,试预测他在高一
13、年级期末考试中的数学成绩为多少?解:(1)作出散点图如图所示,从散点图可以看出,这两个变量具有线性相关关系(2)ixiyixyxiyi163653969422540952677844896084522634552202527042340488827744672472165818265616724664267189504179216319752732704532937968999898019604970295856336431363248107675577656255700合计700750514745807654284可求得(636776)70,(657875)75.b0.721,a750.7217024.53.所求的线性回归方程为0.721x24.53.(3)若王明亮入学数学成绩为80分,代入上面的线性回归方程0.721x24.53可得82分