1、第二章统计2.1随机抽样2.1.1简单随机抽样1.下列调查中,属于简单随机抽样的是()A.2014年仁川亚运会志愿者的体检B.袋装牛奶合格率调查C.日本首相安倍晋三的支持率调查D.汽车车站行李安检2.为调查参加运动会的1000名运动员的年龄情况,从中抽查了100名运动员的年龄,就这个问题来说,下列说法正确的是()A.1000名运动员是总体B.每个运动员是个体C.抽取的100名运动员是样本D.样本容量是1003.关于简单随机抽样的特点,有以下几种说法,其中不正确的是()A.要求总体的个数有限 B.从总体中逐个抽取C.它是一种不放回抽样 D.每个个体被抽到的机会不一样,与先后顺序有关4.已知总体容
2、量为106,若用随机数表法抽取一个容量为10的样本,下面对总体的编号正确的是()A.1,2,106 B.0,1,105 C.00,01,105 D.000,001,1055.从某鱼池中捕得120条鱼,做了记号之后,再放回池中,经过适当的时间后,再从池中捕得100条鱼,计算其中有记号的鱼为10条,试估计鱼池中共有鱼的条数为()A.1000条 B.1200条 C.130条 D.1300条6.为了解某产品的使用寿命,从中抽取10件产品进行实验,在这个问题中,总体是_,个体是_,样本是_,样本容量是_.7.某中学为了支持广州市的创文工作,从报名的20名教师志愿者中选5名教师组成志愿小组,请用抽签法和随
3、机数表法设计抽样方案.8.一个总体中含有100个个体,以简单随机抽样方式从该总体中抽取一个容量为5的样本,则指定的某个个体被抽到的概率是_.9.在某年的高考中,A省有20万考生,为了估计他们的数学平均成绩,从中随机抽取2000名学生的数学成绩作为样本进行统计分析,请回答下面问题:(1)本题中,总体、个体、样本、样本容量各指什么?(2)本题中采用的抽样方法是什么?(3)若考生甲参加了这次高考,那么他被选中的可能性有多大?10.在简单随机抽样中,某一个个体被抽到的可能性是()A.与第几次抽到有关,第一次抽到的可能性大一些B.与第几次抽到无关,每次抽到的可能性相等C.与第几次抽到有关,最后一次抽到的
4、可能性大一些D.与第几次抽到无关,每次都是等可能的抽取,但各次抽取的可能性不一样2.1.2系统抽样1.某影院有40排座位,每排有46个座位,一个报告会上坐满了听众,会后留下座号为20的所有听众进行座谈,这是运用了()A.抽签法 B.随机数表法C.系统抽样法 D.放回抽样法2.下列说法正确的是()总体的个体数不多时,宜用简单随机抽样法;在系统抽样过程中,总体均分后,对起始部分进行抽样时,采用的是简单随机抽样;百货商场的抽奖活动是抽签法;系统抽样过程中,每个个体被抽取的概率相等(有剔除时例外).A. B. C. D.3.为了了解1200名学生对学校食堂管理的意见,打算从中抽取一个容量为30的样本,
5、考虑用系统抽样,则分段的间隔k为()A.30 B.40 C.20 D.124.某校为了了解高三模底考试的数学成绩,从年级1252名学生的成绩中,采用系统抽样方法抽取一个容量为50的样本,那么总体中应随机剔除的个体数目是_.5.从编号为00007999的8000个个体中,用系统抽样的方法抽取一个容量为50的样本,则最后一段的编号为_.若已知最后一个入样的编号为7894,则前5个入样的编号为_.6.采用系统抽样法,从121人中抽取一个容量为12人的样本,则每人被抽取的概率是_.7.学校为了了解全校同学参加学生社团的基本情况,从503名学生中抽取50名作为样本,如何采用系统抽样的方法完成这一抽样?8
6、.(2013年陕西)某单位有840名职工,现采用系统抽样方法,抽取42人做问卷调查,将840人按1,2,840随机编号,则抽取的42人中,编号落入区间481,720的人数为()A.11人 B.12人C.13人 D.14人9.一个总体共有100个个体,随机编号为0,1,2,99.依编号顺序平均分成10个小组,组号依次为1,2,3,10,现用下面的方法抽取一个容量为10的样本.规定:如果在第一组随机抽取的号码为m,那么在第k组中抽取的号码个位数与mk的个位数字相同.如果m6,那么在第7组中抽取的号码是_.10.下面给出某村委调查本村各户收入情况所做的抽样,阅读并回答问题:本村人口:1200人,户数
7、300,每户平均人口数4人;应抽户数:30户;抽样间隔:40;确定随机数字:取一张人民币,编码的后两位数为12;确定第一样本户:编码的后两位数为12的户为第一样本户;确定第二样本户:124052,52号为第二样本户(1)该村委采用了何种抽样方法?(2)抽样过程中存在哪些问题?并修改;(3)何处使用了简单随机抽样? 2.1.3分层抽样1.简单随机抽样、系统抽样、分层抽样之间的共同点是()A.都是从总体中逐个取得B.将总体分成几部分,按事先规定的要求在各部分抽取C.抽样过程中每个个体被抽到的机会相同D.将总体分成几层,分层进行抽取2.某校高一、高二和高三年级分别有学生n1,n2和n3名,为了解全校
8、学生视力情况,现用分层抽样方法从中抽取一个容量为n0的样本,则在高一抽的人数占高一总人数的比例是()A. B.C. D.3.某校师生共2400人,现用分层抽样方法从所有师生中抽取一个容量为160的样本,已知从教师中抽取的人数为10,则该校教师人数是()A.150人 B.60人 C.600人 D.15人4.(2013年湖南)某工厂甲、乙、丙三个车间生产了同一种产品,数量分别为120件,80件,60件.为了解它们的产品质量是否存在显著差异,用分层抽样方法抽取了一个容量为n的样本进行调查,其中从丙车间的产品中抽取了3件,则n()A.9 B.10C.12 D.135.(2012年四川)交通管理部门为了
9、解机动车驾驶员(简称驾驶员)对某新法规的知晓情况,对甲、乙、丙、丁四个社区做分层抽样调查.假设四个社区驾驶员的总人数为N,其中甲社区有96人,若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为12,21,25,43,则这四个社区驾驶员的总人数N为()A.101 B.808 C.1212 D.20126.(1)教育局督学组到学校检查工作,需在学号为00011000的高三年级的学生中抽20人参加学校管理的综合座谈会;(2)该校高三年级有1000名学生参加2014年新年晚会,要产生20名“幸运之星”;(3)该校高三年级1000名学生一模考试的数学成绩有240人在120分以上(包括120分),600人在
10、120分以下,90分以上(包括90分),其余在90分以下,现欲从中抽取20人研讨进一步改进数学教与学的座谈会.用如下三种抽样方法选取样本:简单随机抽样;系统抽样;分层抽样.则以上三件事,最合理的抽样方法序号依次为_.7.某学校共有教师490人,其中不到40岁的有350人,40岁及以上的有140人.为了了解普通话在该校中的推广普及情况,用分层抽样的方法,从全体教师中抽取一个容量为70人的样本进行普通话水平测试,那么在不到40岁的教师中应抽取的人数为多少人?8.某校共有学生2000名,各年级男、女生人数如下表.已知在全校学生中随机抽取1名,抽到二年级女生的概率是0.19.现用分层抽样的方法在全校抽
11、取64名学生,则应在三年级抽取的学生人数为()一年级二年级三年级女生373xy男生377370zA.24人 B.18人C.16人 D.12人9.为了保证分层抽样时,每个个体等可能地被抽取,必须要求()A.不同的层以不同的抽样比例抽样 B.每层抽样的个体数相同C.每层的抽样比例都相同D.以上都不对10.一个县区共有4个乡镇,人口3万人,其中4个乡镇的人口比例为3223,从3万人中抽取一个300人的样本,分析某种流行病发病率,已知这种疾病与地理位置及水土有关,问应采用什么抽样方法?请写出基本抽样步骤.2.2用样本估计总体2.2.1用样本的频率分布估计总体分布1.在频率分布直方图中,各小长方形的面积
12、等于()A.相应各组的频数 B.相应各组的频率C.组数 D.组距2.一个样本如下:78808181727789909285则这个样本的极差是()A.72 B.92 C.7 D.203.从一堆苹果中任取10个称得它们的质量如下(单位:g):12512012210513011411695120134则样本落在114.5,124.5内的频率为()A.0.2 B.0.3 C.0.4 D.0.54.一个容量为66的样本,数据分组及各组频数如下:11,15)2;15,19)4;19,23)9;23,27)18;27,31)11;31,35)12;35,39)7;39,43)3.由此估计,大于或等于31的数
13、据约占()A. B. C. D.5.(2014年广东汕头二模)图228是根据某班学生在一次数学考试中的成绩画出的频率分布直方图,若80分以上为优秀,根据图形信息可知:这次考试的优秀率为()图228A.25% B.30%C.35% D.40%6.一个社会调查机构就某地居民的月收入调查了10 000人,并根据所得数据得出样本频率分布直方图(如图229).为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10 000人中用分层抽样方法抽出100人做进一步调查,则在2500,3000)(单位:元)月收入段中应抽出_人.图2297.A,B两个班各选出10名学生进行测验,成绩的茎叶图如图2210,用
14、图估计,_班的平均分较高.图22108.为了解初三学生中女生的身高情况,某中学对初三女生的身高进行了一次测量,所得数据整理后列出了频率分布表如下:组别频数频率145.5149.510.02149.5153.540.08153.5157.5200.40157.5161.5150.30161.5165.580.16165.5169.5mn合计MN(1)求出表中m,n,M,N所表示的数分别是多少;(2)画出频率分布直方图;(3)全体女生中身高在哪组范围内的人数最多?9.学校为了调查学生在课外读物方面的支出情况,抽取了一个容量为n的样本,其频率分布直方图如图2211,其中支出在50,60)的同学有30
15、人,若想在这n人中抽取50人,则在50,60)之间应抽取的人数为()图2211A.10人 B.15人 C.25人 D.30人10.为考察某种皮鞋的各种尺码的销售情况,以某天销售的40双皮鞋为一个样本,按尺码分为5组,第3组的频率为0.25,第1,2,4组的频数分别为6,7,9,若第5组表示的是4042码的皮鞋,则售出的200双皮鞋中含4042码的皮鞋()A.50双 B.40双 C.20双 D.30双11.(2012年安徽)若某产品的直径长与标准值的差的绝对值不超过1 mm时,则视为合格品,否则视为不合格品.在近期一次产品抽样检查中,从某厂生产的此种产品中,随机抽样5000件进行检测,结果发现有
16、50件不合格.计算这50件不合格的直径长与标准值的差(单位:mm),将所得数据进行分组,得出频率分布表如下:分组频数频率3,2)0.102,1)8(1,20.50(2,310(3,4合计501.00(1)将上面表格缺少的数据补充完整;(2)估计该厂生产的此种产品中,不合格的直径长与标准值的差落在(1,3内的概率;(3)现对该厂这种产品的某批次进行检查,结果发现有20件产品不合格,据此估算这批产品中合格品的件数.2.2.2用样本的数字特征估计总体的数字特征1.一个样本数据按照从小到大的顺序排列为13,14,19,x,23,27,28,31,其中中位数为22,则x为()A.21 B.22 C.20
17、 D.232.某学习小组在一次数学测验中,得100分的有1人,95分的有1人,90分的有2人,85分的有4人,80分和75分的各有1人,则该小组成绩的平均数、众数、中位数分别是()A.85,85,85 B.87,85,86C.87,85,85 D.87,85,903.x1,x2,x3的平均数是3,x4,x5,x10的平均数是6,则x1,x2,x10的平均数是()A.3 B.4 C.5 D.5.14.样本数为9的四组数据,它们的平均数都是5,频率分布图如图2215,则标准差最大的一组是()图2215A.第一组 B.第二组 C.第三组 D.第四组5.从一堆苹果中任取5个,称得它们的质量如下(单位:
18、克):125,124,121,123,127,则该样本的标准差s_(用数字作答).6.甲、乙、丙、丁四人参加奥运会射击项目选拔赛,四人的平均成绩和方差如下表所示:甲乙丙丁平均成绩8.58.88.88方差s23.53.52.18.7则参加奥运会的最佳人选是_.7.划艇运动员甲、乙二人在相同的条件下进行了6次测试,测得他们的最大速度(单位:m/s)的数据如下:甲:27,38,30,37,35,31;乙:33,29,38,34,28,36.根据以上数据,试判断他们谁更优秀?8.一组数据中,每个数都减去80,得到一组新数据,若新数据的平均数是1.2,方差是4.4,则原来数据的平均数和方差分别为()A.
19、81.2,4.4 B.78.8,4.4C.81.2,84.4 D.78.8,75.69.为了解我国13岁男孩的平均身高,从北方抽取了300个男孩,平均身高1.60 m;从南方抽取了200个男孩,平均身高为1.50 m.由此可推断我国13岁男孩的平均身高为()A.1.57 m B.1.56 mC.1.55 m D.1.54 m10.某校文学社开展“红五月”征文活动,作品上交时间为5月2号5月22号,评委从收到的作品中抽出200,经统计,其频率分布直方图如图2216.(1)样本中的作品落在6,10)内的频数是多少?(2)估计众数、中位数和平均数各是多少?图22162.3变量间的相关关系1.下列关系
20、中,是函数关系的是()A.球的半径和体积的关系 B.农作物收获和施肥量的关系C.商品成本和利润的关系 D.产品产量与单位产品成本的关系2.(2013年湖北)四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直线方程,分别得到以下四个结论:y与x负相关,且2.347x6.423;y与x负相关,且3.476x5.648; y与x正相关,且5.437x8.493;y与x正相关,且4.326x4.578.其中一定不正确的结论的序号是()A. B. C. D.3.在对两个变量x,y进行线性回归分析时,有下列步骤:对所求出的回归直线方程作出解析;收集数据(xi,yi),i1,2,n;求回归
21、直线方程;求相关系数;绘制散点图.如果根据可靠性要求能够作出变量x,y具有线性相关结论,那么下列操作顺序正确的是()A. B.C. D.4.由一组样本数据(x1,y1),(x2,y2),(xn,yn)得到的回归直线方程为x,则下面说法不正确的是()A.直线x必经过点(,)B.直线x至少经过点(x1,y1),(x2,y2),(xn,yn)中的一个点C.直线x的斜率为D.直线x和各点(x1,y1),(x2,y2),(xn,yn)的偏差是该坐标平面上所有直线与这些点偏差中最小的.5.某产品的广告费用x与销售额y的统计数据如下表: 广告费用x/万元4235销售额y/万元49263954根据上表可得回归
22、方程x中为9.4,据此模型预报广告费用为6万元时销售额为()A.63.6万元 B.65.5万元C.67.7万元 D.72.0万元6.工人月工资y(单位:元)依劳动生产率x(单位:千元)变化的回归方程为6090x,下列判断正确的是()A.劳动生产率为1000元时,工资为60元 B.劳动生产率提高1000元时,工资提高150元C.劳动生产率提高1000元时,工资提高90元D.劳动生产率为1000元时,工资为90元7.7个学生的数学成绩和物理成绩如下表:学生ABCDEFG数学成绩/分80757065608883物理成绩/分70666864628278问:数学成绩与物理成绩是否具有相关关系?8.(20
23、12年全国)在一组样本数据(x1,y1),(x2,y2),(xn,yn)(n2,x1,x2,xn不全相等)的散点图中,若所有样本点(xi,yi)(i1,2,n)都在直线yx1上,则这组样本数据的样本相关系数为()A.1 B.0 C. D.19.已知x,y如下表:x01456my1.31.85.66.17.49.3从散点图知:y与x线性相关,由上表可求得回归方程为0.95x1.45,则m_.10.(2012年福建)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价x/元88.28.48.68.89销量y/件908483807568(1)求回归直线方程x
24、,其中20,;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元(利润销售收入成本)?第二章统计21随机抽样21.1简单随机抽样【课后巩固提升】1B2.D3.D4D解析:随机数表法要求每个个体的编号长度一致5B解析:随机抽样中每个个体被抽到的可能性相等,则由,得N1200.6某产品所有产品的使用寿命每个产品的使用寿命被抽取的10件产品的使用寿命107解:抽签法:(1)将20名志愿者编号,编号为1,2,3,20;(2)将20个号码分别写在20张外形完全相同的纸条上,并揉成团,制成号签;(3)将20个号签放入一个不透
25、明的盒子里,充分搅匀;(4)从盒子中逐个抽取5个号签,并记录上面的编号;(5)所得号码对应的志愿者,就是志愿小组的成员随机数表法:(1)将20名志愿者编号,编号为01,02,03,20;(2)在随机数表中任选一数开始,按某一确定方向读数;(3)凡不在0120中的数或已读过的数,都跳过去不作记录,依次记录下5个读数;(4)找出号码与记录的数相同的教师组成志愿小组80.059解:(1)总体指在该年的高考中,A省20万考生的数学成绩;个体指在该年的高考中,A省20万考生每一名考生的数学成绩;样本是指被抽取的2000名学生的数学成绩;样本容量是2000.(2)采用抽样方法是简单随机抽样(3)甲被选中的
26、可能性为.10B解析:简单随机抽样中每个个体被抽到的可能性相等21.2系统抽样【课后巩固提升】1C2A解析:系统抽样有剔除时,每个个体被抽到的可能性也相等,都等于.3B4.25784079990054,0214,0374,0534,0694解析:系统抽样又称等距抽样,间隔一般为k.6.解析:系统抽样无论有无剔除都是等机率抽样,故机率为.7解:(1)因为得10余3,故用简单随机抽样方法剔除3个个体;(2)对剩下的500名学生进行编号为000,001,002,499;(3)确定间隔k10,将总体分成50个部分,每部分包括10个个体第1部分的个体编号为000,001,002,009,第2部分的个体编
27、号为010,011,012,019,依此类推,第50部分的个体编号为490,491,499;(4)在第1部分用简单随机抽样确定起始的个体编号,比如007;(5)依次在第2部分,第3部分,第50部分取出号码007,017,497,这样就得到了一个容量为50的样本8B解析:使用系统抽样方法,从840人中抽取42人,即从20人抽取1人所以从编号1480的人中,恰好抽取24(人),接着从编号481720共240人中抽取12(人)963解析:第7组的编号依次为60,61,62,63,64,65,66,67,68,69.由6713,个位数为3,所以在第7组中抽取的号码是63.10解:(1)采用了系统抽样(
28、2)本题是对某村各户进行抽样,而不是对某村人口抽样,抽样间隔为:10,其他步骤相应改为确定随机数字:取一张人民币,编码的后两位数为02;确定第一样本户:编号为02的户为第一样本户;确定第二样本户:021012,12号为第二样本户(3)确定随机数字用的是简单随机抽样21.3分层抽样【课后巩固提升】1C2.B3.A4.D5B解析:由分层抽样特点,可知:N96,N808.故选B.67解:因为每个个体被抽到的可能性相等,用分层抽样的方法,样本容量与总体个体数之比为7049017,所以不到40岁的教师中应抽取35050(人)8C解析:由在全校2000名学生中随机抽取1名,抽到二年级女生的概率是0.19,
29、得二年级女生有380人,所以三年级有2000373377380370500(人)由,得n16.9C10解:应采取分层抽样方法步骤如下(1)将3万人分四层,每个镇一层;(2)各乡镇应抽人数:30090(人),30060(人),30060(人),30090(人);(3)按系统抽样方法在各镇抽取相应人数;(4)将每层抽取的人组到一起得到一个样本22用样本估计总体22.1用样本的频率分布估计总体分布【课后巩固提升】1B解析:小长方形面积为:组距频率2D3.C4.B5.B6.257.B8解:(1)M50,m50(1420158)2,N1,n0.04.(2)频率分布直方图如图D15.图D15(3)在153
30、.5157.5范围内的人数最多9B10B解析:第3组的频数为400.2510,则第5组的频数为40106798,第5组的频率为0.2,则答案为2000.240(双)11解:(1)频数列:5,25,2;频率列:0.16,0.20,0.04.(2)0.500.200.70.(3)设合格品数为x,依题意,得,x1980.这批次合格品件数为1980.22.2用样本的数字特征估计总体的数字特征【课后巩固提升】1A2.C3.D4D解析:频率分布越分散,标准差越大52解析:因为样本平均数(125124121123127)124,则样本方差s2(1202321232)4,所以标准差s2.6丙7解:甲(2738
31、30373531)33,乙(332938342836)33,s(2733)2(3833)2(3033)2(3733)2(3533)2(3133)215,s(3333)2(2933)2(3833)2(3433)2(2833)2(3633)212,甲乙,ss,二人的最大速度的平均值相同,但乙比甲更稳定,故乙比甲更优秀8A解析:80,s2s2.故选A.9B解析:从北方抽取了300个男孩,平均身高1.60 m;从南方抽取了200个男孩,平均身高为1.50 m.这500个13岁男孩的平均身高是1.56(m)由此可推断我国13岁男孩的平均身高为1.56 m.10解:(1)作品落在6,10)内的频率为10.
32、080.360.120.120.32,频数为2000.3264.(2)众数估计值为:12,中位数的估计值为:从左到右小矩形面积依次为0.08,0.32,0.36,0.12,0.12,由于中位数左、右两边的小矩形面积相等,若设为x,则(x10)0.090.1,x11.平均数的估计值为0.0840.3280.36120.12160.122012.23变量间的相关关系【课后巩固提升】1A2.D3.D4.B5B解析:易得,42.回归直线过点(,),且9.4,9.1,即线性回归方程为9.4x9.1,当x6时,65.5.6C7解:两变量的散点图如图D18.图D18由上图易知,数学与物理成绩具有相关关系8D98解析:(16m),5.25,5.250.95(16m)1.45,解得m8.10解:(1)8.5,80, 250,回归方程为20x250.(2)设利润为L元,则Lx(20x250)4(20x250)202361.25,当且仅当x8.25时,L取的最大值当该产品单价定为8.25元时,工厂可获得最大利润