1、课时巩固过关练(十九)统计统计案例一、选择题1(2016湖南十校高三联考)交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓情况,对甲、乙、丙、丁四个社区做分层抽样调查假设四个社区驾驶员的总人数为N,其中甲社区有驾驶员96人若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为12,21,25,43,则这四个社区驾驶员的总人数N为()A101 B808C1 212 D2 012解析:甲社区有驾驶员96人,在甲社区中抽取驾驶员的人数为12,每个个体被抽到的概率为,样本容量为12212543101,这四个社区驾驶员的总人数N为808,故选B.答案:B2采用系统抽样方法从960人中抽取32人做问
2、卷调查,为此将他们随机编号为1,2,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间1,450的人做问卷A,编号落入区间451,750的人做问卷B,其余的人做问卷C,则抽到的人中,做问卷B的人数为()A7 B9C10 D15解析:抽取号码的间隔为30,从而区间451,750包含的段数为10,则编号落入区间451,750的人数为10,即做问卷B的人数为10.答案:C3(2015湖南高考)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)如图所示:13003456688891411122233445556678151122333若将运动员按成绩由好到差编为
3、135号,再用系统抽样方法从中抽取7人,则其中成绩在区间139,151上的运动员人数为()A3 B4C5 D6解析:根据茎叶图中的数据,得成绩在区间139,151上的运动员人数是20,用系统抽样方法从35人中抽取7人,成绩在区间139,151上的运动员应抽取74(人),故选B.答案:B4(2015山东高考)为比较甲、乙两地某月14时的气温状况,随机选取该月中的5天,将这5天中14时的气温数据(单位:)制成如图所示的茎叶图考虑以下结论:甲地该月14时的平均气温低于乙地该月14时的平均气温;甲地该月14时的平均气温高于乙地该月14时的平均气温;甲地该月14时的气温的标准差小于乙地该月14时的气温的
4、标准差;甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差其中根据茎叶图能得到的统计结论的标号为()A BC D解析:甲地数据为:26,28,29,31,31,乙地数据为:28,29,30,31,32,所以甲29,乙30,s(2629)2(2829)2(2929)2(3129)2(3129)23.6,s(2830)2(2930)2(3030)2(3130)2(3230)22.即正确的有,故选B.答案:B5(2016广东惠州调研二)惠州市某机构对两千多名出租车司机的年龄进行调查,现从中随机抽出100名司机已知抽到的司机年龄都在20,45)岁之间,根据调查结果得出司机的年龄情况残缺的频率
5、分布直方图如图所示,利用这个残缺的频率分布直方图估计该市出租车司机年龄的中位数大约是()A31.6岁 B32.6岁C33.6岁 D36.6岁解析:由面积为1,知25,30)的频率为0.2,为保证中位数的左右两边面积都是0.5,必须把30,35)的面积0.35划分为0.250.1,此时划分边界为30533.6,故选C.答案:C6(2016广西梧州、崇左联考)某教育机构随机选取某校20个班级,调查各班关注汉字听写大赛的学生人数,根据所得数据的茎叶图,以组距为5将数据分组成0,5),5,10),10,15),15,20),20,25),25,30),30,35),35,40)所作的频率分布直方图如图
6、所示,则原始茎叶图可能是()解析:由频率分布直方图可知:0,5)的频数为200.0151,5,10)的频数为200.0151,10,15)的频数为200.0454,15,20)的频数为200.0252,20,25)的频数为200.0454,25,30)的频数为200.0353,30,35)的频数为200.0353,35,40)的频数为200.0252,则对应的茎叶图为A,故选A.答案:A7(2016湖南衡阳一模)如图是某篮球联赛中,甲、乙两名运动员9个场次得分的茎叶图,设甲、乙两人得分平均数分别为甲,乙,中位数分别为m甲,m乙,则()甲乙3513682454793263781457A.甲乙,m
7、甲乙,m甲m乙C.甲m乙D.甲乙,m甲m乙解析:由茎叶图可知甲;乙;所以甲乙;m甲28,m乙36,所以m甲m乙;故选A.答案:A8四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直线方程,分别得到以下四个结论:y与x负相关且2.347x6.423;y与x负相关且3.476x5.648;y与x正相关且5.437x8.493;y与x正相关且4.326x4.578.其中一定不正确的结论的序号是()A BC D解析:y与x负相关且2.347x6.423,此结论错误,由线性回归方程知,此两变量的关系是正相关;y与x负相关且3.476x5.648,此结论正确,线性回归方程符合负相关的特征
8、;y与x正相关且5.437x8.493,此结论正确,线性回归方程符合正相关的特征;y与x正相关且4.326x4.578,此结论不正确,线性回归方程符合负相关的特征综上判断知,一定不正确,故选D.答案:D9通过随机询问110名性别不同的人,对过马路是愿意走斑马线还是愿意走人行天桥进行抽样调查,得到如下的列联表:男女总计走天桥402060走斑马线203050总计6050110由K2,算得K27.8.附表:P(K2k)0.0500.0100.001k3.8416.63510.828参照附表,得到的正确结论是()A有99%以上的把握认为“选择过马路的方式与性别有关”B有99%以上的把握认为“选择过马路
9、的方式与性别无关”C在犯错误的概率不超过0.1%的前提下,认为“选择过马路的方式与性别有关”D在犯错误的概率不超过0.1%的前提下,认为“选择过马路的方式与性别无关”答案:A10设(x1,y1),(x2,y2),(xn,yn)是变量x和y的n个样本点,直线l是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论中正确的是()Ax和y的相关系数为直线l的斜率Bx和y的相关系数在0到1之间C当n为偶数时,分布在l两侧的样本点的个数一定相同D直线l过点(,)解析:选项具体分析结论A相关系数用来衡量两个变量之间的相关程度,直线的斜率表示直线的倾斜程度;它们的计算公式也不相同不正确B相关系数的
10、值有正有负,还可以是0;当相关系数大于0时,两个变量为正相关,在小于0时,两个变量为负相关不正确Cl两侧的样本点的个数分布与n的奇偶性无关,也不一定是平均分布不正确D回归直线l一定过样本点中心(,);由回归直线方程的计算公式 可知直线l必过点(,)正确答案:D二、填空题11从某地高中男生中随机抽取100名同学,将他们的体重(单位:kg)数据绘制成频率分布直方图(如图)由图中数据可知体重的平均值为_kg;若要从体重在60,70),70,80),80,90三组内的男生中,用分层抽样的方法选取12人参加一项活动,再从这12人中选两人当正副队长,则这两人体重不在同一组内的概率为_解析:设平均值为X,X450.05550.35650.3750.2850.164.5,身高在60,70)的男生有1000.330(人),身高在70,80)的男生有1000.220(人),身高在80,90的男生有1000.110(人),抽样比为,这12人中,身高在60,70)的有6人,身高在70,80)的有4人,身高在80,90的有2人,从这12人中选两人当正副队长,则这两人体重不在同一组内的概率为11.答案:64.5