1、单元质检十算法初步、统计与统计案例(时间:45分钟满分:100分)一、选择题(本大题共7小题,每小题7分,共49分)1.如图,执行该程序框图,输出的s值为()A.12B.56C.76D.712答案:B解析:第一步:s=1-12=12,k=2,k3;第二步:s=12+13=56,k=3,输出s.故选B.2.(2020广西贵港四模)某班级共有50人,把某次数学测试成绩制作成频率分布直方图如图所示,若分数在区间80,100上为优秀,则任取两人成绩均为优秀的概率为()A.2175B.4175C.135D.6175答案:B解析:由频率分布直方图知优秀人数为(0.006+0.010)1050=8,因此任取
2、两人成绩均为优秀的概率为P=C82C502=875049=4175.故选B.3.某校共有2 000名学生,各年级男、女生人数如表所示.已知在全校学生中随机抽取1名,抽到二年级女生的概率是0.18.现用分层抽样的方法在全校抽取64名学生,则应在三年级抽取的学生人数为()性别年级一年级二年级三年级女生363xy男生387390zA.12B.16C.18D.24答案:B解析:由题意可得二年级的女生的人数为20000.18=360,则一、二年级学生总数363+387+360+390=1500,故三年级学生总数是2000-1500=500.因此,用分层抽样法在三年级抽取的学生数为645002000=16
3、.故选B.4.PM2.5是指大气中直径小于或等于2.5微米的颗粒物,也称为可入肺颗粒物.根据某地某日早7点到晚8点甲、乙两个PM2.5监测点统计的数据(单位:毫克/立方米)列出的茎叶图如图所示,则甲、乙两地PM2.5的方差较小的是()A.甲B.乙C.甲、乙相等D.无法确定答案:A解析:从茎叶图上可以观察到:甲监测点的样本数据比乙监测点的样本数据更加集中,因此甲地PM2.5的方差较小.5.(2020广东汕尾期末)2019年10月18日27日,第七届世界军人运动会在湖北武汉举办,中国代表团共获得133金64银42铜,共239枚奖牌.为了调查各国参赛人员对主办方的满意程度,研究人员随机抽取了500名
4、参赛运动员进行调查,所得数据如表所示:对主办方是否满意男性运动员/名女性运动员/名满意200220不满意5030现有如下说法:在参与调查的500名运动员中任取1人,抽到对主办方表示满意的男性运动员的概率为12;在犯错误的概率不超过1%的前提下可以认为“是否对主办方表示满意与运动员的性别有关”;没有99.9%的把握认为“是否对主办方表示满意与运动员的性别有关”,真命题的个数为()附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d).P(K2k0)0.1000.0500.0100.001k02.7063.8416.63510.828A.1B.2C.3D.4答案:A解析:在参与调查的
5、500名运动员中任取1人,抽到对主办方表示满意的男性运动员的概率为200500=2512,即错误;K2=500(20030-22050)2420802502505.957?解析:模拟程序的运行,可得S=0,n=1,a=3,执行循环体,S=3,a=5,不满足条件,执行循环体,n=2;S=8,a=7,不满足条件,执行循环体,n=3;S=15,a=9,不满足条件,执行循环体,n=4;S=24,a=11,不满足条件,执行循环体,n=5;S=35,a=13,不满足条件,执行循环体,n=6;S=48,a=15,不满足条件,执行循环体,n=7;S=63,a=17,不满足条件,执行循环体,n=8;S=80,a
6、=19,由题意,此时满足条件,退出循环,输出的S结果为80,则判断框内应填入“n7?”.三、解答题(本大题共3小题,共37分)10.(12分)从某校随机抽取200名学生,获得了他们一周课外阅读时间(单位:h)的数据,整理得到数据的频数分布表和频率分布直方图(如图).编号分组频数10,2)1222,4)1634,6)3446,8)4458,10)50610,12)24712,14)12814,16)4916,184合计200(1)从该校随机选取一名学生,试估计这名学生该周课外阅读时间少于12 h的概率;(2)求频率分布直方图中的a,b的值;(3)假设同一组中的每个数据可用该组区间的中点值代替,试
7、估计样本中的200名学生该周课外阅读时间的平均数在第几组.解:(1)由频率分布表可知该周课外阅读时间不少于12h的频数为12+4+4=20,故可估计该周课外阅读时间少于12h的概率为1-20200=0.9.(2)由频率分布表可知数据在4,6)的频数为34,故这一组的频率为0.17,即a=0.085,数据在8,10)的频数为50,故这一组的频率为0.25,即b=0.125.(3)数据的平均数为1200(112+316+534+744+950+1124+1312+154+174)=7.68(h),故样本中的200名学生该周课外阅读时间的平均数在第四组.11.(12分)某网店销售某种商品,为了解该商
8、品的月销量y(单位:千件)与月售价x(单位:元/件)之间的关系,对近几年的月销售量yi和月销售价xi(i=1,2,3,10)数据进行了统计分析,得到了下面的散点图:(1)根据散点图判断,y=c+dln x与y=bx+a哪一个更适宜作为月销量y关于月销售价x的回归方程类型?(给出判断即可,不需说明理由)并根据判断结果及表中数据,建立y关于x的回归方程;(2)利用(1)中的结果回答问题:已知该商品的月销售额为z(单位:千元),当月销售量为何值时,商品的月销售额预报值最大?(月销售额=月销售量当月售价)参考公式、参考数据及说明:对一组数据(v1,w1),(v2,w2),(vn,wn),其回归直线w=
9、+v的斜率和截距的最小二乘法估计分别为=i=1n(wi-w)(vi-v)i=1n(vi-v)2,=w-v.参考数据:xyui=110(xi-x)2i=110(ui-u)2i=110(xi-x)(yi-y)i=110(ui-u)(yi-y)6.506.601.7582.502.70-143.25-27.54表中ui=ln xi,u=110i=110ui.计算时,所有的小数都精确到0.01,如ln 4.061.40.解:(1)y=c+dlnx更适宜销量y关于月销售价x的回归方程类型.令u=lnx,先建立y关于u的线性回归方程,由于d=i=110(yi-y)(ui-u)i=110(ui-u)2=-2
10、7.542.70=-10.20,c=y-du=6.6+10.201.75=24.45,所以y关于u的线性回归方程为y=24.45-10.20u,因此y关于x的线性回归方程为y=24.45-10.20ln x,(2)依题意得z=xy=x(24.45-10.20ln x),z=x(24.45-10.20ln x)=14.25-10.20ln x,令z=0,即14.25-10.20ln x=0,解得ln x1.40,所以x4.06,当x(0,4.06)时,z单调递增,当x(4.06,+)时,z单调递减,故当x=4.06,即月销售量y=10.17(千件)时,月销售额预报值最大.12.(13分)某中学为
11、研究学生的身体素质与课外体育锻炼时间的关系,对该校200名学生的课外体育锻炼平均每天运动的时间(单位:min)进行调查,将收集到的数据分成0,10),10,20),20,30),30,40),40,50),50,60六组,并作出频率分布直方图(如图).将日均课外体育锻炼时间不低于40 min的学生评价为“课外体育达标”.(1)请根据频率分布直方图中的数据填写下面的22列联表,并通过计算判断是否能在犯错误的概率不超过0.01的前提下认为“课外体育达标”与性别有关?性别课外体育是否达标总计课外体育不达标课外体育达标男60女110总计(2)现从“课外体育达标”学生中按分层抽样抽取5人,再从这5名学生
12、中随机抽取2人参加体育知识问卷调查,求抽取的这2人课外体育锻炼时间都在区间40,50)内的概率.附参考公式与数据:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)P(K2k0)0.100.050.0100.0050.001k02.7063.8416.6357.87910.828解:(1)根据频率分布直方图,得“课外体育达标”的学生数为200(0.020+0.005)10=50.由22列联表可知“课外体育达标”的男生人数为30,女生人数为20.补全22列联表如下:性别课外体育是否达标总计课外体育不达标课外体育达标男603090女9020110总计15050200计算K2的观测值k
13、=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)=200(6020-9030)290110150506.0616.635,故在犯错误的概率不超过0.01的前提下不能认为“课外体育达标”与性别有关.(2)从“课外体育达标”学生中按分层抽样抽取5人,其中课外体育锻炼时间在40,50)内有50.0200.020+0.005=4(人),分别记为a,b,c,d;在50,60上有1人,记为E.从这5人中抽取2人,总的基本事件有ab,ac,ad,aE,bc,bd,bE,cd,cE,dE共10种,其中2人都在40,50)内的基本事件有ab,ac,ad,bc,bd,cd共6种,故所求的概率为610=0.6.