1、专题十八统计、统计案例本试卷分第卷(选择题)和第卷(非选择题)两部分满分150分,考试时间120分钟第卷(选择题,共60分)一、选择题(本大题共12小题,每小题5分,共60分在每小题给出的四个选项中,只有一项是符合题目要求的)1(2019昆明市高三质检)“搜索指数”是网民通过搜索引擎,以每天搜索关键词的次数为基础所得到的统计指标搜索指数越大,表示网民搜索该关键词的次数越多,对该关键词相关的信息关注度也越高,如图是2018年9月到2019年2月这半年来,某个关键词的搜索指数变化的统计图根据该统计图判断,下列结论正确的是()A这半年来,网民对该关键词相关的信息关注度呈周期性变化B这半年来,网民对该
2、关键词相关的信息关注度不断减弱C从该关键词的搜索指数来看,2018年10月的方差小于11月的方差D从该关键词的搜索指数来看,2018年12月的平均值大于2019年1月的平均值答案D解析这半年来,网民对该关键词相关的信息关注度没有规律,故A错误;这半年来,网民对该关键词相关的信息关注度呈现一定的波动性,没有不断减弱,故B错误;2018年10月份数据比较离散,而11月份数据比较稳定,故10月份的方差大于11月份的方差,故C错误;从该关键词的搜索指数来看,2018年12月的平均值大于2019年1月的平均值,故D正确,故选D.2(2019四川省乐山市高中第一次调研)胡萝卜中含有大量的胡萝卜素,摄入人体
3、消化器官后,可以转化为维生素A,现从a,b两个品种的胡萝卜所含的胡萝卜素(单位:mg)得到茎叶图如图所示,则下列说法不正确的是()Aab Ba的方差大于b的方差Cb品种的众数为3.31 Da品种的中位数为3.27答案C解析由茎叶图得:b品种所含胡萝卜素普遍高于a品种,ab,故A正确;a品种的数据波动比b品种的数据波动大,a的方差大于b的方差,故B正确;b品种的众数为3.31与3.41,故C错误;a品种的中位数为3.27,故D正确故选C.3(2019安徽省江淮十校第一次联考)近年呼吁高校招生改革的呼声越来越高,在赞成高校招生改革的市民中按年龄分组,得到样本频率分布直方图如图所示,其中年龄在区间3
4、0,40)内的有2500人,在区间20,30)内的有1200人,则m的值为()A0.013 B0.13C0.012 D0.12答案C解析由题意,得年龄在区间30,40)内的频率为0.025100.25,则赞成高校招生改革的市民有10000(人),因为年龄在区间20,30)内的有1200人,所以m0.012.故选C.4(2019驻马店市高三期末)在一组样本数据为(x1,y1),(x2,y2),(xn,yn)(n2,x1,x2,x3,xn不全相等)的散点图中,若所有样本点(xi,yi)(i1,2,n)都在直线yx2上,则这组样本数据的相关系数为()A B. C1 D1答案D解析由所有样本点(xi,
5、yi)(i1,2,n)都在直线上,则有|r|1,根据回归直线方程是yx2,可得这两个变量是负相关,故这组样本数据的样本相关系数为负值,相关系数r1.故选D.5(2019柳州市模拟)如图记录了一种叫万年松的树生长时间t(年)与树高y(m)之间的散点图请你据此判断,拟合这种树生长的年数与树高的关系式,选择的函数模型最好的是()Ay2t Bylog2tCyt3 Dy2t2答案B解析分析可知,对于A,C,D选项,函数值y随t的增大递增速度很快,与所给函数图象不符合,故错误;对于B选项,可知该函数图象类似于对数函数图象,故正确故选B.6(2019山东省高三第一次大联考)下图是相关变量x,y的散点图,现对
6、这两个变量进行线性相关分析,方案一:根据图中所有数据,得到线性回归方程yb1xa1,相关系数为r1;方案二:剔除点(10,21),根据剩下数据得到线性回归直线方程:yb2xa2,相关系数为r2.则()A0r1r21 B0r2r11C1r1r20 D1r2r10答案D解析由图可知变量x,y呈负相关,所以r1,r20,因为剔除点(10,21)后,剩下点数据更具有线性相关性,|r2|更接近1,所以1r2r16.635,可得有99%以上的把握认为“爱好该项运动与性别有关”故选B.11(2019全国卷)某学校为了解1000名新生的身体素质,将这些学生编号为1,2,1000,从这些新生中用系统抽样方法等距
7、抽取100名学生进行体质测验若46号学生被抽到,则下面4名学生中被抽到的是()A8号学生 B200号学生C616号学生 D815号学生答案C解析根据题意,系统抽样是等距抽样,所以抽样间隔为10.因为46除以10余6,所以抽到的号码都是除以10余6的数,结合选项知应为616.故选C.12(2019河北邯郸二模)观察下面频率等高条形图,其中两个分类变量x,y之间关系最强的是()答案D解析在频率等高条形图中,与相差很大时,我们认为两个分类变量有关系,在四个选项中(等高的条形图)中,若x1,x2所占比例相差越大,则分类变量x,y的相关性越强故选D.第卷(非选择题,共90分)二、填空题(本大题共4小题,
8、每小题5分,共20分)13(2019宿迁二调)某单位普通职工和行政人员共280人为了解他们在“学习强国”APP平台上的学习情况,现用分层抽样的方法从所有职员中抽取容量为56的样本已知从普通职工中抽取的人数为49,则该单位行政人员的人数为_答案35解析由题意可得,抽取的行政人员数为56497,抽样的比列为,故该学校的行政人员人数是735.14(2019抚州模拟)已知一组数据分别是x,10,2,5,2,4,2,若这组数据的平均数、中位数、众数成等差数列,则数据x的所有可能取值为_答案11,3,17解析由题意得,这组数据的平均数为,众数为2.若x2,则中位数为2,所以222,解得x11;若2x10.
9、828,对照临界值得,有99.9%的把握认为“选做题的选择”与“文、理科的科类”有关(2)第22题的平均分为(分),得分率为100%79.78%;第23题的平均分为(分),得分率为100%63.93%;所以第22题的得分率更高(3)由分层抽样的方法可知在被选取的6名学生中理科生有4名,文科生有2名,记4名理科生为a,b,c,d,2名文科生为E,F,从这6名学生中随机抽取2名,基本事件是:ab,ac,ad,aE,aF,bc,bd,bE,bF,cd,cE,cF,dE,dF,EF共15种,被抽中的2名学生均为理科生的基本事件为ab,ac,ad,bc,bd,cd共6种,故所求的概率为P.19(本小题满
10、分12分)(2019全国卷)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液每只小鼠给服的溶液体积相同、摩尔浓度相同经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表)解(1)由已知得0.70a0.200.15,故a0.35.b1
11、0.050.150.700.10.(2)甲离子残留百分比的平均值的估计值为20.1530.2040.3050.2060.1070.054.05,乙离子残留百分比的平均值的估计值为30.0540.1050.1560.3570.2080.156.00.20(本小题满分12分)(2019湖北八校联考)某公司准备加大对一项产品的科技改造,经过充分的市场调研与模拟,得到x,y之间的一组数,其中x(单位:百万元)是科技改造的总投入,y(单位:百万元)是改造后的额外收益x23578y58121416其中5,11,G(x,y)2xy是对当地GDP的增长贡献值(1)若从五组数据中任取两组,求至少有一组满足G(x
12、,y)25的概率;(2)对于表中数据,甲、乙两个同学给出的拟合直线方程为:l1:y2x1,l2:yx.试用最小二乘法判断哪条直线的拟合程度更好.解(1)记五组数据分别为A,B,C,D,E,则由题意知后两组数据D,E满足条件从五组数据中任意取出两组有10种情况,即从ABCDE中取出两组有AB,AC,AD,AE,BC,BD,BE,CD,CE,DE,共有10种情况,至少有一组满足条件的有AD,BD,CD,AE,BE,CE,DE,共有7种情况故至少有一组满足G(x,y)25的概率为.(2)如表格:x23578y58121416y2x157111517x23578y58121416yx3.5611161
13、8.5Q102121212124,Q21.522212222.5217.5,Q1Q2,直线l1拟合程度更好21(本小题满分12分)(2019开封二模)如图是某台大型设备使用时间x(单位:年)与维护费用y(单位:千元)的散点图(1)根据散点图,求y关于x的回归方程x;(2)如果维护费用超过120千元,就需要更换设备,那么根据(1)中模型的预测,估计该设备最多可以使用多少年?附:参考数据:75, (xi)(yi)63;一组数据(x1,y1),(x2,y2),(xn,yn),其回归方程x的斜率和截距的最小二乘估计公式分别为:,.解(1)由题意得,3.5,75, (xi)2(13.5)2(23.5)2
14、(33.5)2(43.5)2(53.5)2(63.5)217.5. (xi)(yi)63,所以3.6,753.63.562.4.即y关于x的回归方程3.6x62.4.(2)由题得3.6x62.4120,解得x16.所以估计该设备最多可以使用16年22(本小题满分12分)(2019山东六市二诊)为了弘扬传统文化,某市举办了“高中生诗词大赛”,现从全市参加比赛的学生中随机抽取1000人的成绩进行统计,得到如图所示的频率分布直方图,其中成绩的分组区间为60,70),70,80),80,90),90,100(1)求频率分布直方图中m的值;(2)在所抽取的1000名学生中,用分层抽样的方法在成绩为80,
15、100的学生中抽取了一个容量为5的样本,再从该样本中任意抽取2人,求2人的成绩均在区间90,100内的概率;(3)若该市有10000名高中生参赛,根据此次统计结果,试估算成绩在区间90,100内的人数解(1)依题意可知组距为10,由(0.0250.05m0.01)101,解得m0.015.(2)抽取的这个容量为5的样本成绩在区间80,90)的人数为53人,记这3人为a,b,c.成绩在区间90,100的人数为52人,记这2人为d,e.任意抽取2人的基本事件为ab,ac,ad,ae,bc,bd,be,cd,ce,de,共10个其中这2人的成绩均在区间90,100内的基本事件为de,共1个所以2人的成绩均在区间90,100内的概率为.(3)因为100000.01101000人,所以估计成绩在区间90,100的人数为1000人