1、高考资源网() 您身边的高考专家1(2015课标,3,易)根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是()A逐年比较,2008年减少二氧化硫排放量的效果最显著B2007年我国治理二氧化硫排放显现成效C2006年以来我国二氧化硫年排放量呈减少趋势D2006年以来我国二氧化硫年排放量与年份正相关【答案】DA,B,C均正确,对D,2006年以来随年份增加,二氧化硫年排放量减少,不与年份正相关2(2015湖北,2,易)我国古代数学名著数书九章有“米谷粒分”题:粮仓开仓收粮,有人送来米1 534石,验得米内夹谷,抽样取米一把,数得254粒内夹谷28粒
2、,则这批米内夹谷约为()A134石 B169石C338石 D1 365石【答案】B由题可知,谷占的比例约为,所以米内夹谷约为1 534169(石)3(2015安徽,6,中)若样本数据x1,x2,x10的标准差为8,则数据2x11,2x21,2x101的标准差为()A8 B15 C16 D32【答案】C若x1,x2,xn的标准差为s,则ax1b,ax2b,axnb的标准差为as.由题意s8,则所求标准差为2816.4(2015江苏,2,易)已知一组数据4,6,5,8,7,6,那么这组数据的平均数为_【解析】平均数6.【答案】65(2015湖南,12,易)在一次马拉松比赛中,35名运动员的成绩(单
3、位:分钟)的茎叶图如图所示13003456688891411122233445556678150122333若将运动员按成绩由好到差编为135号,再用系统抽样方法从中抽取7人,则其中成绩在区间139,151上的运动员人数是_【解析】35人抽取7人,则n5,而在139,151上共有20人,应抽取4人【答案】46(2015课标,18,12分,中)某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了20个用户,得到用户对产品的满意度评分如下:A地区:6273819295857464537678869566977888827689B地区:738362519146537364829348658
4、1745654766579(1)根据两组数据完成两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);(2)根据用户满意度评分,将用户的满意度从低到高分为三个等级:满意度评分低于70分70分至89分不低于90分满意度等级不满意满意非常满意记事件C:“A地区用户的满意度等级高于B地区用户的满意度等级”假设两地区用户的评价结果相互独立根据所给数据,以事件发生的频率作为相应事件发生的概率,求C的概率解:(1)两地区用户满意度评分的茎叶图如下:通过茎叶图可以看出,A地区用户满意度评分的平均值高于B地区用户满意度评分的平均值;A地区用户满意
5、度评分比较集中,B地区用户满意度评分比较分散(2)记CA1表示事件:“A地区用户的满意度等级为满意或非常满意”;CA2表示事件:“A地区用户的满意度等级为非常满意”;CB1表示事件:“B地区用户的满意度等级为不满意”;CB2表示事件:“B地区用户的满意度等级为满意”,则CA1与CB1独立,CA2与CB2独立,CB1与CB2互斥,C(CB1CA1)(CB2CA2)P(C)P(CB1CA1)(CB2CA2)P(CB1CA1)P(CB2CA2)P(CB1)P(CA1)P(CB2)P(CA2)由所给数据得CA1,CA2,CB1,CB2发生的频率分别为,故P(CA1),P(CA2),P(CB1),P(C
6、B2),P(C)0.48.1(2014湖南,2,易)对一个容量为N的总体抽取容量为n的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p1,p2,p3,则()Ap1p2p3 Bp2p3p1Cp1p3p2 Dp1p2p3【答案】D在简单随机抽样、系统抽样、分层抽样中每个个体被抽到的机会是均等的,即每个个体被抽到的概率是相等的,故p1p2p3.2(2013江西,4,易)总体由编号为01,02,19,20的20个个体组成利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的
7、编号为()7816657208026314070243699728019832049234493582003623486969387481A.08 B07 C02 D01【答案】D由随机数表法的随机抽样的过程可知选出的5个个体的编号为08,02,14,07,01(第2个02需剔除),所以选出来的第5个个体的编号为01,选D.3(2013安徽,5,易)某班级有50名学生,其中有30名男生和20名女生,随机询问了该班五名男生和五名女生在某次数学测验中的成绩,五名男生的成绩分别为86,94,88,92,90,五名女生的成绩分别为88,93,93,88,93.下列说法一定正确的是()A这种抽样方法是一
8、种分层抽样B这种抽样方法是一种系统抽样C这五名男生成绩的方差大于这五名女生成绩的方差D该班级男生成绩的平均数小于该班女生成绩的平均数【答案】CA项,不是分层抽样,因为抽样比不同B项,不是系统抽样,因为随机询问,抽样间隔未知C项,五名男生成绩的平均数是90,五名女生成绩的平均数是91,五名男生成绩的方差为s(1616440)8,五名女生成绩的方差为s(94494)6,显然,五名男生成绩的方差大于五名女生成绩的方差D项,由于五名男生和五名女生的成绩无代表性,不能确定该班男生和女生的平均成绩4(2013重庆,4,易)以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分)已知甲组数
9、据的中位数为15,乙组数据的平均数为16.8,则x,y的值分别为()A2,5 B5,5 C5,8 D8,8【答案】C由茎叶图及已知得x5,又乙组数据的平均数为16.8,即16.8,解得y8,选C.5(2012山东,4,中)采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9,抽到的32人中,编号落入区间1,450的人做问卷A,编号落入区间451,750的人做问卷B,其余的人做问卷C,则抽到的人中,做问卷B的人数为()A7 B9 C10 D15【答案】C由题意知应将960人分成32组,每组30人设每组选出的人的号
10、码为30k9(k0,1,31),由45130k9750,解得k.又kN,故k15,16,24.故选C.6(2014江苏,6,易)为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间80,130上,其频率分布直方图如图所示,则在抽测的60株树木中,有_株树木的底部周长小于100 cm.【解析】由题意知在抽测的60株树木中,底部周长小于100 cm的株数为(0.0150.025)106024.【答案】247(2014天津,9,易)某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进
11、行调查已知该校一年级、二年级、三年级、四年级的本科生人数之比为4556,则应从一年级本科生中抽取_名学生【解析】30060(名)【答案】608(2013江苏,6,中)抽样统计甲、乙两位射击运动员的5次训练成绩(单位:环),结果如下:运动员第1次第2次第3次第4次第5次甲8791908993乙8990918892则成绩较为稳定(方差较小)的那位运动员成绩的方差为_【解析】设甲、乙两位射击运动员成绩的方差分别为s,s,由题意可得甲、乙两人的平均成绩都是90,s(8790)2(9190)2(9090)2(8990)2(9390)24,s(8990)2(9090)2(9190)2(8890)2(929
12、0)22.【答案】29(2013广东,17,12分,易)某车间共有12名工人,随机抽取6名,他们某日加工零件个数的茎叶图如图所示,其中茎为十位数,叶为个位数(1)根据茎叶图计算样本均值;(2)日加工零件个数大于样本均值的工人为优秀工人,根据茎叶图推断该车间12名工人中有几名优秀工人?(3)从该车间12名工人中,任取2人,求恰有1名优秀工人的概率解:(1)样本均值为22.(2)由(1)知样本中优秀工人占的比例为,故推断该车间12名工人中有124名优秀工人(3)设“从该车间12名工人中,任取2人,恰有1名优秀工人”为事件A,则P(A).考向1三种抽样方法及其应用三种抽样方法的比较类别共同点各自特点
13、相互联系适用范围简单随机抽样都是不放回抽样,抽样过程中,每个个体被抽到的机会(概率)相等从总体中逐个抽取总体中的个数较少系统抽样将总体均分成几部分,按事先确定的规则,在各部分抽取在起始部分抽样时,采用简单随机抽样总体中的个数比较多分层抽样将总体分成几层,分层进行抽取各层抽样时,采用简单随机抽样或者系统抽样总体由差异明显的几部分组成(1)(2013课标,3)为了解某地区的中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大在下面的抽样方法中,最合理的抽样方法是()A简单随机抽样 B按性别分层抽
14、样C按学段分层抽样 D系统抽样(2)(2014广东,6)已知某地区中小学生人数和近视情况分别如图1和图2所示为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为()A200,20 B100,20 C200,10 D100,10【解析】(1)因为男女生视力情况差异不大,而学段的视力情况有较大差异,所以应按学段分层抽样(2)由题意知,该地区中小学生共有10 000名,故样本容量为10 0002%200.由分层抽样知应抽取高中学生的人数为20040,其中近视人数为4050%20.【答案】(1)C(2)A【点拨】解题(1)的关键是了解样本特
15、征的差异性;解题(2)的关键是从扇形统计图和条形统计图中读出相关数据并进行计算 1.抽样方法的选择与判断解决此类问题的关键是掌握这三种抽样方法的适用原则:(1)简单随机抽样:总体中的个体性质相似,无明显层次;总体容量较小,尤其是样本容量较小;用简单随机抽样法抽出的个体带有随机性,个体间无固定间距(2)系统抽样:元素个数很多且均衡的总体;各个个体被抽到的机会均等;总体分组后,在起始部分抽样时,采用简单随机抽样(3)分层抽样:总体由差异明显的几部分组成,如年龄、学段、性别、工种等;分层后,在每一层抽样时可采用简单随机抽样或系统抽样2分层抽样中公式的运用(1)抽样比;(2)层1的数量层2的数量层3的
16、数量样本1的容量样本2的容量样本3的容量(1)(2013陕西,4)某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,840随机编号,则抽取的42人中,编号落入区间481,720的人数为()A11 B12 C13 D14(2)(2015湖北武汉联考,12)已知某单位有40名职工,现要从中抽取5名职工,将全体职工随机按140编号,并按编号顺序平均分成5组按系统抽样方法在各组内抽取一个号码若第1组抽出的号码为2,则所有被抽出职工的号码为_(1)【答案】B因为84042201,故编号在481,720内的人数为2402012.(2)【解析】由系统抽样知识知,第一组18号;
17、第二组为916号;第三组为1724号;第四组为2532号;第五组为3340号第一组抽出号码为2,则依次为10,18,26,34.【答案】2,10,18,26,34考向2统计图表1频率分布直方图的特征(1)各矩形的面积和为1.(2)纵轴的含义为,矩形的面积组距频率(3)样本数据的平均数的估计值等于每个小矩形的面积乘矩形底边中点横坐标之和(4)众数为最高矩形的底边中点的横坐标2各种统计图表的优点与不足优点不足频率分布表表示数据较确切分析数据分布的总体态势不方便频率分布直方图表示数据分布情况非常直观原有的具体数据信息被抹掉了频率分布折线图能反映数据的变化趋势不能显示原有数据茎叶图一是所有的信息都可以
18、从这个茎叶图中得到;二是茎叶图便于记录和表示,能够展示数据的分布情况样本数据较多或数据位数较多时,不方便表示数据茎叶图中茎是指中间的一列数,叶是从茎的旁边生长出来的数(2014广东,17,13分)随机观测生产某种零件的某工厂25名工人的日加工零件数(单位:件),获得数据如下:30,42,41,36,44,40,37,37,25,45,29,43,31,36,49,34,33,43,38,42,32,34,46,39,36.根据上述数据得到样本的频率分布表如下:分组频数频率25,3030.12(30,3550.20(35,4080.32(40,45n1f1(45,50n2f2(1)确定样本频率分
19、布表中n1,n2,f1和f2的值;(2)根据上述频率分布表,画出样本频率分布直方图;(3)根据样本频率分布直方图,求在该厂任取4人,至少有1人的日加工零件数落在区间(30,35的概率【思路导引】(1)根据题目中数据得n1,n2,利用得出f1,f2;(2)根据分组、频率及组距画出频率分布直方图;(3)利用独立重复试验公式,根据对立事件求概率的方法即可求出【解析】(1)由所给数据知,落在区间(40,45内的有7个,落在(45,50内的有2个,故n17,n22,所以f10.28,f20.08.(2)频率分布直方图如图所示:(3)工人们日加工零件数落在区间(30,35的概率为0.2,设日加工零件数落在
20、区间(30,35的人数为随机变量,则B(4,0.2),故4人中,至少有1人的日加工零件数落在区间(30,35的概率为:1C(0.2)0(0.8)410.409 60.590 4. 解决统计图表问题的方法解决图表类问题时,应正确理解图表中各量的意义,通过图表掌握信息是解决该类问题的关键频率分布直方图直观形象地表示了样本的频率分布(2013辽宁,5)某班的全体学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为:20,40),40,60),60,80),80,100若低于60分的人数是15,则该班的学生人数是()A45 B50 C55 D60【答案】B由频率分布直方图可知20,40)间的频
21、率为0.005200.1,40,60)间的频率为0.01200.2.所以低于60分的频率为0.3,总人数为50,选B.考向3用样本数字特征估计总体1众数、中位数、平均数数字特征样本数据频率分布直方图众数出现次数最多的数据取最高的小长方形底边中点的横坐标中位数将数据按大小依次排列,处在最中间位置的一个数据(或最中间两个数据的平均数)把频率分布直方图划分为左右两个面积相等的部分,分界线与x轴交点的横坐标平均数样本数据的算术平均数每个小矩形的面积乘小矩形底边中点的横坐标之和2.方差和标准差方差和标准差反映了数据波动程度的大小(1)方差:s2(x1)2(x2)2(xn)2;(2)标准差:s.3关于平均
22、数、方差的有关性质(1)若x1,x2,xn的平均数为,那么mx1a,mx2a,mxna的平均数为ma.(2)数据x1,x2,xn与数据x1x1a,x2x2a,xnxna的方差相等,即数据经过平移后方差不变(3)若x1,x2,xn的方差为s2,那么ax1b,ax2b,axnb的方差为a2s2.(2014山东,7)为了研究某药品的疗效,选取若干名志愿者进行临床试验所有志愿者的舒张压数据(单位:kPa)的分组区间为12,13),13,14),14,15),15,16),16,17,将其按从左到右的顺序分别编号为第一组,第二组,第五组下图是根据试验数据制成的频率分布直方图已知第一组与第二组共有20人,
23、第三组中没有疗效的有6人,则第三组中有疗效的人数为()A6 B8 C12 D18(2)(2014陕西,9)设样本数据x1,x2,x10的均值和方差分别为1和4,若yixia(a为非零常数,i1,2,10),则y1,y2,y10的均值和方差分别为()A1a,4 B1a,4aC1,4 D1,4a【解析】(1)第一、二两组的频率为0.240.160.4,志愿者的总人数为50(人)第三组的人数为500.3618(人),有疗效的人数为18612(人)(2)(y1y2y10)(x1x2x1010a)(x1x2x10)a1a,S2(y1)2(y10)2(x11)2(x101)2(x1)2(x10)24.【答
24、案】(1)C(2)A【点拨】解题(1)的关键是理解频率分布直方图中频率与频数的关系;题(2)根据公式直接求解 有关样本数字特征问题的解题技巧(1)用样本估计总体时,样本的平均数、标准差只是总体的平均数、标准差的近似实际应用中,当所得数据平均数不相等时,需先分析平均水平,再计算标准差(方差)分析稳定情况(2)若给出图形,一方面可以由图形得到相应的样本数据,再计算平均数、方差(标准差);另一方面,可以从图形直观分析样本数据的分布情况,大致判断平均数的范围,并利用数据的波动性大小反映方差(标准差)的大小(2013湖北,11)从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间
25、,频率分布直方图如图所示(1)直方图中x的值为_;(2)在这些用户中,用电量落在区间100,250)内的户数为_【解析】(1)由频率分布直方图的性质知500.002 4500.003 6500.006 050x500.002 4500.001 21,解得x0.004 4.(2)用电量落在区间100,250)内的频率为50(0.003 60.006 00.004 4)0.7,故用电量落在区间100,250)内的户数为1000.770.【答案】(1)0.004 4(2)70考向4统计与概率的综合应用(2014课标,18,12分)从某企业生产的某种产品中抽取500件,测量这些产品的一项质量指标值,由
26、测量结果得如下频率分布直方图:(1)求这500件产品质量指标值的样本平均数和样本方差s2(同一组中的数据用该组区间的中点值作代表);(2)由直方图可以认为,这种产品的质量指标值Z服从正态分布N(,2),其中近似为样本平均数,2近似为样本方差s2.利用该正态分布,求P(187.8Z212.2);某用户从该企业购买了100件这种产品,记X表示这100件产品中质量指标值位于区间(187.8,212.2)的产品件数,利用的结果,求EX.附:12.2.若ZN(,2),则P(Z)0.682 6,P(2Z2)0.954 4.【解析】(1)抽取产品的质量指标值的样本平均数和样本方差s2分别为1700.0218
27、00.091900.222000.332100.242200.082300.02200,s2(30)20.02(20)20.09(10)20.2200.331020.242020.083020.02150.(2)由(1)知,ZN(200,150),从而P(187.8Z212.2)P(20012.2Z1”的概率解:(1)由频率分布直方图知,成绩在14,16)内的人数为500.16500.3827(人),所以该班在这次测试中成绩良好的人数为27人(2)由频率分布直方图知,成绩在13,14)的人数为500.063(人),设为x,y,z;成绩在17,18的人数为500.084(人),设为A,B,C,D
28、.当m,n13,14)时,有xy,yz,xz,3种情况;当m,n17,18时,有AB,AC,AD,BC,BD,CD,6种情况若m,n分别在13,14)和17,18内时,如下表所示:ABCDxxAxBxCxDyyAyByCyDzzAzBzCzD共有12种情况,所以基本事件总数为21种,事件“|mn|1”所包含的基本事件有12种,P(|mn|1).1(2014河北石家庄二模,3)某学校高三年级一班共有60名学生,现采用系统抽样的方法从中抽取6名学生做“早餐与健康”的调查,为此将学生编号为1,2,60.选取的这6名学生的编号可能是()A1,2,3,4,5,6 B6,16,26,36,46,56C1,
29、2,4,8,16,32 D3,9,13,27,36,54【答案】B由系统抽样知识知,所选取学生编号之间的间距相等且为10,所以应选B.2(2015浙江杭州模拟,7)某校150名教职工中,有老年人20名,中年人50名,青年人80名,从中抽取30名作为样本采用随机抽样法:抽签取出30个样本;采用系统抽样法:将教职工编号为00,01,149,然后平均分组抽取30个样本;采用分层抽样法:从老年人、中年人、青年人中抽取30个样本下列说法中正确的是()A无论采用哪种方法,这150名教职工中每个人被抽到的概率都相等B两种抽样方法,这150名教职工中每个人被抽到的概率都相等;并非如此C两种抽样方法,这150名
30、教职工中每个人被抽到的概率都相等;并非如此D采用不同的抽样方法,这150名教职工中每个人被抽到的概率是各不相同的【答案】A三种抽样方法中,每个人被抽到的概率都等于,故选A.3(2015湖北武汉第二次调研,8)如图是依据某城市年龄在20岁到45岁的居民上网情况调查而绘制的频率分布直方图,现已知年龄在30,35),35,40),40,45)的上网人数呈现递减的等差数列分布,则年龄在35,40)的网民出现的频率为()A0.04 B0.06 C0.2 D0.3【答案】C由频率分布直方图的知识得,年龄在20,25)的频率为0.0150.05,25,30)的频率为0.0750.35,设年龄在30,35),
31、35,40),40,45的频率为x,y,z,又x,y,z成等差数列,所以可得解得y0.2,年龄在35,40)的网民出现的频率为0.2.故选C.4(2015湖北十校联考,6)已知某次期中考试中,甲、乙两组学生的数学成绩如下:甲:881009586959184749283乙:9389 8177967877858986则下列结论正确的是()A.甲乙,s甲s乙 B.甲乙,s甲s乙C.甲s乙 D.甲乙,s甲0,b0 Ba0,b0Ca0 Da0,b0,b0,y与x正相关,A正确;线性回归方程经过样本点的中心(,),B正确;y0.85(x1)85.71(0.85x85.71)0.85,C正确;体重58.79
32、 kg为估计值,故选D.4(2011山东,7,易)某产品的广告费用x与销售额y的统计数据如下表:广告费用x(万元)4235销售额y(万元)49263954根据上表可得回归方程x中的为9.4,据此模型预报广告费用为6万元时销售额为()A63.6万元 B65.5万元C67.7万元 D72.0万元【答案】B由表可计算,42.因为点在回归直线x上,且为9.4,所以429.4,解得9.1,故回归方程为9.4x9.1,令x6,得65.5.5(2011湖南,4,易)通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:男女总计爱好402060不爱好203050总计6050110由K2算得,
33、K27.8.附表:P(K2k)0.0500.0100.001k3.8416.63510.828参照附表,得到的正确结论是 ()A在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”B在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”C有99%以上的把握认为“爱好该项运动与性别有关”D有99%以上的把握认为“爱好该项运动与性别无关”【答案】C由K27.8及P(k26.635)0.010可知,在犯错误的概率不超过1%的前提下,认为“爱好该项运动与性别有关”,也就是有99%以上的把握认为“爱好该项运动与性别有关”,故选C.考向1线性回归方程及其应用1两个变量的线性相
34、关(1)正相关:在散点图中,点散布在从左下角到右上角的区域对于两个变量的这种相关关系,将它称为正相关(2)负相关:在散点图中,点散布在从左上角到右下角的区域对于两个变量的这种相关关系,将它称为负相关2相关系数r.(1)|r|1,当r0时,两个变量正相关;当r0.75时,我们认为两个变量之间存在较强的线性相关关系3线性回归直线方程x,其中, ,主要用来估计和预测取值,从而获得对两个变量之间整体关系的了解回归直线一定经过样本的中心点(,),据此性质可以解决有关的计算问题同时可以应用回归直线方程作出预测(2014课标,19,12分)某地区2007年至2013年农村居民家庭人均纯收入y(单位:千元)的
35、数据如下表:年份2007200820092010201120122013年份代号t1234567人均纯收入y2.93.33.64.44.85.25.9(1)求y关于t的线性回归方程;(2)利用(1)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入附:回归直线的斜率和截距的最小二乘估计公式分别为:,.【解析】(1)由所给数据计算得(1234567)4,(2.93.33.64.44.85.25.9)4.3, (ti)2941014928, (ti)(yi)(3)(1.4)(2)(1)(1)(0.7)00.110.520.9
36、31.614,0.5, 4.30.542.3.所求回归方程为0.5t2.3.(2)由(1)知,0.50,故2007年至2013年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元将2015年的年份代号t9代入(1)中的回归方程,得0.592.36.8,故预测该地区2015年农村居民家庭人均纯收入为6.8千元【点拨】在求解过程中,对数值的处理要细心,由于计算烦琐极易出错;在求时,由公式 求解,注意不要代错数值特别提醒:回归直线方程恒过样本中心(,) 求线性回归直线方程的步骤(1)用散点图或进行相关性检验判断两个变量是否具有线性相关关系;(2)列表求出,x,y,xiyi(可用计算器进行计
37、算);(3)利用公式, 求得回归系数;(4)写出回归直线方程(2014河北石家庄模拟,19,12分)下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据x3456 y2.5344.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程x;(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤,试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?(参考数值:32.5435464.566.5)解:(1)由题意,作散点图如图(2)由对照数据,计算得xiyi6
38、6.5,x3242526286,4.5,3.5, 0.7, 3.50.74.50.35,所以回归方程为 0.7x0.35.(3)当x100时,y1000.70.3570.35(吨标准煤),预测生产100吨甲产品的生产能耗比技改前降低9070.3519.65(吨标准煤)考向2独立性检验122列联表列出的两个变量的频数表称作列联表假设有两个分类变量X,Y,它们的可能取值分别为x1,x2和y1,y2,其样本频数22列联表为:y1y2总计x1ababx2cdcd总计acbdnabcd构造随机变量K2.2判断两个分类变量X和Y是否有关系的方法利用随机变量K2来确定在多大程度上可以认为“两个分类变量有关系
39、”的方法称为两个分类变量的独立性检验统计学研究表明:当K23.841时,认为X与Y无关;当K23.841时,有95%的把握说X与Y有关;当K26.635时,有99%的把握说X与Y有关;当K210.828时,有99.9%的把握说X与Y有关(2012辽宁,19,12分)电视传媒公司为了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”(1)根据已知条件完成下面的22列联表,并据此资料你是否认为“体育迷”与性别有关?非体育迷体育迷合计男女1055合计(2
40、)将上述调查所得到的频率视为概率现在从该地区大量电视观众中,采用随机抽样方法每次抽取1名观众,抽取3次,记被抽取的3名观众中的“体育迷”人数为X.若每次抽取的结果是相互独立的,求X的分布列、期望E(X)和方差D(X)附:2或K2.P(2k)0.050.01k3.8416.635【思路导引】(1)根据所给的频率分布直方图得出数据,列出列联表,再代入公式计算得出K2,与3.841比较即可得出结论;(2)用频率代替概率可得出从观众中抽取一名“体育迷”的概率是,由于XB,从而得出分布列,再计算出期望与方差【解析】(1)由频率分布直方图可知,在抽取的100人中,“体育迷”有(0.0200.005)101
41、0025(人),由独立性检验的知识得22列联表如下:非体育迷体育迷合计男301545女451055合计7525100将22列联表中的数据代入公式计算,得K23.030.因为3.0303.841,所以没有理由认为“体育迷”与性别有关(2)由频率分布直方图知抽到“体育迷”的频率为(0.0200.005)100.25,将频率视为概率,即从观众中抽取一名“体育迷”的概率为.由题意知XB,从而X的分布列为X0123P由二项分布的期望与方差公式得E(X)np3,D(X)np(1p)3. 解决独立性检验应用问题的方法解决一般的独立性检验问题,首先由所给22列联表确定a,b,c,d,n的值,然后根据统计量K2
42、的计算公式确定K2的值,最后根据所求值确定有多大的把握判定两个变量有关联(2015广东六校联考,17,13分)某市调研考试后,某校对甲、乙两个文科班的数学考试成绩进行分析,规定:大于或等于120分为优秀,120分以下为非优秀统计成绩后,得到如下的列联表,且已知在甲、乙两个文科班全部110人中随机抽取1人为优秀的概率为.优秀非优秀合计甲班10乙班30合计110(1)请完成上面的列联表;(2)根据列联表的数据,若按99.9%的可靠性要求,能否认为“成绩与班级有关系”;(3)若按下面的方法从甲班优秀的学生中抽取一人:把甲班优秀的10名学生从2到11进行编号,先后两次抛掷一枚均匀的骰子,出现的点数之和
43、为被抽取人的序号试求抽到9号或10号的概率参考公式与临界值表:K2.P(K2k)0.1000.0500.0250.0100.001k2.7063.8415.0246.63510.828解:(1)优秀非优秀合计甲班105060乙班203050合计3080110(2)根据列联表中的数据,得到K27.48710.828.因此按99.9%的可靠性要求,不能认为“成绩与班级有关系”(3)设“抽到9或10号”为事件A,先后两次抛掷一枚均匀的骰子,出现的点数为(x,y),所有的基本事件有:(1,1),(1,2),(1,3),(6,6),共36个事件A包含的基本事件有:(3,6),(4,5),(5,4),(6
44、,3),(5,5),(4,6),(6,4),共7个P(A),即抽到9号或10号的概率为.1(2015河南郑州二模,7)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价(元)456789销量(件)908483807568由表中数据,求得线性回归方程4xa,若在这些样本点中任取一点,则它在回归直线左下方的概率为()A. B.C. D.【答案】B由表中数据得6.5,80.由(,)在直线4xa上,得a106.即线性回归方程为4x106.经过计算只有(5,84)和(9,68)在直线的下方,故所求概率为,选B.2(2015江西上饶二模,6)以下命题中:pq为假
45、命题,则p与q均为假命题;对具有线性相关的变量x,y有一组观测数据(xi,yi)(i1,2,8),其回归直线方程是xa,且x1x2x3x82(y1y2y3y8)6,则实数a;已知0,则函数f(x)2x的最小值为16.其中真命题的个数为()A0 B1 C 2 D3【答案】B正确中a,所以不正确中,由0可得1x2,因为f(x)2x224,当且仅当x1时取等号,所以不正确3 (2014山东潍坊二模,7)为了普及环保知识,增强环保意识,某大学从理工类专业的A班和文史类专业的B班各抽取20名同学参加环保知识测试统计得到成绩与专业的列联表:优秀非优秀总计A班14620B班71320总计211940附:参考
46、公式及数据:(1)统计量:K2(nabcd)(2)独立性检验的临界值表:P(K2k0)0.0500.010k03.8416.635则下列说法正确的是()A有99%的把握认为环保知识测试成绩与专业有关B有99%的把握认为环保知识测试成绩与专业无关C有95%的把握认为环保知识测试成绩与专业有关D有95%的把握认为环保知识测试成绩与专业无关【答案】C因为K24.912,3.841K26.635,所以有95%的把握认为环保知识测试成绩与专业有关4(2015湖北荆州中学第一次质检,7)从某高中随机选取5名高三男生,其身高和体重的数据如下表所示:身高x(cm)160165170175180体重y(kg)6
47、366707274根据上表可得回归直线方程0.56x,据此模型预测身高为172 cm的高三男生的体重为()A70.09 kg B70.12 kgC70.55 kg D71.05 kg【答案】B由表中数据可得170,69,因为(,)一定在回归直线0.56x上,故690.56170,解得26.2.故0.56x26.2.当x172时,0.5617226.27012,故选B.5(2015安徽黄山二模,12)某市居民20102014年家庭年平均收入x(单位:万元)与年平均支出y(单位:万元)的统计资料如下表所示:年份20102011201220132014收入x11.512.11313.315支出y6.
48、88.89.81012根据统计资料,居民家庭年平均收入的中位数是_,家庭年平均收入与年平均支出有_线性相关关系【解析】中位数是13.由相关性知识,根据统计资料可以看出,当年平均收入增多时,年平均支出也增多,因此两者之间具有正线性相关关系【答案】13正6(2015安徽安庆一模,16,12分)以下是某地搜集到的新房屋的销售价格y和房屋的面积x的数据:房屋面积(m2)11511080135105销售价格(万元)24.821.618.429.222(1)画出数据对应的散点图;(2)求线性回归方程,并在散点图中加上回归直线;(3)据(2)的结果估计当房屋面积为150 m2时的销售价格解:(1)数据对应的
49、散点图如图所示:(2)xi109, (xi)21 570,23.2, (xi)(yi)308.设所求回归直线方程为x,则0.196 2, 23.21090.196 21.814 2.故所求回归直线方程为0.196 2x1.814 2.(3)根据(2),当x150 m2时,销售价格的估计值为0.196 21501.814 231.244 231.2(万元)7(2014河北石家庄三模,19,12分)为了调查某大学学生在周日上网的时间,随机对100名男生和100名女生进行了不记名的问卷调查,得到了如下的统计结果:表1:男生上网时间与频数分布表上网时间(分钟)30,40)40,50)50,60)60,
50、70)70,80人数525302515表2:女生上网时间与频数分布表上网时间(分钟)30,40)40,50)50,60)60,70)70,80人数1020402010(1)若该大学共有女生750人,试估计其中上网时间不少于60分钟的人数;(2)完成下面的22列联表,并回答能否有90%的把握认为“大学生周日上网时间与性别有关”?表3:上网时间少于60分钟上网时间不少于60分钟合计男生女生合计附:K2.P(K2k0)0.500.400.250.150.100.050.0250.0100.0050.001k00.4550.7081.3232.0722.7063.8415.0246.6357.8791
51、0.828解:(1)设估计上网时间不少于60分钟的人数为x,依题意有,解得x225,所以估计其中上网时间不少于60分钟的人数是225.(2)根据题目所给数据得到如下列联表:上网时间少于60分钟上网时间不少于60分钟合计男生6040100女生7030100合计13070200其中K22.1982.706,因此,没有90%的把握认为“大学生周日上网时间与性别有关”(时间:90分钟_分数:120分)一、选择题(共10小题,每小题5分,共50分)1(2013湖南,2)某学校有男、女学生各500名,为了解男、女学生在学习兴趣与业余爱好方面是否存在显著差异,拟从全体学生中抽取100名学生进行调查,则宜采用
52、的抽样方法是()A抽签法 B随机数法C系统抽样法 D分层抽样法【答案】D由于是调查男、女学生在学习兴趣与业余爱好方面是否存在差异,因此用分层抽样法2(2015广东东莞模拟,5)已知回归直线的斜率的估计值是1.2,样本点的中心为(4,5),则回归直线方程是()A.1.2x4 B.1.2x5C.1.2x0.2 D.0.95x1.2【答案】C由题意可知,k1.2,且直线过点(4,5),所以回归直线方程为1.2x0.2.3(2014山东东营二模,3)某商品的销售量y(件)与销售价格x(元/件)存在线性相关关系,根据一组样本数据(xi,yi)(i1,2,n),用最小二乘法建立的回归方程为10x200,则
53、下列结论正确的是()Ay与x具有正的线性相关关系B若r表示变量y与x之间的线性相关系数,则r10C当销售价格为10元时,销售量为100件D当销售价格为10元时,销售量为100件左右【答案】D因为b100,故A错误;因为|r|1,故B错误;当销售价格为10元时,1010200100,即销售量为100件左右,故C错误,D正确4(2015湖南永州一模,4)为大力提倡“厉行节约,反对浪费”,某市通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:做不到“光盘”能做到“光盘”男4510女3015附:P(K2k)0.100.050.025k2.7063.8415.024K2.参照附
54、表,得到的正确结论是()A在犯错误的概率不超过1%的前提下,认为“该市居民能否做到光盘与性别有关”B在犯错误的概率不超过1%的前提下,认为“该市居民能否做到光盘与性别无关”C有90%以上的把握认为“该市居民能否做到光盘与性别有关”D有90%以上的把握认为“该市居民能否做到光盘与性别无关”【答案】C由题设知,a45,b10,c30,d15,所以K23.030 3,27063.030 3乙;甲比乙成绩稳定B.甲乙;乙比甲成绩稳定C.甲乙;甲比乙成绩稳定D.甲乙;乙比甲成绩稳定【答案】D由茎叶图可知甲25,乙26,甲s,乙比甲成绩稳定7(2012江西,9)样本(x1,x2,xn)的平均数为,样本(y
55、1,y2,ym)的平均数为 .若样本(x1,x2,xn,y1,y2,ym)的平均数(1),其中0,则n,m的大小关系为()Anm Bnm Cnm D不能确定【答案】A,.由题意知0,nm.8(2014北京海淀一模,7)一组数据共有7个数,记得其中有10,2,5,2,4,2,还有一个数没记清,但知道这组数的平均数、中位数、众数依次成等差数列,这个数的所有可能值的和为()A9 B3 C17 D11【答案】A设这个数为x,则平均数为,众数为2,若x2,则中位数为2,此时x11;若2x3)0.2.其中正确的个数有()A0个 B1个C2个 D3个【答案】B数学平均分为,错误;由已知,可得3,3.5,回归
56、直线bxa必过样本点的中心(3,3.5),错误;正确,故选B.10(2015北京通州一模,9)对两个变量y和x进行回归分析,得到一组样本数据:(x1,y1), (x2,y2),(xn,yn),则下列说法中不正确的是()A由样本数据得到的回归方程x必过样本点的中心(,)B残差平方和越小的模型,拟合的效果越好C用相关指数R2来刻画回归效果,R2的值越小,说明模型的拟合效果越好D若变量y和x之间的相关系数r0.936 2,则变量y与x之间具有线性相关关系【答案】CR2的值越大,说明残差平方和越小,也就是模型的拟合效果越好,故选C.二、填空题(共4小题,每小题5分,共20分)11(2015山东济南三模
57、,13)已知回归方程4.4x838.19,则可估计x与y的增长速度之比约为_【解析】x每增长1个单位,y增长4.4个单位,故增长速度之比约为14.4522.【答案】52212(2015云南玉溪一中月考,14)利用独立性检验来判断两个分类变量X和Y是否有关系,通过查阅下表来确定“X和Y有关系”的可信度为了调查用电脑时间与视力下降是否有关系,现从某地网民中抽取100位居民进行调查经过计算得K23.855,那么就有_%的把握认为用电脑时间与视力下降有关系P(K2k)0.500.400.250.150.10k0.4550. 7081.3232.0722.706P(K2k)0.050.0250.0100
58、.0050.001k3.8415.0246.6357.87910.828【解析】根据表格发现3.8553.841,3.841对应的是0.05,所以根据独立性检验原理可知有95%的把握认为用电脑时间与视力下降有关系【答案】9513(2014吉林通化三模,13)某产品的广告费用x与销售额y的统计数据如下表:广告费用x(万元)3456销售额y(万元)25304045根据上表可得回归方程x中的为7,据此模型预测广告费用为10万元时销售额为_万元【解析】由题表可知,4.5,35,代入回归方程7x,得3.5,所以回归方程为7x3.5,所以当x10时,7103.573.5(万元)【答案】73.514(201
59、5河南开封三模,14)某地政府调查了工薪阶层1 000人的月工资收入,并根据调查结果画出如图所示的频率分布直方图,为了了解工薪阶层对月工资收入的满意程度,要用分层抽样的方法从调查的1 000人中抽出100人做电话询访,则(30,35(百元)月工资收入段应抽出_人【解析】月工资收入在(30,35(百元)内的频率为1(0.020.040.050.050.01)510.850.15,则0.1550.03,所以各组的频率比为0.020.040.050.050.030.01245531,所以(30,35(百元)月工资收入段应抽出10015(人)【答案】15三、解答题(共4小题,共50分)15(12分)(2015安徽黄山三模,17)公安部发布酒后驾驶处罚的规定:酒后违法驾驶机动车的行为分成两个档次:“酒后驾车”和“醉酒驾车”,其检测标准是驾驶人员血液中的酒精含量Q(简称血酒含量,单位是毫克/100毫升),当20Q0.24,所以临睡前背单词记忆效果更好高考资源网版权所有,侵权必究!