1、第十章 第三节一、选择题1(文)(2014重庆)已知变量 x 与 y 正相关,且由观测数据算得样本平均数 x3,y3.5,则由该观测数据算得线性回归方程可能为()A.y0.4x2.3 By2x2.4C.y2x9.5Dy0.3x4.4答案 A解析 因为变量 x 和 y 正相关,所以回归直线的斜率为正,排除 C、D;又将点(3,3.5)代入选项 A 和 B 的方程中检验排除 B,所以选 A.(理)(2014安徽宿州一模)下表提供了某厂节能降耗技术改造后在生产 A 产品过程中记录的产量 x(吨)与对应的生产能耗 y(吨)的几组对应数据.x3456y2.5t44.5根据上表提供的数据,求出 y 关于
2、x 的线性回归方程为y0.7x0.35,那么表中 t 的值为()A3 B3.15C3.5D4.5答案 A解析 样本中心为(4.5,11t4),11t40.74.50.35,解得 t3.2通过随机询问 110 名性别不同的大学生是否爱好某项运动,得到如下的列联表:男女总计爱好402060不爱好203050总计6050110由 2nadbc2abcdacbd算得,2110403020202605060507.8.附表:P(2k)0.0500.0100.001k3.8416.63510.828参照附表,得到的正确结论是()A有 99%以上的把握认为“爱好该项运动与性别有关”B有 99%以上的把握认为
3、“爱好该项运动与性别无关”C在犯错误的概率不超过 0.1%的前提下,认为“爱好该项运动与性别有关”D在犯错误的概率不超过 0.1%的前提下,认为“爱好该项运动与性别无关”答案 A解析 根据独立性检验的定义,由 27.86.635 可知,有 99%以上把握认为“爱好该项运动与性别有关”3(2013辽宁六校联考)某产品在某零售摊位上的零售价 x(单位:元)与每天的销售量 y(单位:个)的统计资料如下表所示:x16171819y50344131由上表可得回归直线方程ybxa中的b4,据此模型预计零售价定为 15 元时,每天的销售量为()A48 个B49 个C50 个D51 个答案 B解析 由题意知
4、x17.5,y39,代入回归直线方程得a109,10915449,故选B.4(2014湖北)根据如下样本数据x345678y4.02.50.50.52.03.0得到的回归方程为ybxa,则()Aa0,b0Ba0,b0Ca0Da0,b0答案 B解析 画出散点图,观察图象知 b0,选 B.5(2014山东潍坊二模)为了普及环保知识,增强环保意识,某大学从理工类专业的 A 班和文史类专业的 B 班各抽取 20 名同学参加环保知识测试统计得到成绩与专业的列联表:优秀非优秀总计A 班14620B 班71320总计211940附:参考公式及数据:(1)统计量:2nadbc2abcdacbd(nabcd)(
5、2)独立性检验的临界值表:P(2k0)0.0500.010k03.8416.635则下列说法正确的是()A有 99%的把握认为环保知识测试成绩与专业有关B有 99%的把握认为环保知识测试成绩与专业无关C有 95%的把握认为环保知识测试成绩与专业有关D有 95%的把握认为环保知识测试成绩与专业无关答案 C解析 2401413762202021194.912,38412b,aaBbb,aaC.baDbb,aa答案 C解析 由两组数据(1,0)和(2,2)可求得直线方程为 y2x2,b2,a2.而利用线性回归方程的公式与已知表格中的数据,可求得bi16xiyi6 x yi16x2i 6 x 2586
6、72136916722 57,ayb x136 577213,所以ba.(理)(2014江西)某人研究中学生的性别与成绩、视力、智商、阅读量这 4 个变量之间的关系,随机抽查 52 名中学生,得到统计数据如表 1 至表 4,则与性别有关联的可能性最大的变量是()表 1 成绩性别 不及格及格总计男61420女102232总计163652表 2 视力性别 好差总计男41620女122032总计163652表 3 智商性别 偏高正常总计男81220女82432总计163652表 4 阅读量性别丰富不丰富总计男14620女23032总计163652A成绩B视力C智商D阅读量答案 D解析 A 中,K25
7、26221014220321636 131440;B 中,K2524201216220321636637360;C 中,K2528248122203216361310;D 中,K2521430262203216363757160.因此阅读量与性别相关的可能性最大,所以选 D.二、填空题7某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表:专业性别 非统计专业统计专业男1310女720为 了 判 断 主 修 统 计 专 业 是 否 与 性 别 有 关 系,根 据 表 中 的 数 据,得 到 2 5013201072232720304.844.因为 23.841,所以判定主
8、修统计专业与性别有关系,那么这种判断出错的可能性为_答案 5%解析 根据独立性检验临界值表可知“x 与 y 有关系”的可信度,P(23.841)0.05,有 95%的可能认为 x 与 y 有关系,即判断出错的可能性为 5%.8(2013唐山统一考试)考古学家通过始祖鸟化石标本发现:其股骨长度 x(cm)与肱骨长度 y(cm)的线性回归方程为y1.197x3.660,由此估计,当股骨长度为 50cm 时,肱骨长度的估计值为_cm.答案 56.19解析 y1.197503.6656.19(cm)9(2014广东韶关二模)某市居民 20092013 年家庭年平均收入 x(单位:万元)与年平均支出 y
9、(单位:万元)的统计资料如下表所示:年份20092010201120122013收入 x11.512.11313.315支出 y6.88.89.81012根据统计资料,居民家庭年平均收入的中位数是_,家庭年平均收入与年平均支出有_线性相关关系答案 13 正解析 由中位数的定义知,奇数个数时按大小顺序排列后中间一个是中位数,即中位数是 13.由相关性知识,根据统计资料可以看出,当年平均收入增多时,年平均支出也增多,因此两者之间具有正线性相关关系三、解答题10(2014新课标)某地区 2007 年至 2013 年农村居民家庭纯收入 y(单位:千元)的数据如下表:年份2007200820092010
10、201120122013年份代号 t1234567人均纯收入 y2.93.33.64.44.85.25.9(1)求 y 关于 t 的线性回归方程;(2)利用(1)中的回归方程,分析 2007 年至 2013 年该地区农村居民家庭人均纯收入的变化情况,并预测该地区 2015 年农村居民家庭人均纯收入附:回归直线的斜率和截距的最小二乘法估计公式分别为:bni1 ti t yi y ni1 ti t 2,a y b t解析(1)由所给数据计算得t 17(1234567)4,y 17(2.93.33.64.44.85.25.9)4.3,i17(ti t)2941014928,i17(ti t)(yi
11、y)(3)(1.4)(2)(1)(1)(0.7)00.110.520.931.614,bi17ti tyi yi17ti t214280.5,a yb t4.30.542.3,所求回归方程为y0.5t2.3.(2)由(1)知,b0.50,故 2007 年至 2013 年该地区农村居民家庭人均纯收入逐年增加,平均每年增加 0.5 千元将 2015 年的年份代号 t9 代入(1)中的回归方程,得y0.592.36.8,故预测该地区 2015 年农村居民家庭人均纯收入为 6.8 千元.一、选择题11从某高中随机选取 5 名高三男生,其身高和体重的数据如下表所示:身高 x(cm)16016517017
12、5180体重 y(kg)6366707274根据上表可得回归直线方程y0.56xa,据此模型预报身高为 172cm 的高三男生的体重为()A70.09kgB70.12kgC70.55kgD71.05kg答案 B解析 x1601651701751805170,y6366707274569.回归直线过点(x,y),将点(170,69)代入y0.56xa中得a26.2,回归直线方程y0.56x26.2,代入 x172cm,则其体重为 70.12kg.二、填空题12(2013乌鲁木齐第一次诊断)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了 5 次试验根据收集到的数据(如下表),由最
13、小二乘法求得回归直线方程y0.67x54.9.零件数 x(个)1020304050加工时间 y(min)62758189表中一个数据模糊不清,经推断,该数据的值为_答案 68解析 设模糊不清部分的数据为 m,x1020304050530,由y0.67x54.9 过点(x,y)得,y0.673054.975,所以62m758189575,m68.三、解答题13(文)(2014河南安阳一模)某班主任对全班 50 名学生的学习积极性和对待班级工作的态度进行了调查,统计数据如下表所示:积极参加班级工作不太主动参加班级工作合计学习积极性高18725学习积极性一般61925合计242650(1)如果随机抽
14、查这个班的一名学生,那么抽到积极参加班级工作的学生的概率是多少?抽到不太主动参加班级工作且学习积极性一般的学生的概率是多少?(2)试运用独立性检验的思想方法分析学生的学习积极性与对待班级工作的态度是否有关,并说明理由解析(1)积极参加班级工作的学生有 24 名,总人数为 50 名,概率为24501225.不太主动参加班级工作且学习积极性一般的学生有 19 名,总人数为 50 名,概率为1950.(2)K25018196722525242615013 11.5,K210.828,有 99.9%的把握认为学习积极性与对待班级工作的态度有关系(理)(2014河北冀州中学检测)通过随机询问某校 110
15、 名高中学生在购买食物时是否看营养说明,得到如下的列联表:性别与看营养说明列联表 单位:名男女总计看营养说明503080不看营养说明102030总计6050110(1)从这 50 名女生中按是否看营养说明采取分层抽样,抽取一个容量为 5 的样本,问样本中看与不看营养说明的女生各有多少名?(2)从(1)中的 5 名女生中随机选取两名作深度访谈,求选到看与不看营养说明的女生各一名的概率(3)根据以上列联表,问有多大把握认为“性别与在购买食物时看营养说明”有关?P(K2k0)0.1000.0500.0250.010k02.7063.8415.0246.635K2nadbc2abcdacbd解析(1)
16、根据分层抽样可得:样本中看营养说明的女生有 550303 名,样本中不看营养说明的女生有 550202 名(2)在 5 名女生中不看营养说明的有 2 人,从中抽取 2 名,看与不看营养说明的女生各一名的概率为 PC12C13C25 35.(3)根据题中的列联表得 K21105020301028030605053972 7.486,P(K26.635)0.010,有 99%的把握认为该校高中学生“性别与在购买食物时看营养说明”有关14某中学将 100 名高一新生分成水平相同的甲、乙两个“平行班”,每班 50 人陈老师采用 A、B 两种不同的教学方式分别在甲、乙两个班级进行教改实验为了了解教学效果
17、,期末考试后,陈老师分别从两个班级中各随机抽取 20 名学生的成绩进行统计,作出茎叶图如下记成绩不低于 90 分者为“成绩优秀”.甲乙693 6 7 9 99 5 1 080 1 5 69 9 4 4 273 4 5 8 8 88 8 5 1 1 060 7 74 3 3 252 5(1)在乙班样本中的 20 个个体中,从不低于 86 分的成绩中随机抽取 2 个,求抽出的两个均“成绩优秀”的概率;(2)由以上统计数据填写下面列联表,并判断是否有 90%的把握认为:“成绩优秀”与教学方式有关.甲班(A 方式)乙班(B 方式)总计成绩优秀成绩不优秀总计附:2nadbc2abcdacbdP(2k)0
18、.250.150.100.050.0250.010.0050.001k1.3232.0722.7063.8415.0246.6357.87910.828解析(1)设“抽出的两个均成绩优秀”为事件 A.从不低于 86 分的成绩中随机抽取 2 个的基本事件为(86,93),(86,96),(86,97),(86,99),(86,99),(93,96),(93,97),(93,99),(93,99),(96,97),(96,99),(96,99),(97,99),(97,99),(99,99),共 15 个而事件 A 包含基本事件:(93,96),(93,97),(93,99),(93,99),(9
19、6,97),(96,99),(96,99),(97,99),(97,99),(99,99),共 10 个所以所求概率为 P(A)101523.(2)由已知数据得甲班(A 方式)乙班(B 方式)总计成绩优秀156成绩不优秀191534总计202040根据列联表中数据得,240115519263420203.137,由于 3.1372.706,所以有 90%的把握认为“成绩优秀”与教学方式有关15(2014四川内江三模)在每年的春节后,某市政府都会发动公务员参与到植树活动中去为保证树苗的质量,该市林管部门都会在植树前对树苗进行检测现从甲、乙两种树苗中各抽测了 10 株树苗的高度,量出树苗的高度如下
20、(单位:厘米):甲:37,21,31,20,29,19,32,23,25,33;乙:10,30,47,27,46,14,26,10,44,46.(1)根据抽测结果,完成下列的茎叶图,并根据你填写的茎叶图,对甲、乙两种树苗的高度作比较,写出两个统计结论;(2)设抽测的 10 株甲种树苗高度平均值为 x,将这 10 株树苗的高度依次输入按程序框图进行的运算,问输出的 S 大小为多少?并说明 S 的统计学意义甲乙1234解析(1)茎叶图:甲乙910 4 09 5 3 1 026 71 2 3 73044 6 6 7统计结论:甲种树苗的平均高度小于乙种树苗的平均高度;甲种树苗比乙种树苗长得更整齐;甲种树苗的中位数为 27,乙种树苗的中位数为 28.5;甲种树苗的高度基本上是对称的,而且大多数集中在均值附近,乙种树苗的高度分布较为分散(2)x372131202919322325331027,S35.S 表示 10 株甲种树苗高度的方差,是描述树苗高度离散程度的量S 值越小,表示树苗长得越整齐,S 值越大,表示树苗长得越参差不齐