1、模块综合提升 核 心 知 识 回 顾 一、统计案例1线性回归方程 对于一组具有线性相关关系的数据(x1,y1),(x2,y2),(xn,yn),回归直线ybxa的斜率和截距的最小二乘估计公式分别为 b_ ,a y b x,其中_称为样本点的中心i1nxi x yi y i1nxi x 2i1nxiyin xyi1nx2in x 2(x,y)2线性回归模型为 ybxae,其中为随机误差3残差ei.yiyie4刻画回归效果的方式(1)残差平方和法残差平方和i1n(yiyi)2 越,模型拟合效果越好(2)残差图法残差图形成的带状区域的宽度越,模型拟合效果越好(3)相关指数 R2 法R2 越接近,模型
2、拟合效果越好小窄15K2 公式 K2 ,其中 nabcd.nadbc2acbdabcd二、推理与证明1合情推理(1)归纳推理:由到、由到的推理(2)类比推理:由到的推理(3)合情推理:归纳推理和类比推理是常用的合情推理,都是根据已有的事实,经过观察、分析、比较、联想,再进行归纳、类比,然后提出猜想的推理部分整体个别一般特殊特殊2演绎推理(1)演绎推理是由到的推理(2)是演绎推理的一般模式,包括:已知的一般原理;所研究的特殊情况;根据一般原理,对特殊情况做出的判断一般特殊三段论大前提小前提结论3直接证明与间接证明(1)直接证明的两类基本方法是和:综合法是从推导出的证明方法;分析法是由追溯到的证明
3、方法(2)间接证明一种方法是,它是从成立出发,推出矛盾的证明方法综合法分析法条件结论结论条件反证法结论反面三、数系的扩充与复数的引入1复数的有关概念及分类(1)代数形式为 zabi(a,bR),其中实部为,虚部为;(2)共轭复数为 z abi(a,bR)ba(3)复数的分类 若 zabi(a,bR)是实数,则 z 与 z的关系为.若 z a bi(a,bR)是 纯 虚 数,则 z 与 z 的 关 系 为_(z0)zzzz02与复数运算有关的问题(1)复数相等的充要条件abicd i,bd(a,b,c,dR)(2)复数的模复数 zabi 的模|z|,且 z z|z|2.a2b2a2b2ac(3)
4、复数的四则运算,若两个复数 z1a1b1i,z2a2b2i(a1,b1,a2,b2R)加法:z1z2(a1a2)(b1b2)i;减法:z1z2(a1a2)(b1b2)i;乘法:z1z2(a1a2b1b2)(a1b2a2b1)i;除法:z1z2a1a2b1b2a2b1a1b2ia22b22a1a2b1b2a22b22a2b1a1b2a22b22i(z20)3复数的几何意义(1)任何一个复数 zabi 一一对应着复平面内一个点 Z(a,b),也一一对应着一个从原点出发的向量OZ.(2)复数加法的几何意义若复数 z1、z2 对应的向量OZ1、OZ2 不共线,则复数 z1z2 是以OZ1、OZ2 为两
5、邻边的平行四边形的对角线OZ所对应的复数(3)复数减法的几何意义复数 z1z2 是连接向量OZ1、OZ2 的终点,并指向 Z1 的向量所对应的复数四、框图1流程图(1)流程图是由一些和构成的图示(2)流程图是动态图示,包括框图、流程图、生活中的流程图等(3)流程图一般按照从到,从到的顺序来观察图形符号文字说明程序工序左右上下2结构图(1)结构图是一种静态图示,是一种描述系统结构的图示结构图一般由构成系统的和表达关系的连线(或方向箭头)构成连线通常按照、的方向(方向箭头按照箭头所指的方向)表示要素的关系或关系逻辑的先后若干要素各要素之间从上到下 从左到右从属(2)常见结构图 知识结构图:描述各部
6、分知识之间的关系.组织结构图:表示一个组织或部门的构成.(3)结构图中的从属关系通常是“树”形结构的,即构成系统的要素一般至少有一个“上位”或“下位”要素一般情况下,“”要素比“”要素更为具体,“”要素比“”要素更为抽象下位上位上位下位(4)在结构图中也经常出现一些“环”形结构,这种情形常在表达关系时出现(5)结构图还经常用来表示一个组织的构成,组织结构图一般呈“”形结构树逻辑先后易 错 易 混 辨 析 1回归方程ybxa中的b表示当 x 每增加一个单位时,y的变化量()2R2 越大,残差平方和越小,即模型的拟合效果越好;R2 越小,残差平方和越大,即模型的拟合效果越差()3散点图是判断两个变
7、量是否有相关关系的工具之一()4若一组样本数据(x1,y1),(x2,y2),(xn,yn)都在直线 yx1 上,则这组样本数据的样本相关系数为 1.()5回归直线ybxa不一定过点(x,y)()6在独立性检验中,当 K26.635 时,我们有 99%的把握认为两分类变量有关,是指“两分类变量有关”这一结论的可信度为99%,而不是两分类变量有关系的概率为 99%.()7独立性检验的基本思想类似于反证法()8类比推理得到的结论可作为定理应用()9由个别到一般的推理为归纳推理()10在类比时,平面中的三角形与空间中的平行六面体作为类比对象较为合适()11在演绎推理中,大前提描述的是一般性原理,小前
8、提描述的是大前提里的特殊情况,结论是根据一般性原理对特殊情况作出的判断()12大前提和小前提都正确,推理形式也正确,则所得结论是正确的()13综合法是执因索果的顺推证法()14分析法的框图表示 ()15分析法与综合法证明同一问题时,一般思路恰好相反,过程相逆()16反证法是从结论的反面出发,推出矛盾的证法()17反证法证明“a,b,c 中存在偶数”的假设为“a,b,c 都不是偶数”()18复数 zbi 是纯虚数()19若 z0 且 zz0,则 z 为纯虚数,利用这个性质,可证明一个复数为纯虚数()20在复平面内,虚轴上的点所对应的复数都是纯虚数()21复数的模一定是正数()22两个复数的模相等
9、是这两个复数相等的必要条件()23复数 z1z2 的充要条件是|z1|z2|.()24当两个复数互为共轭复数时,它们的乘积是一个实数()25复数加法的几何意义就是向量加法的平行四边形法则()26组织结构图是结构图的一种()27结构图可描述一个系统各部分或各环节之间的关系()28工序流程图中,各工序之间可以相互调换()29“随机事件频率概率”这是流程图()30程序框图不属于流程图()高 考 真 题 感 悟 1设 z1i1i2i,则|z|()A0 B12C1 D 2C 法一:因为 z1i1i2i1i21i1i2i i2ii,所以|z|1,故选 C.法二:因为 z1i1i2i1i2i1i1i1i1i
10、,所以|z|1i1i|1i|1i|221,故选 C.2甲、乙、丙、丁四位同学一起去向老师询问成语竞赛的成绩老师说:你们四人中有 2 位优秀,2 位良好,我现在给甲看乙、丙的成绩,给乙看丙的成绩,给丁看甲的成绩看后甲对大家说:我还是不知道我的成绩根据以上信息,则()A乙可以知道四人的成绩B丁可以知道四人的成绩C乙、丁可以知道对方的成绩D乙、丁可以知道自己的成绩D 由甲说:“我还是不知道我的成绩”可推知甲看到乙、丙的成绩为“1 个优秀,1 个良好”乙看丙的成绩,结合甲的说法,丙为“优秀”时,乙为“良好”;丙为“良好”时,乙为“优秀”,可得乙可以知道自己的成绩丁看甲的成绩,结合甲的说法,甲为“优秀”
11、时,丁为“良好”;甲为“良好”时,丁为“优秀”,可得丁可以知道自己的成绩 故选 D.3为计算 S1121314 199 1100,设计了如图所示的程序框图,则在空白框中应填入()Aii1Bii2Cii3Dii4B 由程序框图的算法功能知执行框 NN1i计算的是连续奇数的倒数和,而执行框 TT 1i1计算的是连续偶数的倒数和,所以在空白执行框中应填入的命令是 ii2,故选 B.4如图是某地区 2000 年至 2016 年环境基础设施投资额 y(单位:亿元)的折线图为了预测该地区 2018 年的环境基础设施投资额,建立了 y 与时间变量 t 的两个线性回归模型根据 2000 年至 2016 年的数
12、据(时间变量 t 的值依次为 1,2,17)建立模型:y30.413.5t;根据2010 年至 2016 年的数据(时间变量 t 的值依次为 1,2,7)建立模型:y9917.5t.(1)分别利用这两个模型,求该地区 2018 年的环境基础设施投资额的预测值;(2)你认为用哪个模型得到的预测值更可靠?并说明理由解(1)利用模型,该地区 2018 年的环境基础设施投资额的预测值为y30.413.519226.1(亿元)利用模型,该地区 2018 年的环境基础设施投资额的预测值为 y9917.59256.5(亿元)(2)利用模型得到的预测值更可靠 理由如下:()从折线图可以看出,2000 年至 2
13、016 年的数据对应的点没有随机散布在直线 y30.413.5t 上下,这说明利用 2000 年至 2016 年的数据建立的线性模型不能很好地描述环境基础设施投资额的变化趋势.2010 年相对 2009 年的环境基础设施投资额有明显增加,2010 年至2016 年的数据对应的点位于一条直线的附近,这说明从 2010 年开始环境基础设施投资额的变化规律呈线性增长趋势,利用 2010 年至 2016 年的数据建立的线性模型y9917.5t 可以较好地描述 2010 年以后的环境基础设施投资额的变化趋势,因此利用模型得到的预测值更可靠()从计算结果看,相对于 2016 年的环境基础设施投资额 220
14、亿元,由模型得到的预测值 226.1 亿元的增幅明显偏低,而利用模型得到的预测值的增幅比较合理,说明利用模型得到的预测值更可靠(以上给出了 2 种理由,答出其中任意一种或其他合理理由均可)5为了监控某种零件的一条生产线的生产过程,检验员每隔 30 min 从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm)下面是检验员在一天内依次抽取的 16 个零件的尺寸:抽取次序12345678 零件尺寸9.9510.129.969.9610.019.929.9810.04 抽取次序910111213141516 零件尺寸 10.269.9110.1310.029.2210.0410.059.95经计算
15、得 x 11616i1xi9.97,s11616i1xi x211616i116x 20.212,16i1i8.5218.439,16i1(xi x)(i8.5)2.78,其中 xi 为抽取的第 i 个零件的尺寸,i1,2,16.(1)求(xi,i)(i1,2,16)的相关系数 r,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若|r|0.25,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小)(2)一天内抽检零件中,如果出现了尺寸在(x 3s,x 3s)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查(i)从这
16、一天抽检的结果看,是否需对当天的生产过程进行检查?()在(x3s,x3s)之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差(精确到 0.01)附:样本(xi,yi)(i1,2,n)的相关系数 r0.0080.09.解(1)由样本数据得(xi,i)(i1,2,16)的相关系数 r16i1 xixi8.516i1 xix216i1 i8.522.780.212 1618.4390.18.由于|r|0.25,因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(2)(i)由于 x 9.97,s0.212,因此由样本数据可以看出抽取的第 13 个零件的
17、尺寸在(x3s,x3s)以外,因此需对当天的生产过程进行检查()剔除离群值,即第 13 个数据,剩下数据的平均数为 115(169.979.22)10.02,这条生产线当天生产的零件尺寸的均值的估计值为 10.02.16i1x2i160.2122169.9721 591.134,剔除第 13 个数据,剩下数据的样本方差为 115(1 591.1349.2221510.022)0.008,这条生产线当天生产的零件尺寸的标准差的估计值为 0.0080.09.6某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式为比较两种生产方式的效率,选取40 名工人,将他们随机分成两
18、组,每组 20 人第一组工人用第一种生产方式,第二组工人用第二种生产方式根据工人完成生产任务的工作时间(单位:min)绘制了如图所示的茎叶图:(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;(2)求 40 名工人完成生产任务所需时间的中位数 m,并将完成生产任务所需时间超过 m 和不超过 m 的工人数填入下面的列联表:超过 m 不超过 m 第一种生产方式第二种生产方式(3)根据(2)中的列联表,能否有 99%的把握认为两种生产方式的效率有差异?附:K2nadbc2abcdacbd,解(1)第二种生产方式的效率更高 理由如下:()由茎叶图可知:用第一种生产方式的工人中,有 75%的工人完
19、成生产任务所需时间至少 80 分钟,用第二种生产方式的工人中,有 75%的工人完成生产任务所需时间至多 79 分钟因此第二种生产方式的效率更高()由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为 85.5 分钟,用第二种生产方式的工人完成生产任务所需时间的中位数为 73.5 分钟因此第二种生产方式的效率更高()由茎叶图可知:用第一种生产方式的工人完成生产任务平均所需时间高于 80 分钟;用第二种生产方式的工人完成生产任务平均所需时间低于 80 分钟因此第二种生产方式的效率更高()由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎 8 上的最多,关于茎 8 大致呈
20、对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎 7 上的最多,关于茎 7大致呈对称分布又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少因此第二种生产方式的效率更高(以上给出了 4 种理由,答出其中任意一种或其他合理理由均可)(2)由茎叶图知 m7981280.列联表如下:超过 m 不超过 m 第一种生产方式155 第二种生产方式515(3)由于 K240151555220202020 106.635,所以有 99%的把握认为两种生产方式的效率有差异Thank you for watching!