1、1算法与程序框图名称内容顺序结构条件结构循环结构定义由若干个依次执行的步骤组成,这是任何一个算法都离不开的基本结构算法的流程根据条件是否成立有不同的流向,条件结构就是处理这种过程的结构从某处开始,按照一定的条件反复执行某些步骤的结构,反复执行的步骤称为循环体程序框图2.简单随机抽样(1)定义:一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(nN),且每次抽取时各个个体被抽到的机会都相等,就称这样的抽样方法为简单随机抽样(2)常用方法:抽签法和随机数法3系统抽样(1)步骤:先将总体的N个个体编号;根据样本容量n,当是整数时,取分段间隔k;在第1段用简单随机抽样确定第一个个体
2、编号l(lk);按照一定的规则抽取样本(2)适用范围:适用于总体中的个体数较多时4分层抽样(1)定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样(2)适用范围:适用于总体由差异比较明显的几个部分组成时5统计图表(1)频率分布直方图的画法步骤求极差(即一组数据中最大值与最小值的差);决定组距与组数;将数据分组;列频率分布表;画频率分布直方图(2)频率分布折线图和总体密度曲线频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图总体密度曲线:随着样本容量的增加,作图时所分
3、组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线(3)茎叶图的画法步骤第一步:将每个数据分为茎(高位)和叶(低位)两部分;第二步:将最小茎与最大茎之间的数按大小次序排成一列;第三步:将各个数据的叶依次写在其茎的两侧6样本的数字特征(1)众数:一组数据中出现次数最多的那个数据,叫做这组数据的众数(2)中位数:把n个数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数(3)平均数:把称为a1,a2,an这n个数的平均数(4)标准差与方差:设一组数据x1,x2,x3,xn的平均数为,则这组数据的标准差和方差分别
4、是ss2(x1)2(x2)2(xn)27两个变量的线性相关(1)从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有线性相关关系,这条直线叫回归直线(2)从散点图上看,点分布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关,点分布在左上角到右下角的区域内,两个变量的相关关系为负相关(3)回归方程为x,其中,.(4)相关系数r当r0时,表明两个变量正相关;当r0时,表明两个变量负相关r的绝对值越接近于1,表明两个变量的线性相关性越强r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系,通常|r|大于0.75时,认为两个变量有很强的线性相
5、关性8概率与频率(1)在相同的条件S下重复n次试验,观察某一事件A是否出现,称n次试验中事件A出现的次数nA为事件A出现的频数,称事件A出现的比例fn(A)为事件A出现的频率(2)对于给定的随机事件A,由于事件A发生的频率fn(A)随着试验次数的增加稳定于概率P(A),因此可以用频率fn(A)来估计概率P(A)9事件的关系与运算定义符号表示包含关系如果事件A发生,则事件B一定发生,这时称事件B包含事件A(或称事件A包含于事件B)BA(或AB)相等关系若BA且AB,那么称事件A与事件B相等AB并事件(和事件)若某事件发生当且仅当事件A发生或事件B发生,则称此事件为事件A与事件B的并事件(或和事件
6、)AB(或AB)交事件(积事件)若某事件发生当且仅当事件A发生且事件B发生,则称此事件为事件A与事件B的交事件(或积事件)AB(或AB)互斥事件若AB为不可能事件,那么称事件A与事件B互斥AB对立事件若AB为不可能事件,AB为必然事件,那么称事件A与事件B互为对立事件AB且AB10.概率的几个基本性质(1)概率的取值范围:0P(A)1.(2)必然事件的概率:P(A)1.(3)不可能事件的概率:P(A)0.(4)概率的加法公式如果事件A与事件B互斥,则P(AB)P(A)P(B)(5)对立事件的概率若事件A与事件B互为对立事件,则AB为必然事件P(AB)1,P(A)1P(B)11古典概型(1)特点
7、试验中所有可能出现的基本事件只有有限个,即有限性每个基本事件发生的可能性相等,即等可能性(2)概率公式P(A).12几何概型(1)如果每个事件发生的概率只与构成该事件区域的长度(面积或体积)成比例,则称这样的概率模型为几何概率模型,简称几何概型(2)几何概型的概率公式P(A).1算法只能解决一个问题,不能重复使用()2程序框图中的图形符号可以由个人来确定()3输入框只能紧接开始框,输出框只能紧接结束框()4条件结构的出口有两个,但在执行时,只有一个出口是有效的()5输入语句可以同时给多个变量赋值()6“当型”循环与“直到型”循环退出循环的条件不同()7在算法语句中,XX1是错误的()8简单随机
8、抽样是一种不放回抽样()9简单随机抽样每个个体被抽到的机会不一样,与先后有关()10抽签法中,先抽的人抽中的可能性大()11系统抽样在第1段抽样时采用简单随机抽样()12要从1 002个学生中用系统抽样的方法选取一个容量为20的样本,需要剔除2个学生,这样对被剔除者不公平()13分层抽样中,每个个体被抽到的可能性与层数及分层有关()14平均数、众数与中位数从不同的角度描述了一组数据的集中趋势()15一组数据的众数可以是一个或几个,那么中位数也具有相同的结论()16从频率分布直方图中得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了()17茎叶图一般左侧的叶按从大到小的顺序
9、写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次()18在频率分布直方图中,最高的小长方形底边中点的横坐标是众数()19在频率分布直方图中,众数左边和右边的小长方形的面积和是相等的()20“名师出高徒”可以解释为教师的教学水平与学生的水平成正相关关系()21通过回归直线方程x可以估计预报变量的取值和变化趋势()22在大量重复试验中,概率是频率的稳定值()23两个事件的和事件是指两个事件都得发生()24对立事件一定是互斥事件,互斥事件不一定是对立事件()25两互斥事件的概率和为1.()26掷一枚硬币两次,出现“两个正面”“一正一反”“两个反面”,这三个结果是等可能事件()27从3,2,1,
10、0,1,2中任取一数,取到的数小于0与不小于0的可能性相同()28利用古典概型的概率可求“在边长为2的正方形内任取一点,这点到正方形中心距离小于或等于1”的概率()29在几何概型定义中的区域可以是线段、平面图形、立体图形()30随机模拟方法是以事件发生的频率估计概率()1从2名男同学和3名女同学中任选2人参加社会服务,则选中的2人都是女同学的概率为()A0.6B0.5C0.4D0.3D将2名男同学分别记为x,y,3名女同学分别记为a,b,c.设“选中的2人都是女同学”为事件A,则从5名同学中任选2人参加社区服务的所有可能情况有(x,y),(x,a),(x,b),(x,c),(y,a),(y,b
11、),(y,c),(a,b),(a,c),(b,c),共10种,其中事件A包含的可能情况有(a,b),(a,c),(b,c),共3种,故P(A)0.3.故选D.2若某群体中的成员只用现金支付的概率为0.45,既用现金支付也用非现金支付的概率为0.15,则不用现金支付的概率为()A0.3B0.4C0.6D0.7B设“只用现金支付”为事件A,“既用现金支付也用非现金支付”为事件B,“不用现金支付”为事件C,则P(C)1P(A)P(B)10.450.150.4.故选B.3某公司有大量客户,且不同年龄段客户对其服务的评价有较大差异为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样
12、、分层抽样和系统抽样,则最合适的抽样方法是_分层抽样因为不同年龄段的客户对公司的服务评价有较大差异,所以需按年龄进行分层抽样,才能了解到不同年龄段的客户对公司服务的客观评价4某家庭记录了未使用节水龙头50天的日用水量数据(单位:m3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:未使用节水龙头50天的日用水量频数分布表日用水量0,0.1)0.1,0.2)0.2,0.3)0.3,0.4)0.4,0.5)0.5,0.6)0.6,0.7)频数13249265使用了节水龙头50天的日用水量频数分布表日用水量0,0.1)0.1,0.2)0.2,0.3)0.3,0.4)0.4,0.5)0.5,
13、0.6)频数151310165(1)在下图中作出使用了节水龙头50天的日用水量数据的频率分布直方图;(2)估计该家庭使用节水龙头后,日用水量小于0.35 m3的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表)解(1)(2)根据以上数据,该家庭使用节水龙头后50天日用水量小于0.35 m3的频率为0.20.110.12.60.120.050.48,因此该家庭使用节水龙头后,日用水量小于0.35 m3的概率的估计值为0.48.(3)该家庭未使用节水龙头50天日用水量的平均数为1(0.0510.1530.2520.3540
14、.4590.55260.655)0.48.该家庭使用了节水龙头后50天日用水量的平均数为2(0.0510.1550.25130.35100.45160.555)0.35.估计使用节水龙头后,一年可节省水(0.480.35)36547.45(m3)5如图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型根据2000年至2016年的数据(时间变量t的值依次为1,2,17)建立模型:30.413.5t;根据2010年至2016年的数据(时间变量t的值依次为1,2,7)建立模型:9917.5t.(
15、1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;(2)你认为用哪个模型得到的预测值更可靠?并说明理由解(1)利用模型,该地区2018年的环境基础设施投资额的预测值为30.413.519226.1(亿元)利用模型,该地区2018年的环境基础设施投资额的预测值为9917.59256.5(亿元)(2)利用模型得到的预测值更可靠理由如下:(i)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y30.413.5t上下,这说明利用2000年至2016年的数据建立的线性模型不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型9917.5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型得到的预测值更可靠()从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型得到的预测值199.1亿元的增幅明显偏低,而利用模型得到的预测值的增幅比较合理,说明利用模型得到的预测值更可靠以上给出了2种理由,答出其中任意一种或其他合理理由均可