1、7.概率与统计 1.随机抽样方法 简单随机抽样、系统抽样、分层抽样的共同点是抽样过程中每个个体被抽取的机会相等,且是不放回抽样.回扣问题1 某社区现有480个住户,其中中等收入家庭200户,低收入家庭160户,其他为高收入家庭,在建设幸福社区的某次分层抽样调查中,高收入家庭被抽取了6户,则该社区本次抽取的总户数为_.解析 由抽样比例可知6x480200160480,则 x24.242.对于统计图表问题,求解时,最重要的就是认真观察图表,从中提取有用信息和数据.对于频率分布直方图,应注意的是图中的每一个小矩形的面积是数据落在该区间上的频率,茎叶图没有原始数据信息的损失,但数据很大或有多组数据时,
2、茎叶图就不那么直观、清晰了.回扣问题2 从某校高三年级随机抽取一个班,对该班50名学生的高校招生体检表中视力情况进行统计,其结果的频率分布直方图如图所示.若某高校A专业对视力的 要 求 在 0.9 以 上,则 该 班 学 生 中 能 报 A 专 业 的 人 数 为_.20 3.众数:在一组数据中,出现次数最多的数据叫做这组数据的众数.众数为频率分布直方图中最高矩形的底边中点的横坐标.中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.中位数为平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标.平均数:样本数据的算术平均数,即 x
3、1n(x1x2xn).平均数等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.标准差的平方就是方差,方差的计算(1)基本公式 s21n(x1 x)2(x2x)2(xn x)2.(2)简化计算公式s21n(x21x22x2n)n x 2,或写成 s21n(x21x22x2n)x 2,即方差等于原数据平方和的平均数减去平均数的平方.回扣问题3 已知一个样本中的数据为0.12,0.15,0.13,0.15,0.14,0.17,0.15,0.16,0.13,0.14,则该样本的众数、中位数分别是_.答案 0.15,0.145 4.变量间的相关关系假设我们有如下一组数据:(x1,y1)
4、,(x2,y2),(xn,yn).回归方程ybxa,其中1122211()()().nniiiiiinniiiixxyyx ynx ybxxxnxaybx(不需记忆)经检验,这组样本数据的两个变量x与y具有线性相关关系,那么对于加工零件的个数x与加工时间y这两个变量,下列判断正确的是()A.成正相关,其回归直线经过点(30,75)B.成正相关,其回归直线经过点(30,76)C.成负相关,其回归直线经过点(30,76)D.成负相关,其回归直线经过点(30,75)B 回扣问题 4 某工厂为了确定工效,进行了 5 次试验,收集数据如下:加工零件数 x(个)1020304050加工时间 y(分钟)64
5、697582905.独立性检验的基本方法 一般地,假设有两个分类变量X和Y,它们的取值分别为x1,x2和y1,y2,其样本频数列联表如表:y1y2总计x1ababx2cdcd总计ac bd abcd根据观测数据计算由公式 K2n(adbc)2(ab)(ac)(bd)(cd)所给出的检验随机变量 K2 的观测值 k,并且 k 的值越大,说明“X 与 Y 有关系”成立的可能性越大,可以利用数据来确定“X与 Y 有关系”的可信程度(公式不需记忆).回扣问题 5 通过随机询问 110 名性别不同的高中生是否爱好某项运动,得到如下的列联表:男女总计爱好402060不爱好203050总计6050110由
6、K2n(adbc)2(ab)(cd)(ac)(bd)算得 K2110(40302020)2605060507.8,附表:P(K2k)0.0500.0100.001k3.8416.63510.828参照附表,得到的正确结论是()A.有 99%以上的把握认为“爱好该项运动与性别有关”B.有 99%以上的把握认为“爱好该项运动与性别无关”C.在犯错误的概率不超过 0.1%的前提下,认为“爱好该项运动与性别有关”D.在犯错误的概率不超过 0.1%的前提下,认为“爱好该项运动与性别无关”A6.互斥事件有一个发生的概率P(AB)P(A)P(B).(1)公式适合范围:事件A与B互斥.(2)P()1P(A).
7、回扣问题6 某射手射击一次击中10环、9环、8环的概率分别是0.3,0.3,0.2,那么他射击一次不够8环的概率是_.答案 0.2 A7.古典概型P(A)mn(其中,n 为试验中可能出现的结果总数,m 为事件 A在试验中包含的基本事件个数).回扣问题 7 从 1,2,3,6,这 4 个数中一次随机地取 2 个数,则所取 2 个数的乘积为 6 的概率为_.答案 138.几何概型一般地,在几何区域 D 内随机地取一点,记事件“该点在其内部一个区域 d 内”为事件 A,则事件 A 发生的概率为P(A)d的度量D的度量.此处 D 的度量不为 0,其中“度量”的意义依 D 确定,当 D 分别是线段、平面
8、图形和立体图形时,相应的度量分别为长度、面积和体积等.即 P(A)回扣问题 8 在长为 12 cm 的线段 AB 上任取一点 C,现作一矩形,邻边长分别等于线段 AC,CB 的长,则该矩形面积大于 32 cm2 的概率为()A.16B.13C.23D.45B9.解排列、组合问题的依据是:分类相加、分步相乘、有序排列、无序组合.解排列、组合问题的规律是:相邻问题捆绑法;不相邻问题插空法;多排问题单排法;定位问题优先法;定序问题倍缩法;多元问题分类法;有序分配分步法;综合问题先选后排法;至多至少问题间接法.(1)排列数公式Amnn(n1)(n2)n(m1)n!(nm)!,其中 m,nN*,且 mn
9、.当 mn 时,Annn(n1)21n!,规定 0!1.(2)组合数公式C mn AmnAmm n(n1)(n2)n(m1)m!n!m!(nm)!.(3)组合数性质CmnCnmn,CmnCm1nCmn1,规定 C0n1,其中 m,nN*,mn.回扣问题9(1)6把椅子摆成一排,3人随机就座,任何两人不相邻的坐法种数为_.(2)从3名骨科、4名脑外科和5名内科医生中选派5人组成一个抗震救灾医疗小组,则骨科、脑外科和内科医生都至少有1人的选派方法种数是_(用数字作答).答案(1)24(2)390 10.二项式定理(1)定理:(ab)nC0nanC1nan1bCrnanrbrCn1nabn1Cnnb
10、n(nN*).通项(展开式的第 r1 项):Tr1Crnanrbr,其中 Crn(r0,1,n)叫做二项式系数.(2)二项式系数的性质在二项式展开式中,与首末两端“等距离”的两项的二项式系数相等,即 C0nCnn,C1nCn1n,C2nCn2n,CrnCnrn.二项式系数的和等于 2n(组合数公式),即C0nC1nC2nCnn2n.二项式展开式中,偶数项的二项式系数和等于奇数项的二项式系数和,即 C1nC3nC5nC0nC2nC4n2n1.特别提醒 二项式系数最大项与展开式系数最大项是两个不同的概念,在求法上也有很大的差别,往往因为概念不清导致出错.答案 41 回扣问题 10 设x 2x6的展
11、开式中 x3 的系数为 A,二项式系数为 B,则 AB_.11.要注意概率P(A|B)与P(AB)的区别:(1)在P(A|B)中,事件A,B发生有时间上的差异,B先A后;在P(AB)中,事件A,B同时发生.(2)样本空间不同,在P(A|B)中,事件B成为样本空间;在P(AB)中,样本空间仍为,因而有P(A|B)P(AB).回扣问题 11 设 A、B 为两个事件,若事件 A 和 B 同时发生的概率为 310,在事件 A 发生的条件下,事件 B 发生的概率为12,则事件 A 发生的概率为_.答案 35 12.求分布列,要检验概率的和是否为 1,如果不是,要重新检查修正.还要注意识别独立重复试验和二
12、项分布,然后用公式.如果事件 A 在一次试验中发生的概率是 p,那么它在 n 次独立重复试验中恰好发生 k 次的概率为 Pn(k)Cknpk(1p)nk.回扣问题 12 若随机变量 的分布列如下表,则 E()的值为_.012345P2x3x 7x2x3xx答案 20913.一般地,如果对于任意实数 ab,随机变量 X 满足 P(aXb)ab,(x)dx,则称 X 的分布为正态分布.正态分布完全由参数 和 确定,因此正态分布常记作 N(,2).如果随机变量 X服从正态分布,则记为 XN(,2).满足正态分布的三个基本概率的值是:P(X)0.682 6;P(2X2)0.954 4;P(3X3)0.997 4.回扣问题 13 已知随机变量 服从正态分布 N(2,2),且P(4)0.8,则 P(02)等于()A.0.6 B.0.4 C.0.3 D.0.2C