1、概率统计中的数学建模与数据分析授课提示:对应学生用书第251页概率统计中的创新性问题是高考的命题重点,不仅注重模块知识内的综合,也注重模块知识间的综合,更多地体现对数学建模与数据分析核心素养的考查命题的重点有:(1)考查数学建模核心素养,以实际生活中的环保、民生、科技等为背景,考查函数、数列等模型的建立,其中求解这些实际问题的最优化是近年高考命题的热点(2)考查数据分析核心素养,常考查对数据的搜集与归类,并利用不同的特征值对研究对象做出理性的判断(一)概率与数列交汇问题例1(2021湖北武汉质量监测)武汉又称江城,是湖北省省会,它不仅有着深厚的历史积淀与丰富的民俗文化,更有着众多名胜古迹与旅游
2、景点,黄鹤楼与东湖便是其中的两个为合理配置旅游资源,现对已参观黄鹤楼景点的游客进行随机问卷调查,若不游玩东湖记1分,若继续游玩东湖记2分,每位游客选择是否参观东湖的概率均为,游客之间选择意愿相互独立(1)从游客中随机抽取3人,记这3人的总得分为随机变量X,求X的分布列与数学期望;(2)()若从游客中随机抽取m(mN)人,记这m人的总分恰为m分的概率为Am,求数列Am的前10项和;()在对所有游客进行随机问卷调查的过程中,记已调查过的人的累计得分恰为n分的概率为Bn,探讨Bn与Bn1(n2)之间的关系,并求数列Bn的通项公式解析(1)X的所有可能取值为3,4,5,6P(X3),P(X4)C,P(
3、X5)C,P(X6)所以X的分布列为X3456P所以EX3456(2)()总分恰为m分的概率Am,所以数列Am是首项为,公比为的等比数列其前10项和S10()因为已调查过的人的累计得分恰为n分的概率为Bn,得不到n分的情况只有先得(n1)分,再得2分,概率为Bn1(n2)所以1BnBn1(n2),即BnBn11(n2),所以Bn(n2),所以Bn,易知B1,所以Bn破解此题的关键:一是认真审题,判断随机变量的所有可能取值,并注意相互独立事件的概率与互斥事件的概率的区别,求出随机变量取各个值时的概率,从而列出随机变量的分布列;二是将概率的参数表达式与数列的递推式相结合,可得数列的通项公式,此种解
4、法新颖独特(二)函数与期望相交汇应用例2(2021重庆一中模拟)某蛋糕店制作并销售一款蛋糕,制作一个蛋糕成本3元,且以8元的价格出售,若当天卖不完,剩下的无偿捐献给饲料加工厂根据以往100天的资料统计,得到如下需求量表该蛋糕店一天制作了这款蛋糕X(XN)个,以x(单位:个,100x150,xN)表示当天的市场需求量,T(单位:元)表示当天出售这款蛋糕获得的利润需求量/个100,110)110,120)120,130)130,140)140,150天数1525302010(1)当x135时,若X130时该蛋糕店获得的利润为T1,X140时该蛋糕店获得的利润为T2,试比较T1和T2的大小(2)当X
5、130时,根据上表,从利润T不少于570元的天数中,按需求量用分层抽样的方法抽取6天()求此时利润T关于市场需求量x的函数解析式,并求这6天中利润为650元的天数;()再从这6天中抽取3天做进一步分析,设这3天中利润为650元的天数为,求随机变量的分布列及数学期望解析(1)当X130时,T1130(83)650(元);当X140时,T2135535660(元)所以T2T1(2)()当X130时,利润T令T570,得120x150,所以利润T不少于570元的共有60天,其中有30天的利润为650元故按需求量用分层抽样的方法抽取的6天中利润为650元的天数为63()由题意可知0,1,2,3,P(0
6、),P(1),P(2),P(3)故的分布列为0123P所以E0123破解此题的关键:一是要注意分类讨论、明确分类标准二是注意数据分析与处理(三)概率与统计的开放性问题例3(2021郑州一测)水污染情况与工业废水排放密切相关,某工厂污水处理程序如下原始污水必须先经过A系统处理,处理后的污水(A级水)达到环保标准(简称达标)的概率为p(0p1),A级水经化验后,若确认达标便可直接排放,若不达标则必须通过B系统处理后再排放该厂现有4个标准水量的A级水池,需要分别取样、化验已知多个污水样本化验时,既可以逐个化验,也可以将若干个样本混合在一起化验混合样本中只要有样本不达标,则混合样本的化验结果必不达标若
7、混合样本不达标,则该组中各个样本必须再逐个化验;若混合样本达标,则原水池的污水可直接排放现有以下四种化验方案方案一:逐个化验方案二:平均分成两组,每组的两个样本混在一起化验方案三:三个样本混在一起化验,剩下的一个单独化验方案四:四个样本混在一起化验化验次数的期望值越小,则方案越“优”(1)若p,求将2个A级水样本混合化验,结果不达标的概率;(2)()若p,现有4个A级水样本需要化验,请问方案一、二、四中哪个最“优”?()化验4个A级水样本,若方案三比方案四更“优”,求p的取值范围解析(1)该混合样本达标的概率是,所以不达标的概率为1(2)()方案一:逐个化验,化验次数14方案二:由(1)知,分
8、成的每组的两个样本化验时,若达标,则化验次数为1,概率为,若不达标,则化验次数为3,概率为记方案二的化验次数为2,则2的可能取值为2,4,6列出其分布列如下2246P可求得方案二的期望为E2246方案四:混在一起化验,记化验次数为4,则4的可能取值为1,5列出其分布列如下415P可求得方案四的期望为E415比较可得E4E24,故选择方案四最“优”()方案三:设化验次数为3,则3的可能取值为2,5列出3的分布列如下325Pp31p3E32p35(1p3)53p3方案四:设化验次数为4,则4的可能取值为1,5列出4的分布列如下415Pp41p4E4p45(1p4)54p4由题意得E3E4,故53p
9、354p4,解得p故当0p时,方案三比方案四更“优”求解此题时易出现的问题有两个:一是不能根据事件性质正确建立目标代数式;二是不能根据题意分析交换顺序对数学期望的影响,从而无法根据三个概率的大小关系比较数学期望的大小对点训练(2021鄂东南九校期中联考)世界军人运动会,简称“军运会”,是国际军事体育理事会主办的全球军人最高规格的大型综合性运动会,每四年举办一届,会期7至10天,规模仅次于奥运会,是和平时期各国军队展示实力形象、增进友好交流、扩大国际影响的重要平台,被誉为“军人奥运会”第七届世界军人运动会于2019年10月18日至2019年10月27日在中国武汉举行,赛期10天,共设置射击、游泳
10、、田径、篮球等27个大项、329个小项其中,空军五项、军事五项、海军五项、定向越野和跳伞五个项目为军事特色项目,其他项目为奥运项目现对某国军人在射击比赛预赛中的得分数据进行分析,得到如图所示的频率分布直方图(得分均在180到430内)(1)估计该国军人在射击比赛预赛中得分的平均数 (同一组中的数据用该组区间的中点值作代表);(2)根据大量的射击比赛得分,可以认为射击比赛得分x近似地服从正态分布N(,2),若第(1)问中样本的标准差s的近似值为50,用样本的平均数作为的近似值,用样本的标准差s作为的估计值,求射击比赛得分x恰在350到400内的概率;参考数据:若随机变量服从正态分布N(,2),则
11、P()0682 7,P(22)0954 5,P(33)0997 3(3)某汽车销售公司在军运会期间推广一款新能源汽车,面向客户推出“玩游戏,送大奖”活动,客户可根据抛掷骰子的结果,操控微型遥控车在方格图上行进,若遥控车最终停在“胜利大本营”,则可获得购车优惠券已知骰子出现点数1,2,3,4,5,6的概率都是,方格图上标有第0格,第1格,第2格,第50格,遥控车开始在第0格,客户每抛掷一次骰子,遥控车向前移动一次,若抛掷出的骰子正面向上的点数是1,2,3,4,5,遥控车向前移动一格(从k到k1),若抛掷出的骰子正面向上的点数是6,遥控车向前移动两格(从k到k2),直到遥控车移动到第49格(胜利大
12、本营)或第50格(失败大本营)时,游戏结束设遥控车移动到第n格的概率为pn,试证明pnpn1(1n49,nN)是等比数列,并求出p50,再根据p50的值解释这种游戏方案对意向客户是否具有吸引力解析:(1)000250205000450255000950305000450355000150405300,故估计该国军人在射击比赛预赛中得分的平均数为300(2)因为xN(300,502),所以P(350x400)(0954 50682 7)0135 9(3)遥控车开始在第0格为必然事件,故p01第一次抛掷骰子,若正面向上不出现6点,则遥控车移动到第1格,概率为,即p1遥控车移动到第n(2n49,nN)格的情况只有如下两种:遥控车先移动到第n2格,再抛掷骰子,出现正面向上的点数为6,概率为pn2;遥控车先移动到第n1格,抛掷骰子,出现正面向上的点数不是6,概率为pn1因此pnpn2pn1,则pnpn1(pn1pn2),故当1n49时,pnpn1是首项为p1p0,公比为的等比数列,故pnpn1因为pnp0(p1p0)(p2p1)(pnpn1)1,p50p48易知p50,p491p50,故这种游戏方案使得参与客户中奖的可能性较大,对意向客户有吸引力