1、大题基础练(四)概率统计1随着智能手机的普及,使用手机上网成为人们日常生活的一部分,很多消费者对手机流量的需求越来越大长沙某通信公司为了更好地满足消费者对流量的需求,准备推出一款流量包该通信公司选了5个城市(总人数、经济发展情况、消费能力等方面比较接近)采用不同的定价方案作为试点,经过一个月的统计,发现该流量包的定价x:(单位:元/月)和购买人数y(单位:万人)的关系如表:流量包的定价/(元/月)3035404550购买人数/万人18141085(1)根据表中的数据,运用相关系数进行分析说明,是否可以用线性回归模型拟合y与x的关系?并指出是正相关还是负相关;(2)求出y关于x的回归方程;若该通
2、信公司在一个类似于试点的城市中将这款流量包的价格定位25元/ 月,请用所求回归方程预测长沙市一个月内购买该流量包的人数能否超过20万人参考数据:158,161,164.参考公式:相关系数r,回归直线方程x,其中,y() x().解:(1)根据题意,得x()(3035404550)40,y()(18141085)11.可列表如下i12345xix1050510yiy73136(xix)(yiy)701501560根据表格和参考数据,得 (xix()(yiy()160,161.因而相关系数r0.99.由于|r|0.99很接近1,因而可以用线性回归方程模型拟合y与x的关系. 由于rk)0.150.1
3、00.050.0250.0100.0050.001k2.0720.7063.8415.0246.6357.87910 828解:(1)因为男生人数为:12055,所以女生人数为1205565,于是可完成22列联表,如下:项目满意不满意总计男生302555女生501565总计8040120根据列联表中的数据,得到K2的观测值K26.7136.635,所以有99%的把握认为对“线上教育是否满意与性别有关”(2)由(1)可知男生抽3人,女生抽5人,依题可知的可能取值为0,1,2,3,并且服从超几何分布,P(k)(k0,1,2,3),即P(0),P(1),P(2),P(3).可得分布列为0123P可得
4、E()0123.3一饮料店制作了一款新饮料,为了进行合理定价先进行试销售,其单价x(元)与销量y(杯)的相关数据如下表:单价x(元)8.599.51010.5销量y(杯)120110907060(1)已知销量y与单价x具有线性相关关系,求y关于x的线性回归方程;(2)若该款新饮料每杯的成本为8元,试销售结束后,请利用(1)所求的线性回归方程确定单价定为多少元时,销售的利润最大?(结果四舍五入保留到整数)附:线性回归方程y x中斜率和截距最小二乘法估计计算公式:,=y()x(),xiyi4 195,xi2453.75.解:(1)由表中数据,x()(8.599.51010.5)9.5,y()(12
5、0110907060)90,则32,y() x()90329.5394,所以y关于x的线性相关方程为32x394.(2)设定价为x元,则利润函数为y(32x394)(x8),其中x8,则y32x2650x3 152,当x10时,销售的利润最大,所以为使得销售的利润最大,确定单价应该定为10元4某工厂预购买软件服务,有如下两种方案:方案一:软件服务公司每日收取工厂60元,对于提供的软件服务每次10元;方案二:软件服务公司每日收取工厂200元,若每日软件服务不超过15次,不另外收费,若超过15次,超过部分的软件服务每次收费标准为20元(1)设日收费为y元,每天软件服务的次数为x,试写出两种方案中y
6、与x的函数关系式;(2)该工厂对过去100天的软件服务的次数进行了统计,得到如图所示的条形图,依据该统计数据,把频率视为概率,从节约成本的角度考虑,从两个方案中选择一个,哪个方案更合适?请说明理由解:(1)由题可知,方案一中的日收费y与x的函数关系式为y10x60,xN.方案二中的日收费y与x的函数关系式为y(2)设方案一中的日收费为X,由条形图可得X的分布列为X190200210220230P0.10.40.10.20.2所以E(X)1900.12000.42100.12200.22300.2210(元);方案二中的日收费为Y,由条形图可得Y的分布列为Y200220240P0.60.20.2
7、E(Y)2000.62200.22400.2212(元)所以从节约成本的角度考虑,应该选择方案一5党的十九大以来,某贫困地区扶贫办积极贯彻落实国家精准扶贫的政策要求,带领广大农村地区人民群众脱贫奔小康经过不懈的奋力拼搏,新农村建设取得巨大进步,农民年收入也逐年增加,为了制定提升农民收入、实现2020年脱贫的工作计划,该地扶贫办统计了2019年50位农民的年收入并制成如下频率分布直方图:(1)根据频率分布直方图,估计50位农民的平均年收入x()(单位:千元);(同一组数据用该组数据区间的中点值表示);(2)由频率分布直方图,可以认为该贫困地区农民年收入X服从正态分布N(,2),其中近似为年平均收
8、入x(),2近似为样本方差s2,经计算得s26.92,利用该正态分布,求:在扶贫攻坚工作中,若使该地区约有占总农民人数的84.14%的农民的年收入高于扶贫办制定的最低年收入标准,则最低年收入标准大约为多少千元?为了调研“精准扶贫,不落一人”的政策要求落实情况,扶贫办随机走访了1 000位农民若每位农民的年收入互相独立,问:这1 000位农民中的年收入不少于12.14千元的人数最有可能是多少?附参考数据:2.63,若随机变量X服从正态分布N(,2),则P(X)0.682 7,P(2X2)0.954 5,P(3X)0.841 4,所以17.402.6314.77时,满足题意,即最低年收入大约为14
9、.77千元由P(x12.14)P(x2)0.50.977 3,每个农民的年收入不少于12.14千元的事件的概率为0.977 3,记1 000个农民的年收入不少于12.14千元的人数为则B(1 000,p),其中p0.977 3,于是恰好有k个农民的年收入不少于12.14千元的事件概率为P(k)Cpk(1p)1 000k,从而由1,得k1 001p,而1 001p978.277 3,所以,当0k978时,P(k1)P(k),由此可知,在所走访的1 000位农民中,年收入不少于12.14千元的人数最有可能是978人6某公司采购了一批零件,为了检测这批零件是否合格,从中随机抽测120个零件的长度(单
10、位:分米),按数据分成(1.2,1.3,(1.3,1.4,(1.4,1.5,(1.5,1.6,(1.6,1.7,(1.7,1.8这6组,得到如图所示的频率分布直方图,其中长度大于或等于1.59分米的零件有20个,其长度分别为1.59,1.59,1.61,1.61,1.62,1.63,1.63,1.64,1.65,1.65,1.65,1.65,1.66,1.67,1.68,1.69,1.69,1.71,1.72,1.74,以这120个零件在各组的长度的频率估计整批零件在各组长度的概率(1)求这批零件的长度大于1.60分米的频率,并求频率分布直方图中m,n,t的值;(2)若从这批零件中随机选取3个
11、,记X为抽取的零件长度在(1.4,1.6的个数,求X的分布列和数学期望;(3)若变量S满足|P(S)0.682 6|0.05且|P(2S2)0.954 4|0.05,则称变量S满足近似于正态分布N(,2)的概率分布如果这批零件的长度Y(单位:分米)满足近似于正态分布N(1.5,0.01)的概率分布,则认为这批零件是合格的将顺利被签收;否则,公司将拒绝签收试问,该批零件能否被签收?解:(1)由题意可知120件样本零件中长度大于1.60分米的共有18件,则这批零件的长度大于1.60分米的频率为0.15,记Y为零件的长度,则P(1.2Y1.3)P(1.7Y1.8)0.025,P(1.3Y1.4)P(
12、1.6Y1.7)0.125,P(1.4Y1.5)P(1.5Y1.6)(120.02520.125)0.35,故m0.25,n1.25,t3.5.(2)由(1)可知从这批零件中随机选取1件,长度在(1.4,1.6的概率P20.350.7.且随机变量X服从二项分布XB(3,0.7),则P(X0)C(10.7)30.027,P(X1)C(10.7)20.70.189,P(X2)C(10.7)0.720.441,P(X3)C0.730.343,故随机变量X的分布列为X0123P0.0270.1890.4410.343E(X)00.02710.18920.44130.3432.1(或E(X)30.72.
13、1)(3)由题意可知1.5,0.1,则P(Y)P(1.4Y1.6)0.7;P(2Y2)P(1.3Y1.7)0.1250.350.350.1250.95,因为|0.70.682 6|0.017 40.05,|0.950.954 4|0.004 40.05,所以这批零件的长度满足近似于正态分布N(1.5,0.01)的概率分布应认为这批零件是合格的,将顺利被该公司签收7近些年随着我国国民消费水平的升级,汽车产品已经逐渐进入千家万户,但是我国的城市发展水平并不能与汽车保有量增速形成平衡,城市交通问题越发突出,因此各大城市相继出现了购车限号上牌的政策某城市采用摇号买车的限号上牌方式,申请人提供申请,经审
14、查合格后,确认申请编码为有效编码,这时候就可以凭借申请编码参加每月一次的摇号假设该城市有20万人参加摇号,每个月有2万个名额,每个月摇上的人退出摇号,没有摇上的人继续下个月摇号(1)平均每个人摇上号需要多长时间?(2)如果每个月都有2万人补充进摇号队伍,以每个人进入摇号的月份算第一个月,他摇到号的月份设为随机变量证明:P(Xn)(nN*,1n35)为等比数列;假设该项政策连续实施36个月,小王是第一个月就参加摇号的人,记小王参加摇号的次数为Y,试求Y的数学期望(精确到0.01)参考数据:0.9340.028,0.9350.025.(1)解:由题意,设每个人摇上号的时间为个月,则1,2,3,10
15、,可得P(1),P(2),P(3), ,P(10),所以E()(12310)5.5,即平均每个人摇上号需要的时间为5.5个月(2)证明:每个月的摇号中恰有的概率摇上,则有P(Xn)0,且,故P(Xn)(nN*,1n35)为等比数列解:由可知,当n35时,P(Xn)P(Yn),P(Y36).故Y的数学期望为:E(Y)123536.设S1235.则S1235,两式作差得S135135193510.所以E(Y)1036108.10.934100.226 89.773 29.77.8贝诺酯为对乙酰氨基酚与阿司匹林的酯化产物,是一种新型的抗炎、抗风湿、解热镇痛药,主要用于类风湿关节炎、急慢性风湿性关节炎
16、、神经痛及术后疼痛药监部门要利用小白鼠扭体实验,对某厂生产的该药品的镇痛效果进行检测,若用药后的小白鼠扭体次数没有减少,扭体时间间隔没有变长,则认定镇痛效果不明显(1)若该药品对雌性小白鼠镇痛效果明显的概率为,对雄性小白鼠镇痛效果明显的概率为,药监部门要利用两只雌性和两只雄性小白鼠检测该药药效,对4只小白鼠逐一检测若在检测过程中,一只小白鼠用药后镇痛效果明显,记录积分为1,镇痛效果不明显,则记录积分为1.用随机变量X表示检测4只小白鼠后的总积分,求随机变量X的分布列和数学期望E(X);(2)若该药品对每只雌性小白鼠镇痛效果明显的概率均为p,现对6只雌性小白鼠逐一进行检测,当检测到镇痛效果不明显的小白鼠时,停止检测设至少检测5只雌性小白鼠才能发现镇痛效果不明显的概率为f(p),求f(p)最大时p的值解:(1)由题意,随机变量X的可能取值为4,2,0,2,4.P(X4),P(X2)CC,P(X0)CC,P(X2)CC,P(X4).X的分布列为:X42024PE(X)(4)(2)024.(2)由题意知f(p)p4(1p)p5(1p)p4p6,(0p1),f(p)4p36p52p3(23p2)令f(p)2p3(23p2)0得,p.所以当0p0,f(p)单调递增;当时p1时,f(p)0,f(p)单调递减,所以当p,f(p)取得最大值