1、专题09 概率与统计(2)概率与统计大题:10年10考,每年1题第一小题多为统计问题,第二小题多为概率计算问题,特点:实际生活背景在加强,阅读量大1(2019年)某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:满意不满意男顾客4010女顾客3020(1)分别估计男、女顾客对该商场服务满意的概率;(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异?附:K2P(K2k)0.0500.0100.001k3.8416.63510.828【解析】(1)由题中数据可知,男顾客对该商场服务满意的概率P,女顾客对该商场服务满
2、意的概率P;(2)由题意可知,K24.7623.841,故有95%的把握认为男、女顾客对该商场服务的评价有差异2(2018年)某家庭记录了未使用节水龙头50天的日用水量数据(单位:m3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:未使用节水龙头50天的日用水量频数分布表 日用水量0,0.1)0.1,0.2)0.2,0.3)0.3,0.4)0.4,0.5)0.5,0.6)0.6,0.7)频数13249265使用了节水龙头50天的日用水量频数分布表日用水量0,0.1)0.1,0.2)0.2,0.3)0.3,0.4)0.4,0.5)0.5,0.6)频数151310165(1)作出使用了
3、节水龙头50天的日用水量数据的频率分布直方图;(2)估计该家庭使用节水龙头后,日用水量小于0.35m3的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表)【解析】(1)根据使用了节水龙头50天的日用水量频数分布表,作出使用了节水龙头50天的日用水量数据的频率分布直方图,如下图:(2)根据频率分布直方图得:该家庭使用节水龙头后,日用水量小于0.35m3的概率为:p(0.2+1.0+2.6+1)0.10.48(3)由题意得未使用水龙头50天的日均水量为: (10.05+30.15+20.25+40.35+90.45+260
4、.55+50.65)0.48,使用节水龙头50天的日均用水量为:(10.05+50.15+130.25+100.35+160.45+50.55)0.35,估计该家庭使用节水龙头后,一年能节省:365(0.480.35)47.45m33(2017年)为了监控某种零件的一条生产线的生产过程,检验员每隔30min从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm)下面是检验员在一天内依次抽取的16个零件的尺寸:抽取次序12345678零件尺寸9.9510.129.969.9610.019.929.9810.04抽取次序910111213141516零件尺寸10.269.9110.1310.029
5、.2210.0410.059.95经计算得 9.97,s0.212,18.439,2.78,其中xi为抽取的第i个零件的尺寸,i1,2,16(1)求(xi,i)(i1,2,16)的相关系数r,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若|r|0.25,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小)(2)一天内抽检零件中,如果出现了尺寸在(3s,+3s)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查()从这一天抽检的结果看,是否需对当天的生产过程进行检查?()在(3s,+3s)之外的数据称为离群值,试剔除
6、离群值,估计这条生产线当天生产的零件尺寸的均值与标准差(精确到0.01)附:样本(xi,yi)(i1,2,n)的相关系数r,0.09【解析】(1)r0.18|r|0.25,可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(2)(i)9.97,s0.212,合格零件尺寸范围是(9.334,10.606),显然第13号零件尺寸不在此范围之内,需要对当天的生产过程进行检查(ii)剔除离群值后,剩下的数据平均值为10.02,160.2122+169.9721591.134, 剔除离群值后样本方差为(1591.1349.2221510.022)0.008,剔除离群值后样本标准差为0.09
7、4(2016年)某公司计划购买1台机器,该种机器使用三年后即被淘汰机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元在机器使用期间,如果备件不足再购买,则每个500元现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得如图柱状图:记x表示1台机器在三年使用期内需更换的易损零件数,y表示1台机器在购买易损零件上所需的费用(单位:元),n表示购机的同时购买的易损零件数(1)若n19,求y与x的函数解析式;(2)若要求“需更换的易损零件数不大于n”的频率不小于0.5,求n的最小值;(3)假设这100台机器在购机的同时每
8、台都购买19个易损零件,或每台都购买20个易损零件,分别计算这100台机器在购买易损零件上所需费用的平均数,以此作为决策依据,购买1台机器的同时应购买19个还是20个易损零件?【解析】(1)当n19时,y;(2)由柱状图知,更换的易损零件数为16个频率为0.06,更换的易损零件数为17个频率为0.16,更换的易损零件数为18个频率为0.24,更换的易损零件数为19个频率为0.24,又更换易损零件不大于n的频率为不小于0.5,则n19,n的最小值为19件;(3)假设这100台机器在购机的同时每台都购买19个易损零件,所须费用平均数为:(7019200+430020+480010)4000(元),
9、假设这100台机器在购机的同时每台都购买20个易损零件,所须费用平均数为(904000+104500)4050(元),40004050,购买1台机器的同时应购买19台易损零件5(2015年)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响,对近8年的年宣传费xi和年销售量yi(i1,2,8)数据作了初步处理,得到下面的散点图及一些统计量的值46.65636.8289.81.61469108.8表中,(1)根据散点图判断,ya+bx与yc+d哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明
10、理由)(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;(3)已知这种产品的年利润z与x、y的关系为z0.2yx根据(2)的结果回答下列问题:(i)年宣传费x49时,年销售量及年利润的预报值是多少?(ii)年宣传费x为何值时,年利润的预报值最大?附:对于一组数据(u1 v1),(u2 v2),(un vn),其回归线v+u的斜率和截距的最小二乘估计分别为:,【解析】(1)由散点图可以判断,yc+d适宜作为年销售量y关于年宣传费x的回归方程类型;(2)令w,先建立y关于w的线性回归方程,由于68,563686.8100.6,所以y关于w的线性回归方程为100.6+68w,因此y关于x
11、的回归方程为100.6+68,(3)(i)由(2)知,当x49时,年销售量y的预报值100.6+68576.6,年利润z的预报值576.60.24966.32,(ii)根据(2)的结果可知,年利润z的预报值0.2(100.6+68)xx+13.6+20.12,当6.8时,即当x46.24时,年利润的预报值最大6(2014年)从某企业生产的产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:质量指标值分组75,85)85,95)95,105)105,115)115,125)频数62638228(1)在表格中作出这些数据的频率分布直方图;(2)估计这种产品质量指标的平均数
12、及方差(同一组中的数据用该组区间的中点值作代表);(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定?【解析】(1)频率分布直方图如图所示:(2)质量指标的样本平均数为800.06+900.26+1000.38+1100.22+1200.08100,质量指标的样本的方差为S2(20)20.06+(10)20.26+00.38+1020.22+2020.08104,这种产品质量指标的平均数的估计值为100,方差的估计值为104(3)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.080.68,由于该估计值小于
13、0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定7(2013年)为了比较两种治疗失眠症的药(分别成为A药,B药)的疗效,随机地选取20位患者服用A药,20位患者服用B药,这40位患者服用一段时间后,记录他们日平均增加的睡眠时间(单位:h)实验的观测结果如下:服用A药的20位患者日平均增加的睡眠时间:0.6 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.2 3.52.5 2.6 1.2 2.7 1.5 2.9 3.0 3.1 2.3 2.4服用B药的20位患者日平均增加的睡眠时间:3.2 1.7 1.9 0.8 0.9 2.4 1
14、.2 2.6 1.3 1.41.6 0.5 1.8 0.6 2.1 1.1 2.5 1.2 2.7 0.5(1)分别计算两种药的平均数,从计算结果看,哪种药的疗效更好?(2)根据两组数据完成下面茎叶图,从茎叶图看,哪种药的疗效更好?【解析】(1)设A药观测数据的平均数据的平均数为,设B药观测数据的平均数据的平均数为,则(0.6+1.2+2.7+1.5+2.8+1.8+2.2+2.3+3.2+3.5+2.5+2.6+1.2+2.7+1.5+2.9+3.0+3.1+2.3+2.4)2.3(3.2+1.7+1.9+0.8+0.9+2.4+1.2+2.6+1.3+1.4+1.6+0.5+1.8+0.6
15、+2.1+1.1+2.5+1.2+2.7+0.5)1.6由以上计算结果可知:由此可看出A药的效果更好(2)根据两组数据得到下面茎叶图:从以上茎叶图可以看出,A药疗效的试验结果有的叶集中在2,3上而B药疗效的试验结果有的叶集中在0,1上由此可看出A药的疗效更好8(2012年)某花店每天以每枝5元的价格从农场购进若干枝玫瑰花,然后以每枝10元的价格出售如果当天卖不完,剩下的玫瑰花做垃圾处理(1)若花店一天购进17枝玫瑰花,求当天的利润y(单位:元)关于当天需求量n(单位:枝,nN)的函数解析式(2)花店记录了100天玫瑰花的日需求量(单位:枝),整理得如表:日需求量n14151617181920频
16、数10201616151310(i)假设花店在这100天内每天购进17枝玫瑰花,求这100天的日利润(单位:元)的平均数;(ii)若花店一天购进17枝玫瑰花,以100天记录的各需求量的频率作为各需求量发生的概率,求当天的利润不少于75元的概率【解析】(1)当日需求量n17时,利润y85;当日需求量n17时,利润y10n85; 利润y关于当天需求量n的函数解析式(nN*)(2)(i)这100天的日利润的平均数为元; (ii)当天的利润不少于75元,当且仅当日需求量不少于16枝,故当天的利润不少于75元的概率为P0.16+0.16+0.15+0.13+0.10.7 9(2011年)某种产品的质量以
17、其质量指标值衡量,质量指标值越大表明质量越好,且质量指标值大于或等于102的产品为优质品,现用两种新配方(分别称为A配方和B配方)做试验,各生产了100件这种产品,并测量了每件产品的质量指标值,得到下面试验结果:A配方的频数分布表指标值分组90,94)94,98)98,102)102,106)106,110频数82042228B配方的频数分布表指标值分组90,94)94,98)98,102)102,106)106,110频数412423210(1)分别估计用A配方,B配方生产的产品的优质品率;(2)已知用B配方生产的一件产品的利润y(单位:元)与其质量指标值t的关系式为估计用B配方生产的产品的
18、利润大于的概率,并求用B配方生产的上述件产品平均一件的利润【解析】(1)由试验结果知,用A配方生产的产品中优质品的频率为,用A配方生产的产品的优质品率的估计值为0.3 由试验结果知,用B配方生产的产品中优质品的频率为,用B配方生产的产品的优质品率的估计值为0.42(2)由条件知,用B配方生产的一件产品的利润大于当且仅当其质量指标值,由试验结果知,质量指标值的频率为,用B配方生产的一件产品的利润大于的概率估计值为用B配方生产的产品平均一件的利润为(元)10(2010年)为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如表: 性别是否需要志愿者男女需要
19、4030不需要160270(1)估计该地区老年人中,需要志愿者提供帮助的比例;(2)能否有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关?(3)根据(2)的结论,能否提出更好的调查方法来估计该地区的老年人中需要志愿者提供帮助的老年人比例?说明理由P(K2k)0.0500.0100.0013.8416.63510.828附:K2【解析】(1)调查的500位老年人中有70位需要志愿者提供帮助,因此在该地区老年人中,需要帮助的老年人的比例的估计值为(2)K2的观测值,因为9.9676.635,且P(K26.635)0.01,所以有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关 (3)根据(2)的结论可知,该地区的老年人是否需要志愿者提供帮助与性别有关,并且从样本数据能够看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男女两层,并采取分层抽样方法比简单随机抽样方法更好 、