1、概率与统计大题专练(一)作业(二十八)1南锣鼓巷这条胡同位于北京中轴线东侧的交道口地区,至今已有700多年的历史该胡同是北京最古老的街区之一,因其地势中间高、南北低,如一驼背人,故名罗锅巷到了清朝,乾隆十五年(1750年)绘制的京城全图中将该胡同改称为南锣鼓巷为了给游客更好的体验,南锣鼓巷商会会长、副会长和负责人经常带人到胡同清扫卫生,其中南锣鼓巷商会会长每天带人到胡同清扫卫生的概率为,副会长每天带人到胡同清扫卫生的概率为,负责人每天带人到胡同清扫卫生的概率为.(1)求南锣鼓巷负责人连续五天带人到胡同清扫卫生的概率;(2)设商会会长、副会长、负责人三人中某天到胡同清扫卫生的人数为X,求X的分布
2、列;(3)居住在南锣鼓巷的小张对南锣鼓巷商会会长、副会长、负责人非常满意,他对别人说:“南锣鼓巷平均每天至少有1人(会长、副会长、负责人之一)带人清扫卫生”请问,小张说的是真的吗?解析(1)设“南锣鼓巷负责人连续五天带人到胡同清扫卫生”为事件A,则P(A),所以南锣鼓巷负责人连续五天带人到胡同清扫卫生的概率为,(2)X有所有可能取值为0,1,2,3,则P(X0),P(X1),P(X2),P(X3),故随机变量X的分布列为X0123P(3)由(2)知,E(X)01230,因为1,所以小张说的是真的2(2019最后一卷)某车床生产某种零件的不合格率为p(0p1),要求这部车床生产的一组5个零件中,
3、有2个或2个以上不合格品的概率不大于0.05.为了了解该车床每天生产零件的利润,现统计了该车床100天生产的零件组数(1组5个零件),得到的条形统计图如下:现已记录的100天的日生产零件组数的频率作为日生产零件组数的概率(1)设平均每天可以生产n个零件,求n的值;(2)求p的最大值p0;(3)设每个零件的不合格率是p0,生产1个零件的成本是20元,每个合格零件的出厂价为120元,不合格的零件不得出厂,不计其他成本假设每天该机床生产的零件数为n,X表示这部车床每天生产零件的利润,求X的数学期望E(X)(参考数据:0.9241.32的取值为0.95)解析(1)由题意知每天生产14组,15组,16组
4、,17组零件的频率分别是0.2,0.3,0.4和0.1,所以n(140.2150.3160.4170.1)577.(2)记为一组零件中不合格品的个数,则P(2)1P(0)P(1)0.05,即1(1p)5C51p(1p)40.05,整理得(1p)4(14p)0.95.记f(p)(1p)4(14p),0p1,则f(p)4(1p)3(14p)4(1p)420p(1p)30,所以f(p)在(0,1)上单调递减又0.9241.32的取值为0.95,即(10.08)4(140.08)0.95,所以f(0.08)0.95,因此(1p)4(14p)0.95等价于f(p)f(0.08),所以p0.08,故p00
5、.08.(3)设生产一个零件的利润为Y元,由题意得Y的可能取值是100和20,则P(Y100)1p00.92,P(Y20)p00.08.所以Y的分布列为Y10020P0.920.08E(Y)1000.92(20)0.0890.4(元),所以E(X)77E(Y)7790.46 960.8(元)3(2019南昌NCS项目第三次模拟)某企业产品正常生产时,产品尺寸服从正态分布N(80,0.25),从当前生产线上随机抽取200件产品进行检测,产品尺寸汇总如下表:产品尺寸/mm76,78.5(78.5,79(79,79.5(79.5,80.5件数4272780产品尺寸/mm(80.5,81(81,81.
6、5)(81.5,83件数36206根据产品质量标准和生产线的实际情况,产品尺寸在(3,3以外视为小概率事件一旦小概率事件发生视为生产线出现异常,产品尺寸在(3,3以内为正品,以外为次品P(X)0.682 7,P(2X2)0.954 5,P(3X3)0.997 3.(1)判断生产线是否正常工作,并说明理由;(2)用频率表示概率,若再随机从生产线上取3件产品复检,正品检测费10元/件,次品检测费15元/件,记这3件产品检测费为随机变量X,求X的数学期望及方差解析(1)依题意,有80,0.5,所以正常产品尺寸范围为(78.5,81.5生产线正常工作,次品不能多于200(10.997 3)0.54(件
7、),而实际上,超出正常范围以外的零件数为10,故生产线没有正常工作(2)依题意尺寸在(78.5,81.5以外的就是次品,故次品率为.记这3件产品中次品件数为Y,则Y服从二项分布B(3,),X10(3Y)15Y5Y30,则E(Y)3,D(Y)3,所以X的数学期望是E(X)5E(Y)30(元),方差是D(X)52D(Y)25.4(2018长沙四校模拟一)一微商店对某种产品的日销售量(单位:件)进行为期一个月的数据统计分析,并得到日销售量的频率分布直方图如图所示(每组包含最小值,不包含最大值)假设用频率分布直方图中所得的频率估计相应事件发生的概率(1)求在连续4天的销售中,恰有连续2天的日销售量不低
8、于25件的概率;(2)若该微商店某天的销售量不低于27件,则上级商企当天会给该微商店赠送100元的礼金,设X表示该微商店一年内得到礼金的次数,求X的数学期望以及一年内得到的礼金数(一年按365天计算)解析(1)设事件A:日销售量不低于25件,则P(A)(0.040.02)50.3.设事件B:在连续4天的销售中,恰有连续2天的日销售量不低于25件,则P(B)30.320.720.132 3.(2)设事件C:日销售量不低于27件,则P(C)0.04(3027)0.0250.120.10.22.因为XB(365,0.22),所以E(X)3650.2280.3,一年内得到的礼金数为80.31008 0
9、30(元)5(2019湖南长郡月考五)某市县乡教师流失现象非常严重,为了县乡孩子们能接受良好教育,某市2019年要为两所县乡中学招聘储备未来三年的教师,现在每招聘一名教师需要1万元,若三年后教师严重短缺时再招聘,由于各种因素,则每招聘一名教师需要3万元,已知现在该市县乡中学无多余教师,为决策应招聘多少县乡教师搜集并整理了该市50所县乡中学在过去三年内的流失教师数,得到如下的频数分布表:流失教师数6789频数10151510以这50所县乡中学流失教师数的频率代替一所县乡中学流失教师数发生的概率,记X表示两所县乡中学在过去三年共流失的教师数,n表示2019年两所县乡中学招聘的教师数为保障县乡孩子教
10、育不受影响,若未来三年内教师有短缺,则第四年马上招聘短缺的教师(1)求X的分布列;(2)若要求P(Xn)0.5,确定n的最小值;(3)以两所县乡中学未来四年内招聘教师所需费用的期望值为决策依据,在n15与n16之中选一种,应选用哪种?解析(1)由频数分布表中教师流失的频率代替教师流失数发生的概率可得,一所县乡中学在三年内流失的教师数为6,7,8,9的概率分别为0.2,0.3,0.3,0.2.X所有可能的取值为:12,13,14,15,16,17,18,且P(X12)C220.220.04,P(X13)C210.20.30.12,P(X14)C220.32C210.20.30.21,P(X15)
11、C210.20.2C210.30.30.26,P(X16)C210.30.2C220.320.21,P(X17)C210.30.30.12,P(X18)C220.220.04,所以X的分布列为X12131415161718P0.040.120.210.260.210.120.04(2)由(1)知P(X14)0.37,P(X15)0.63,故n的最小值为15.(3)记Y表示两所县乡中学未来四年内在招聘教师上所需的费用(单位:万元),当n15时,Y的分布列为Y15182124P0.630.210.120.04E(Y)150.63180.21210.12240.0416.71;当n16时,Y的分布列
12、为Y161922P0.840.120.04E(Y)160.84190.12220.0416.6.可知当n16时所需费用的期望值小于n15时所需费用的期望值,故应选n16.概率与统计大题专练(二)作业(二十九)1某校从参加高一年级期末考试的学生中抽出60名学生,将其数学成绩(均为整数)分成六段40,50),50,60),90,100后,画出如下部分频率分布直方图观察图形的信息,回答下列问题:(1)求第四小组的频率,补全频率分布直方图,并估计该校学生的数学成绩的中位数;(2)从被抽取的数学成绩是70分以上(包括70分)的学生中选两人,求他们在同一分数段的概率;(3)假设从全校参加高一年级期末考试的
13、学生中,任意抽取4个学生,设这四个学生中数学成绩为80分以上(包括80分)的人数为X(以该校学生数学成绩的频率估计概率),求X的分布列和数学期望解析(1)因为各组的频率和等于1,故第四组的频率为f41(0.0250.01520.0100.005)100.3.中位数是xc701073.33,估计这次考试的中位数是73.33分(2)成绩在70,80),80,90),90,100的人数分别是18,15,3,所以从成绩是70分以上(包括70分)的学生中选两人,他们在同一分数段的概率为P.(3)XB(4,0.3),P(Xk)C4k0.3k0.74k(k0,1,2,3,4),所以其分布列为X01234P(
14、Xk)0.240 10.411 60.264 60.075 60.008 1数学期望为E(X)np40.31.2.2(2019博分小卷七)我国北方广大农村地区、一些城镇以及部分大中城市的周边区域,还在大量采用分散燃煤和散烧煤的取暖措施,既影响了居民基本生活的改善,也加重了北方地区冬季的雾霾推进北方地区冬季清洁取暖,是重大民生工程、民心工程,关系北方地区广大群众温暖过冬,关系雾霾天能不能减少,是能源生产和消费革命、农村生活方式革命的重要内容.2017年9月国家发改委制定了煤改气、煤改电价格扶植新政策,从而使得煤改气、煤改电用户大幅度增加,下面条形图反映了某省2018年17月份煤改气、煤改电的用户
15、数量(1)在给定坐标系中作出煤改气、煤改电用户数量y随月份t变化的散点图,并用散点图和相关系数说明y与t之间具有线性相关性;(2)建立y关于t的回归方程(系数精确到0.01),预测11月份该省煤改气、煤改电的用户数量参考数据:yi9.24,tiyi39.75,0.53,2.646.参考公式:相关系数r, (tit)(yiy)tiyityi.回归方程t中斜率和截距的最小二乘估计公式分别为:,yt.解析(1)作出散点图如图所示:由条形图数据和参考数据得t4, (tit)228,0.53, (tit)(yiy)tiyityi39.7549.242.79,r0.99.因为y与t的相关系数近似为0.99
16、,说明y与t的线性相关性相当高,从而可以用线性回归模型拟合y与t的关系(2)由y1.32及(1)得0.10,yt1.320.1040.92,所以,y关于t的回归方程为:0.920.10t.将t11代入回归方程得:y0.920.10112.02,所以预测11月份该省煤改气、煤改电的用户数量达到2.02万户3(2019安徽五校第二次质量检测)在某市高中某学科竞赛中,某一个区4 000名考生的参赛成绩统计如图所示(1)求这4 000名考生的的竞赛平均成绩x(同一组中的数据用该组区间的中点值作代表);(2)由直方图可认为考生竞赛成绩z服从正态分布N(,2),其中,2分别取考生的平均成绩x和考生成绩的方
17、差s2,那么该区4 000名考生的成绩超过84.81分(含84.81分)的人数估计有多少?(3)如果用该区参赛考生成绩的情况来估计全市的参赛考生的成绩情况,现从全市参赛考生中随机抽取4名,记成绩不超过84.81分的考生人数为,求P(3)(精确到0.001)附:s2204.75,14.31;0.841 340.501;zN(,2),则P(z)0.682 6,P(2z2)0.954 4.解析(1)由题意知,中点值455565758595频率0.10.150.20.30.150.1x450.1550.15650.2750.3850.15950.170.5,这4 000名考生的竞赛平均成绩x为70.5
18、分(2)依题意z服从正态分布N(,2),其中x70.5,2s2204.75,14.31,z服从正态分布N(,2)N(70.5,14.312),而P(z)P(56.19z84.81)0.682 6,P(z84.81)0.158 7.又0.158 74 000634.8.竞赛成绩超过84.81分的人数估计为634.(3)全市竞赛考生的成绩不超过84.81分的概率P10.158 70.841 3.而B(4,0.841 3),P(3)1P(4)1C440.841 3410.5010.499.4(2018贵阳适应性测试一)某高校通过自主招生方式在贵阳招收一名优秀的高三毕业生,经过层层筛选,甲、乙两名学生
19、进入最后测试,该校设计了一个测试方案:甲、乙两名学生各自从6个问题中随机抽3个问题已知这6个问题中,学生甲能正确回答其中的4个问题,而学生乙能正确回答每个问题的概率均为,甲、乙两名学生对每个问题的回答都是相互独立、互不影响的(1)求甲、乙两名学生共答对2个问题的概率;(2)请从期望和方差的角度分析,甲、乙两名学生哪位被录取的可能性更大?解析(1)由题意可得,所求概率为PC31()2C30()0()3.(2)设学生甲答对的题数为X,则X的所有可能取值为1,2,3.P(X1),P(X2),P(X3),E(X)1232,D(X)(12)2(22)2(32)2,设学生乙答对的题数为Y,则Y的所有可能取
20、值为0,1,2,3.由题意可知YB(3,),所以E(Y)32,D(Y)3.因为E(X)E(Y),D(X)10.828,所以能在犯错误的概率不超过0.001的前提下认为“幸福指数与租住的小区有关”概率与统计大题专练(三)作业(三十)1(2019江西重点中学协作体第一次联考)今有9所省级示范学校参加联考,参加人数约5 000人,考完后经计算得数学平均分为113分已知本次联考的成绩服从正态分布,且标准差为12.(1)计算联考成绩在137分以上的人数;(2)从所有试卷中任意抽取1份,已知分数不超过123分的概率为0.8.求分数低于103分的概率;从所有试卷中任意抽取5份,由于试卷数量较大,可以把每份试
21、卷被抽取到的概率视为相同X表示抽到成绩低于103分的试卷的份数,写出X的分布列,并求数学期望E(X)参考数据:P(X)0.682 6,P(2X2)0.954 4,P(3X3)0.997 4.解析(1)设本次联考成绩为,由题意知在正态分布N(,2)中,12,113,因为1372,所以P(2)(10.954 4)0.022 8,故所求人数为0.022 85 000114(人)(2)P(123)10.80.2.由题意易知XB(5,0.2)故P(X0)0.850.327 68,P(X1)C510.210.840.409 6,P(X2)C520.220.830.204 8,P(X3)C530.230.8
22、20.051 2,P(X4)C540.240.810.006 4,P(X5)0.250.000 32,则X的分布列为X012345P0.327 680.409 60.204 80.051 20.006 40.000 32E(X)50.21.2(2019河南普通高中适应性测试)第十一届全国少数民族传统体育运动会将于2019年9月8日至16日在郑州市举行,全国少数民族传统体育运动会每四年举办一次,是我国级别最高、影响力最大的民族传统体育赛事其中以龙舟项目最为刺激、场面最为宏大,其起源可追溯到原始社会末期,已被列入国家级物质文化遗产名录河南省参加公开组标准龙舟500米直道竞速比赛的队伍从甲、乙两队中
23、选拔产生甲、乙两队共参加十轮对抗赛成绩统计如下:轮次一二三四五六七八九十甲队成绩(秒)142152158145138161154148146151乙队成绩(秒)149149165139153155147137160148(1)把甲、乙两队的成绩整理在如图所示的茎叶图中(单位:秒),并根据茎叶图判断两队成绩的方差的大小(不需要计算);(2)用频率估计总体,甲、乙两队进行三轮比赛,甲队获胜的次数为X,求X的分布列和数学期望;(3)若正式比赛时共分三轮,取最好的一轮成绩作为最终成绩决出冠军根据往届成绩,150秒以内(含150秒)可获冠军,否则不能获得冠军,用样本频率估计总体,你认为哪个队参加比赛获冠
24、军的概率较大?该队获冠军的概率是多少?解析(1)甲、乙两队成绩的茎叶图如图根据茎叶图可知,甲队的方差小于乙队的方差. (2)在十轮比赛中,甲队获胜4次,用频率估计总体,甲队在每轮比赛中获胜的概率为P.由题意,知XB(3,),X0,1,2,3,则P(X0)()3,P(X1)C31()2,P(X2)C32()2,P(X3)()3.所以X的分布列为X0123PX的数学期望为E(X)3.(3)由于甲队十轮比赛中成绩在150秒以内(含150秒)的有5次,乙队十轮比赛中成绩在150秒以内(含150秒)的有6次,用样本估计总体,乙队参加比赛获得冠军的概率较大记“乙队参加比赛获得冠军”为事件B,则P(B)1(
25、)31.所以乙队获得冠军的概率较大,该队获冠军的概率为.3(2019重庆巴蜀中学适应性月考)某研究机构随机调查了A,B两个企业各100名员工,得到了A企业员工工资的频数分布表以及B企业员工工资的饼状图如下:A企业:工资(单位:元)人数2 000,3 000)53 000,4 000)104 000,5 000)205 000,6 000)426 000,7 000)187 000,8 000)38 000,9 000)19 000,10 000)1B企业:(1)若将频率视为概率,现从B企业中随机抽取一名员工,求该员工收入不低于5 000元的概率;(2)若从A企业工资在2 000,5 000)元
26、的员工中,按分层抽样的方式抽取7人,而后在此7人中随机抽取2人,求这2人工资在3 000,4 000)元的人数X的分布列;若你是一名即将就业的大学生,根据上述调查结果,并结合统计学相关知识,你会选择去哪个企业就业,并说明理由解析(1)由饼状图知,B企业员工工资不低于5 000元的有5016268(人),故所求概率为0.68.(2)A企业员工工资在2 000,5 000)元中的三个不同层次的人数比为124,按照分层抽样可知,所抽取的7人工资在3 000,4 000)元的人数为2,X的可能取值为0,1,2,则P(X0),P(X1),P(X2),因此X的分布列为X012PA企业员工的平均工资:(2
27、50053 500104 500205 500426 500187 50038 50019 5001)5 260(元);B企业员工的平均工资:(2 50023 50074 500235 500506 500167 5002)5 270(元)参考答案1:选企业B,因为B企业员工的平均工资不仅高,且工资低的人数少参考答案2:选企业A,因为A企业员工的平均工资只比B企业低10元,但是A企业有高收入团体,说明发展空间较大,获得8 000元以上的高工资是有可能的(答案不唯一,只要言之有据,理由充分即可)4(2018湖北七校联考)我们国家正处于老龄化社会中,老有所依也是政府的民生工程某市共有户籍人口400
28、万,其中老人(年龄60岁及以上)人数约有66万,为了了解老人们的健康状况,政府从老人中随机抽取600人并委托医疗机构免费为他们进行健康评估,健康状况共分为不能自理、不健康尚能自理、基本健康、健康四个等级,并以80岁为界限分成两个群体进行统计,样本分布被制作成如下图表:(1)若采用分层抽样的方法再从样本中的不能自理的老人中抽取8人进一步了解他们的生活状况,则两个群体中各应抽取多少人?(2)估算该市80岁及以上长者占全市户籍人口的百分比;(3)据统计该市大约有五分之一的户籍老人无固定收入,政府计划为这部分老人每月发放生活补贴,标准如下:80岁及以上长者每人每月发放生活补贴200元;80岁以下老人每
29、人每月发放生活补贴120元;不能自理的老人每人每月额外发放生活补贴100元利用样本估计总体,试估计政府执行此计划的年度预算(单位:亿元,结果保留两位小数)解析(1)数据整理如下表:健康状况健康基本健康不健康尚能自理不能自理80岁及以上2045201580岁以下2002255025从图表中知采用分层抽样的方法再从样本中的不能自理的老人中抽取8人进一步了解他们的生活状况,80岁及以上应抽取83(人),80岁以下应抽取85(人)(2)在600人中80岁及以上长者在老人中占比为.用样本估计总体,80岁及以上长者为6611(万),故80岁及以上长者占户籍人口的百分比为100%2.75%.(3)用样本估计
30、总体,设任一户籍老人每月享受的生活补助为X元,P(X0),P(X120),P(X200),P(X220),P(X300),则随机变量X的分布列为:X0120200220300PE(X)28.全市老人的总预算为2812661042.217 6108元则政府执行此计划的年度预算约为2.22亿元5(2019洛阳尖子生第一次联考)人耳的听力情况可以用电子测听器检测,正常人听力的等级为025分贝,并规定测试值在区间(0,5为非常优秀,测试值在区间(5,10为优秀,某班50名同学都进行了听力测试,所得测试值制成频率分布直方图如下:(1)现从听力测试值为(0,10的同学中任意抽取4人,记听力非常优秀的同学人
31、数为X,求X的分布列与数学期望;(2)在(1)中抽取的4人中任选一人参加一个更高级别的听力测试,测试规则如下:四个音叉的发声情况不同,由强到弱的次序分别为1,2,3,4.测试前将音叉随机排列,被测试的同学依次听完后给四个音叉按发音的强弱标出一组序号a1,a2,a3,a4(其中a1,a2,a3,a4为1,2,3,4的一个排列)若Y为两次排序偏离程度的一种描述,Y|1a1|2a2|3a3|4a4|,求Y2的概率解析(1)由题意知,听力等级为(0,10的同学有10人,非常优秀的同学有4人,故X的所有可能取值为0,1,2,3,4,则P(X0),P(X1),P(X2),P(X3),P(X4).X的分布列
32、为X01234P数学期望为E(X)012341.6.(2)序号a1,a2,a3,a4的排列总数为A4424(种),Y|1a1|2a2|3a3|4a4|,当Y0时,a11,a22,a33,a44;当Y2时,a1,a2,a3,a4的可能取值为a11,a22,a34,a43;a11,a23,a32,a44;a12,a21,a33,a44.Y2的概率为P(Y2).1.为迎接2019年国际乒联挑战赛的到来,某市组织中学生开展乒乓球运动的培训活动,并在培训结束后对学生进行了考核为了了解本次培训活动的效果,在参加培训的学生中随机抽取了25名学生的考核成绩(记X(单位:分)为学生的考核成绩,规定X85为优秀)
33、,并作了如图所示的茎叶图(1)从参加这次培训的学生中随机选取1人,估计这名学生考核成绩优秀的概率;(2)从茎叶图中考核成绩在80,89上的学生中任选3人,用Y表示这3人中考核成绩优秀的人数,求Y的分布列和数学期望;(3)根据以往培训数据,规定当P(|X80|8)0.5时培训有效请根据茎叶图中数据,判断此次中学生乒乓球培训活动是否有效,并说明理由解析(1)设“这名学生考核成绩优秀”为事件A,由茎叶图中的数据可以知道,25名学生中有6名学生考核成绩优秀,所以这名学生考核成绩优秀的概率为.(2)Y的所有可能取值为0,1,2,3.因为考核成绩在80,89上的学生共有8人,其中满足X85的学生有3人,所
34、以P(Y0),P(Y1),P(Y2),P(Y3).则随机变量Y的分布列为Y0123P方法一:由分布列知E(Y)0123.方法二:因为Y服从超几何分布H(8,3,3),所以E(Y).(3)由|X80|8,得72X88,根据茎叶图中的数据,满足72X88的成绩有15个,所以P(|X80|8)0.6,0.60.5,所以可以认为此次乒乓球培训活动有效2(2019河北唐山期末考试)近年来,我国工业经济发展迅速,工业增加值连年攀升,某研究机构统计了近十年(从2008年到2017年)的工业增加值(万亿元),如下表:年份2008200920102011201220132014201520162017年份序号x
35、12345678910工业增加值y13.213.816.519.520.922.223.423.724.828依据表格数据,得到下面的散点图及一些统计量的值xy (xix)2 (yiy)2 (xix)(yiy)5.520.682.5211.52129.6(1)根据散点图和表中数据,此研究机构对工业增加值y(万亿元)与年份序号x的回归方程类型进行了拟合试验研究人员甲采用函数yevx,其拟合指数R20.93;研究人员乙采用函数ymxn,其拟合指数R20.95;研究人员丙采用线性函数ybxa,请计算其拟合指数,并用数据说明哪位研究人员的函数类型拟合效果最好(注:相关系数r与拟合指数R2满足关系R2r
36、2)(2)根据(1)的判断结果及统计值,建立y关于x的回归方程(系数精确到0.01);(3)预测哪一年的工业增加值能突破30万亿元大关附:样本(xi,yi)(i1,2,n)的相关系数r,132.1,yx.解析(1)由题中数据可知r0.981,所以R2r20.96.因为R2越大,拟合效果越好,所以丙的拟合效果最好(2)由题中数据可知1.571,所以20.65.511.96.因此y关于x的线性回归方程为1.57x11.96.(3)从2008年开始计数,2018年是第11年,其工业增加值y的预报值1.571111.9629.2330.故可以预测2019年的工业增加值能突破30万亿元大关3(2019长
37、沙统一模拟)某互联网公司为了确定下一季度的前期广告投入计划,收集了近6个月广告投入量x(单位:万元)和收益y(单位:万元)的数据如下表:月份123456广告投入量/万元24681012收益/万元14.2120.3131.831.1837.8344.67他们用两种模型ybxa,yaebx分别进行拟合,得到相应的回归方程并进行残差分析,得到如图所示的残差图及一些统计量的值:xyxiyixi27301 464.24364(1)根据残差图,比较模型,的拟合效果,应选择哪个模型?并说明理由;(2)残差绝对值大于2的数据被认为是异常数据,需要剔除:剔除异常数据后,求出(1)中所选模型的回归方程;广告投入量
38、x18时,(1)中所选模型收益的预报值是多少?附:对于一组数据(x1,y1),(x2,y2),(xn,yn),其回归直线x的斜率和截距的最小二乘估计分别为:,yx.解析(1)应该选择模型,因为模型的残差点比较均匀地落在水平的带状区域中,且模型的带状区域比模型的带状区域窄,所以模型的拟合精度高,回归方程的预报精度高(2)剔除异常数据,即3月份的数据后,得x(766)7.2,y(30631.8)29.64.xiyi1 464.24631.81 273.44,xi236462328.3,yx29.6437.28.04.所以y关于x的回归方程为3x8.04.把x18代入中所求回归方程得3188.046
39、2.04,故预报值为62.04万元4(2019云南曲靖市统一检测)为了研究高一阶段男生、女生对物理学科学习的差异性,在高一年级所有学生中随机抽取20名男生和20名女生,计算他们高一上学期期中、期末和下学期期中、期末的四次物理考试成绩的各自的平均分,并绘制成如下的茎叶图:(1)请根据茎叶图直观判断,男生组与女生组哪组学生的物理成绩更高?并用数据证明你的判断;(2)以样本中40名同学物理成绩的平均分x0为分界点,将各类人数填入如下的列联表; 分数性别高于或等于x0低于x0男生女生(3)请根据(2)中的列联表判断,能否有99.9%的把握认为物理学科学习能力与性别有关?附:K2,其中nabcd.P(K
40、2k0)0.0500.0250.0100.0050.001k03.8415.0246.6357.87910.828解析(1)男生组物理成绩比女生组物理成绩高理由如下:由茎叶图可知,男生成绩分布在8090的较多,其他分布关于茎8具有初步对称性;女生成绩分布在7080的较多,其他分布关于茎7具有初步对称性因此男生组成绩比女生组成绩高由茎叶图可知,男生组20人中,有15人(占75%)成绩超过80分,女生组20人中,只有5人(占25%)成绩超过80分,因此男生组成绩比女生组成绩高由茎叶图可知,男生组成绩的中位数是85.5分,女生组成绩的中位数是73.5分,85.573.5,因此男生组成绩比女生组成绩高
41、用茎叶图数据计算可知,男生组成绩的平均分是84分,女生组成绩的平均分是74.7分,因此男生组成绩比女生组成绩高或者,由茎叶图直观发现,男生组平均分高于80分,女生组平均分低于80分,可以判断男生组成绩高于女生组成绩(以上给出了4种理由,写出任意一种或其他合理理由均可)(2)样本中40名同学物理成绩的平均分x079.35,以此为分界点,将各类人数填入如下的列联表:分数性别高于或等于x0低于x0男生155女生515(3)计算得K2的观测值k01010.828,所以没有99.9%的把握认为物理学科学习能力与性别有关5(2019江西上饶市第二次模拟)2019年央视春晚长春分会场,演员身穿独特且轻薄的石
42、墨烯发热服,在寒气逼人的零下20 春晚现场表演了精彩的节目,石墨烯发热服的制作:从石墨中分离出石墨烯,制成石墨烯发热膜,再把石墨烯发热膜铺到衣服内(1)从石墨中分离石墨烯的一种方法是化学气相沉积法,使石墨升华后附着在材料上再结晶现在有A材料、B材料供选择,研究人员对附着在A材料上再结晶做了30次试验,成功28次;对附着在B材料上再结晶做了30次试验,成功20次用列联表判断:是否有99.5%的把握认为试验是否成功与材料A和材料B的选择有关?A材料B材料合计成功不成功合计(2)研究人员得到石墨烯后,再制作石墨烯发热膜有四个环节:透明基底及UV胶层;石墨烯层;银浆线路;表面封装层前三个环节每个环节生
43、产合格的概率为,每个环节不合格需要修复的费用均为200元;第四环节生产合格的概率为,此环节不合格需要修复的费用为100元,问:一次生产出来的石墨烯发热膜成为合格品平均需要多少修复费用?附:K2,其中nabcd.P(K2k0)0.1500.1000.0500.0250.0100.0050.001k02.0722.7063.8415.0246.6357.87910.828解析(1)列联表如下;A材料B材料合计成功282048不成功21012合计303060K2的观测值k6.77.879,没有99.5%的把握认为试验是否成功与材料A和材料B的选择有关(2)设x为一次生产出来的石墨烯发热膜为合格品所需
44、的修复费用,则x的取值可以是0,100,200.300,400,500,600,700,则P(X0)()3,P(X100)()3,P(X200)C31(1)()2,P(X300)C31(1)()2,P(X400)C32(1)2,P(X500)C32(1)2,P(X600)(1)3,P(X700)(1)3.E(X)0100200300400500600700.二次生产出来的石墨烯发热膜成为合格品平均需要元的修复费用6(2018辽宁五校协作体联考)某校高三年级有500名学生,一次考试的英语成绩服从正态分布N(100,17.52),数学成绩的频率分布直方图如下:(1)如果成绩高于135分的为特别优秀
45、,则本次考试英语、数学成绩特别优秀的学生大约各多少人?(2)试问本次考试英语和数学的平均成绩哪个较高,并说明理由;(3)如果英语和数学两科成绩都特别优秀的共有6人,从(1)中的这些学生中随机抽取3人,设3人中两科成绩都特别优秀的有人,求的分布列和数学期望参考公式及数据:若XN(,2),则P(X)0.68,P(2X2)0.96,P(3X3)0.99.解析(1)因为英语成绩服从正态分布N(100,17.52),所以英语成绩特别优秀的概率P1P(X135)(10.96)0.02,由频率估计概率,得数学成绩特别优秀的概率P20.001 6200.024,所以英语成绩特别优秀的学生大约有5000.021
46、0(人),数学成绩特别优秀的学生大约有5000.02412(人)(2)本次考试英语的平均成绩为100分,数学的平均成绩为600.16800.1681000.481200.161400.03294.72(分),因为94.72100,所以本次考试英语的平均成绩较高(3)英语和数学成绩都特别优秀的有6人,则单科成绩特别优秀的有10人,可取的值有0,1,2,3,所以P(0),P(1),P(2),P(3),故的分布列为0123PE()0123.(或因为服从超几何分布,所以E()7(2019济南市针对性检测)某企业新研发了一种产品,产品的成本由原料成本及非原料成本组成,每件产品的非原料成本y(单位:元)与
47、生产该产品的数量x(单位:千件)有关,经统计得到如下数据:x12345678y1126144.53530.5282524根据以上数据,绘制了如图所示的散点图,观察散点图,两个变量不具有线性相关关系,现考虑用反比例函数模型ya和指数函数模型ycedx分别对两个变量的关系进行拟合,已求得用指数函数模型拟合的回归方程为96.54e0.2x,lny与x的相关系数r10.94.参考数据(其中ui):uiyiuu2ui2yiyi2e2183.40.340.1151.5336022 385.561.40.135(1)用反比例函数模型求y关于x的回归方程;(2)用相关系数判断上述两个模型哪一个拟合效果更好(精
48、确到0.01),并用其估计产量为10千件时每件产品的非原料成本;(3)该企业采取订单生产模式(根据订单数量进行生产,即产品全部售出)根据市场调研数据,若该产品单价定为100元,则签订9千件订单的概率为0.8,签订10千件订单的概率为0.2;若单价定为90元,则签订10千件订单的概率为0.3,签订11千件订单的概率为0.7.已知每件产品的原料成本为10元,根据(2)的结果,企业要想获得更高利润,产品单价应选择100元还是90元,请说明理由参考公式:对于一组数据(u1,v1),(u2,v2),(un,vn),其回归直线u的斜率和截距的最小二乘估计分别为,vu.相关系数r.解析(1)令u,则ya可转
49、化为yabu,因为y45,所以100,则yu451000.3411,所以11100u,所以y关于x的回归方程为11.(2)y与的相关系数r20.99,因为|r1|6.635,所以,有99%的把握认为“该校学生观看冬奥会时间与性别有关”9(2018广州调研)某基地蔬菜大棚采用无土栽培方式种植各类蔬菜根据过去50周的资料显示,该地周光照量X(小时)都在30小时以上,其中不足50小时的有5周,不低于50小时且不超过70小时的有35周,超过70小时的有10周根据统计,该基地的西红柿增加量y(百斤)与使用某种液体肥料的质量x(千克)之间的关系为如图所示的折线图(1)依据折线图,是否可用线性回归模型拟合y
50、与x的关系?请计算相关系数r并加以说明(精确到0.01);(若|r|0.75,则线性相关程度很高,可用线性回归模型拟合)(2)蔬菜大棚对光照要求较大,某光照控制仪商家为该基地提供了部分光照控制仪,但每周光照控制仪运行台数受周光照量X限制,并有如下关系:周光照量X(单位:小时)30X70光照控制仪运行台数321若某台光照控制仪运行,则该台光照控制仪周利润为3 000元;若某台光照控制仪未运行,则该台光照控制仪周亏损1 000元以频率作为概率,商家欲使周总利润的均值达到最大,应安装光照控制仪多少台?附:相关系数公式r,参考数据:0.55,0.95.解析(1)由已知数据可得x5,y4.因为 (xix
51、)(yiy)(3)(1)000316,2,.所以相关系数r0.95.因为r0.75,所以可用线性回归模型拟合y与x的关系(2)记商家周总利润为Y元,由条件可知至少需安装1台,最多安装3台光照控制仪安装1台光照控制仪可获得周总利润3 000元安装2台光照控制仪的情形:当X70时,只有1台光照控制仪运行,此时周总利润Y3 0001 0002 000(元),P(Y2 000)0.2,当3070时,只有1台光照控制仪运行,此时周总利润Y13 00021 0001 000(元),P(Y1 000)0.2,当50X70时,有2台光照控制仪运行,此时周总利润Y23 00011 0005 000(元),P(Y5 000)0.7,当30x50时,3台光照控制仪都运行,周总利润Y33 0009 000(元),P(Y9 000)0.1,故Y的分布列为Y1 0005 0009 000P0.20.70.1所以E(Y)1 0000.25 0000.79 0000.14 600(元)综上可知,为使商家周总利润的均值达到最大,应该安装2台光照控制仪