1、规范答题必考大题突破课(六)概率与统计【热点标签】1.题型:解答题 2.分值:12分 3.难度:中档 【热点题型】题型一:有关统计、统计案例的计算问题:以统计图表或文字叙述的实际问题为载体,考查频率分布表、频率分布直方图、茎叶图、用样本的数字特征估计总体的数字特征,回归方程的求法与应用,独立性检验及运用数学知识解决实际问题的能力 题型二:概率与统计、离散型随机变量及其分布列的综合问题:以统计图表为载体,考查统计的有关图表及运算、概率的计算,以及离散型随机变量的分布列、均值与方差,同时考查对数据的处理能力和数形结合思想 题型一 有关统计、统计案例的计算问题【真题示例】(12分)(2015全国卷)
2、某公司为确定 下一年度投入某种产品的宣传费,需了解年宣传费x(单 位:千元)对年销售量y(单位:t)和年利润z(单位:千 元)的影响,对近8年的年宣传费xi和年销售量yi(i=1,2,8)数据作了初步处理,得到下面的散点图及一些 统计量的值.(1)根据散点图判断,y=a+bx与y=c+d 哪一个适宜作 为年销售量y关于年宣传费x的回归方程类型?(给出判 断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y关于x的回归 方程.x(3)已知这种产品的年利润z与x,y的关系为z=0.2y-x.根据(2)的结果回答下列问题:年宣传费x=49时,年销售量及年利润的预报值是多少?年宣传费x为
3、何值时,年利润的预报值最大?【信息解读】(1)看到 散点图,想到 所给两个函数 的图象.(2)看到 建立y关于x的回归方程,想到 线性回归方 程.(3)看到 x=49,想到 代入 求 ,再求 .看到 年利润的预报值的最大值,想到 求函数 的最大值.ycd xyzz【标准答案】(1)由散点图的变化趋势可以判断,y=c+d 适宜作为年销售量y关于年宣传费x的回归方程类型.2分 得分点(2)令w=,先建立y关于w的线性回归方程.由于 xx8iii 182ii 1(ww)(yy)108.8d68,1.6(ww)所以 2分 得分点 所以y关于w的线性回归方程为 =100.6+68w,所以y关于x的回归方
4、程为 =100.6+68 .2分 得分点 cydw563 68 6.8100.6,yyx(3)由(2)知,当x=49时,年销售量y的预报值 =100.6+68 =576.6,年利润z的预报值 =576.60.2-49=66.32.3分 得分点 49yz根据(2)的结果知,年利润z的预报值 =0.2(100.6+68 )-x=-x+13.6 +20.12.所以当 =6.8,即x=46.24时,取得最大值.故年宣传费为46.24千元时,年利润的预报值最大.3分 得分点 zxx13.6x2z【得分细则答题规则】第(1)问踩点说明(针对得分点)只要由散点图得出y=c+d 符合,即可得2分.第(2)问踩
5、点说明(针对得分点)得分点有两处:一是求出 得1分,二是求出 得1分.得分点有两处:一是写出 =100.6+68w得1分,二是转 化为 关于x的回归方程得1分.xdyyc第(3)问踩点说明(针对得分点)得分点有两处:一是求出 得2分,二是求出 得1分.第(3)问踩点说明(针对得分点)得分点有两处:一是求出当x=46.24时,最大得2分,二是下结论得1分.yzz答题规则1:写全解题步骤,步步为“赢”:解题时,要将解题过程转化为得分点,对于是得分点的 解题步骤一定要写全,阅卷时根据步骤评分,有则得分,无则不得分.如本题(2)中求 的步骤及(3)中最 后的结论等如果不全,就会失分.d,c答题规则2:
6、熟练应用有关统计、统计案例计算公式,准 确计算:统计、统计案例有关计算公式的熟记及准确运算是得 分的关键.如本题中 的计算公式,能够正确应用、准 确运算并写出相应步骤即可得分.d【跟踪训练】(2016郑州模拟)某校数学课外兴趣小组为研究数学成绩是否与性别有关,先统计本校高三年级每个学生一学期数学成绩平均分(采用百分制).剔除平均分在30分以下的学生后,共有男生300名,女生200名.现采用分层抽样的方法,从中抽取了100名学生,按性别分为两组,并将两组学生成绩分为6组,得到如下所示频数分布表.(1)估计男、女生各自的成绩平均分(同一组数据用该组区间中点值作代表),从计算结果看,判断数学成绩与性
7、别是否有关.分数段40,50)50,60)60,70)70,80)80,90)90,100男39181569女64510132(2)规定80分以上为优分(含80分),请你根据已知条件作出22列联表,并判断是否有充分的证据显示“数学成绩与性别有关”.优分非优分总计男生女生总计100附表及公式 K2=,其中n=a+b+c+d.P(K2k0)0.1000.0500.0100.001k02.7063.8416.63510.8282n(adbc)(ab)(cd)(ac)(bd)【解析】(1)=450.05+550.15+650.3+75 0.25+850.1+950.15=71.5.=450.15+55
8、0.10+650.125+750.25+85 0.325+950.05=71.5,从男、女生各自的成绩平均分来看,并不能判断数学 成绩与性别有关.x男x女(2)由频数分布表可知:在抽取的100学生中,“男生组”中的优分有15人,“女生组”中的优分有15人,据此可得22列联表如下:优分 非优分 总计 男生 15 45 60 女生 15 25 40 总计 30 70 100 可得K2的观测值k=1.79,因为1.792.706,所以没有充分的证据显示“数学成绩与性别有关”.2100(15 25 15 45)60 40 30 70题型二 概率与统计、离散型随机变量及其分布列的综合问题【真题示例】(1
9、2分)(2015全国卷)某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了20个用户,得到用户对产品的满意度评分如下:A地区:62 73 81 92 95 85 74 64 53 76 78 86 95 66 97 78 88 82 76 89 B地区:73 83 62 51 91 46 53 73 64 82 93 48 65 81 74 56 54 76 65 79(1)根据两组数据完成两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,得出结论即可).(2)根据用户满意度评分,将用户的满意度从低到高分为三个等级:满意度评分低于
10、70分70分到89分不低于90分满意度等级不满意满意非常满意记事件C:“A地区用户的满意度等级高于B地区用户的满意度等级”,假设两地区用户的评价结果相互独立,根据所给数据,以事件发生的频率作为相应事件发生的概率,求C的概率.【信息解读】(1)看到 完成茎叶图,想到 画茎叶图的 要求.看到 通过 茎叶图比较两地区满意度评分,想到 茎叶 图能反映样本数据分布的特点.(2)看到 求C的概率,想到 求复杂事件概率的方法.【标准答案】(1)两地区用户满意度评分的茎叶图如图.2分 得分点 通过茎叶图可以看出,A地区用户满意度评分的平均值高于B地区用户满意度评分的平均值;A地区用户满意度评分比较集中,B地区
11、用户满意度评分比较分散.2分 得分点(2)记CA1表示事件:“A地区用户的满意度等级为满意 或非常满意”;CA2表示事件:“A地区用户的满意度等级为非常满意”;CB1表示事件:“B地区用户的满意度等级为不满意”;CB2表示事件:“B地区用户的满意度等级为满意”;则CA1与CB1相互独立,CA2与CB2相互独立,CB1与CB2互斥,C=CB1CA1CB2CA2.2分 得分点 P(C)=P(CB1CA1CB2CA2)=P(CB1CA1)+P(CB2CA2)=P(CB1)P(CA1)+P(CB2)P(CA2),2分 得分点 由所给数据得CA1,CA2,CB1,CB2的频率分别为 故P(CA1)=,P
12、(CA2)=,P(CB1)=,P(CB2)=.所以P(C)=0.48.4分 得分点 16410820 20 20 20,8201620420102010168420202020【得分细则答题规则】第(1)问踩点说明(针对得分点)正确完成茎叶图得2分.得分点有两处,一是由茎叶图正确比较出两地区满意度评分的平均值得1分,二是由茎叶图正确比较出两地区满意度评分的分散程度得1分.第(2)问踩点说明(针对得分点)得分点有两处,一是将相关事件字母化得1分,二是将待求事件正确表示为已知或易求概率事件的积、和,得1分.正确将待求概率转化为其他概率的和与积,得2分.得分点有两处,一是准确求出P(CA1),P(C
13、A2),P(CB1),P(CB2)得2分,二是准确求出P(C)得2分.答题规则1:写全解题步骤,步步为“赢”:解题时,要将解题过程转化为得分点,对于是得分点的解题步骤一定要写全,阅卷时根据步骤评分,有则得分,无则不得分.如本题(2)中将相关事件字母化的步骤,求P(CA1),P(CA2),P(CB1),P(CB2)的步骤等,如果不全,就会失分.答题规则2:熟练应用相关公式,准确运算:统计、统计案例,概率与离散型随机变量的均值、方差 公式,互斥事件有一个事件发生的概率公式,独立事件 同时发生的概率公式等公式的熟练应用,并能准确运算,是得分的关键,如本题能正确应用P(C)=P(CB1)P(CA1)+
14、P(CB2)P(CA2),且能准确计算,并写出相应步骤即可得分.【跟踪训练】(2016青岛模拟)根据某电子商务平台的调查统计 显示,参与调查的1 000位上网购 物者的年龄情况如图所示.(1)已知30,40)、40,50)、50,60)三个年龄段的上网购物者人数成等差数列,求a,b的值.(2)该电子商务平台将年龄在30,50)内的人群定义为高消费人群,其他年龄段的人群定义为潜在消费人群,为了鼓励潜在消费人群的消费,该平台决定发放代金券,高消费人群每人发放50元代金券,潜在消费人群每人发放100元的代金券,现采用分层抽样的方式从参与调查的1 000位上网购物者中抽取10人,并在这10人中随机抽取
15、3人进行回访,求此3人获得代金券总和X(单位:元)的分布列与均值.【解析】(1)由题意可知 解得a=0.035,b=0.025.2ba0.015,(0.0100.015 2ba)101,(2)利用分层抽样从样本中抽取10人,易知其中属于高消费人群的有6人,属于潜在消费人群的有4人.从该10人中抽取3人,此3人所获得代金券的总和为X(单位:元),则X的所有可能取值为150,200,250,300.P(X=150)=P(X=200)=P(X=250)=P(X=300)=X的分布列为 36310C1,C62164310C C1,C21264310C C3,C1034310C1.C30X 150 200 250 300 P 1612310130E(X)=1131150200250300210.621030