1、第二章 统计 章末综合提升 巩 固 层 知 识 整 合 提 升 层 题 型 探 究 用样本的频率分布估计总体分布【例 1】某地教育部门为了调查学生在数学考试中的有关信息,从上次考试的 10 000 名考生中用分层抽样的方法抽取 500 人,并根据这 500 人的数学成绩画出样本的频率分布直方图(如图),则这10 000 名考生的数学成绩在140,150内的约有_人思路点拨:根据频率分布直方图求出样本中数学成绩在140,150内的频率,可估计总体中成绩在140,150内的人数 800 由样本的频率分布直方图知数学成绩在140,150内的频率是相应小矩形的面积,即 0.008100.08,因此这
2、10 000 名考生中数学成绩在140,150内的约有 10 0000.08800(人)用样本的频率分布估计总体分布 通常要对样本数据进行列表、作图处理.这类问题采取的图表主要有:条形图、直方图、茎叶图、频率分布折线图、扇形图等.它们的主要优点是直观,能够清楚表示总体的分布走势.除茎叶图外,其他几种图表法的缺点是原始数据信息有丢失.跟进训练1已知总体数据均在10,70内,从中抽取一个容量为 20 的样本,分组后对应组的频数如下表所示:分组10,20)20,30)30,40)40,50)50,60)60,70 频数234542 则总体数据在区间10,50)内的频率约为()A0.5 B0.25C0
3、.6D0.7D 由频率分布表可知样本数据在区间10,50)内的频数等于10,20),20,30),30,40),40,50)四个分组的频数之和,即 234514,频率为14200.7.由样本的频率分布估计总体分布的思想可知,总体数据在区间10,50)内的频率约为 0.7.用样本的数字特征估计总体的数字特征【例 2】在射击比赛中,甲、乙两名运动员分在同一小组,给出了他们命中的环数如下表:甲9676277989 乙24687897910 赛后甲、乙两名运动员都说自己是胜者,如果你是裁判,你将给出怎样的评判?思路点拨:规则不同,评判结果有所不同 解 为了分析的方便,先计算两人的统计指标如下表所示 平
4、均环数方差中位数命中 10 环次数 甲7470乙75.47.51规则 1:平均环数和方差相结合,平均环数高者胜若平均环数相等,则再看方差,方差小者胜,则甲胜 规则 2:平均环数与中位数相结合,平均环数高者胜若平均环数相等,则再看中位数,中位数大者胜,则乙胜 规则 3:平均环数与命中 10 环次数相结合,平均环数高者胜若平均环数相等,则再看命中 10 环次数,命中 10 环次数多者胜,则乙胜 以上规则都是以平均环数为第一标准,如果比赛规则是看命中 7环以上或 10 环的次数,那么就不需要先看平均环数了样本的数字特征可分为两大类,一类反映样本数据的集中趋势,包括样本平均数、众数、中位数;另一类反映
5、样本数据的波动大小,包括样本方差及标准差.通常,我们用样本的数字特征估计总体的数字特征.有关样本平均数及方差的计算和应用是高考考查的热点.跟进训练2如图是某赛季甲、乙两名篮球运动员 5 场比赛得分的茎叶图,已知甲的成绩的极差为 31,乙的成绩的平均值为 24,则下列结论错误的是()Ax9By8C乙的成绩的中位数为 26D乙的成绩的方差小于甲的成绩的方差B 甲的成绩极差为 31,所以最高成绩为 39.x9;由乙平均值是 24,得 y245(12252631)206;由茎叶图知乙成绩的中位数为 26,对比甲、乙成绩分布发现,乙成绩较集中,其方差较小.用线性回归方程对总体进行估计 【例 3】理论预测
6、某城市 2020 到 2024 年人口总数与年份的关系如下表所示:年份 202x(年)01234 人口数 y(十万)5781119(1)请画出上表数据的散点图;(2)指出 x 与 y 是否线性相关;(3)若 x 与 y 线性相关,请根据上表提供的数据,用最小二乘法求出 y 关于 x 的回归方程ybxa;(4)据此估计 2025 年该城市人口总数(参数数据:051728311419132,021222324230)解(1)数据的散点图如图:(2)由散点图可知,样本点基本上分布在一条直线附近,故 x 与 y 呈线性相关(3)由表知:x15(01234)2,y15(5781119)10.bi15xi
7、yi5x yi15x2i5x 23.2,ayb x3.6,回归方程为y3.2x3.6.(4)当 x5 时,y19.6(十万)196 万故 2025 年该城市人口总数约为 196 万对两个变量进行研究,通常是先作出两个变量之间的散点图,根据散点图直观判断两个变量是否具有线性相关关系,如果具有,就可以应用最小二乘法求线性回归直线方程由于样本可以反映总体,所以可以利用所求的线性回归直线方程,对这两个变量所确定的总体进行估计,即根据一个变量的取值,预测另一个变量的取值跟进训练3随着我国经济的发展,居民的储蓄存款逐年增长设某地区城乡居民人民币储蓄存款(年底余额)如下表:年份201320142015201
8、62017 时间代号 t12345储蓄存款 y(千亿元)567810(1)求 y 关于 t 的回归方程yb ta;(2)用所求回归方程预测该地区 2018 年(t6)的人民币储蓄存款解(1)列表计算如下:itiyit2itiyi 11515 226412337921448163255102550 153655120这里 n5,t1ni1nti155 3,y1ni1nyi365 7.2.i1nt2int 25553210,i1ntiyin t y120537.212,从而b12101.2,ayb t7.21.233.6,故所求回归方程为 y1.2t3.6.(2)将 t6 代入回归方程可预测该地区 2018 年的人民币储蓄存款为y1.263.610.8(千亿元)Thank you for watching!