1、总体集中趋势的估计总体离散程度的估计(20分钟40分)一、选择题(每小题5分,共20分,多选题全部选对得5分,选对但不全对的得3分,有选错的得0分)1.一个样本a,3,5,7的平均数是b,且a,b是方程x2-5x+4=0的两根,则这个样本的方差是()A.3B.4C.5D.6【解析】选C.x2-5x+4=0的两根是1,4.显然a=1,b=4.故方差s2=(1-4)2+ (3-4)2+(5-4)2+(7-4)2=5.2.设样本数据x1,x2,x10的平均数和方差分别为1和4,若yi=xi+a(a为非零常数,i=1,2,10),则y1,y2,y10的平均数和方差分别为()A.1+a,4B.1+a,4
2、+aC.1,4D.1,4+a【解析】选A.因为x1,x2,x10的平均数=1,方差=4,且yi=xi+a(a为非零常数,i=1,2,10),所以y1,y2,y10的平均数=(y1+y2+y10)=(x1+x2 +x10+10a)=(x1+x2+x10)+a=+a=1+a,其方差=(y1-)2+(y2- )2+(y10-)2=(x1-1)2+(x2-1)2+(x10-1)2=4.3.某班有50名学生,在一次考试中统计出平均分数为70,方差为75,后来发现有2名学生的成绩统计有误,学生甲实际得分是80分却误记为60分,学生乙实际得分是70分却误记为90分,更正后的平均分数和方差分别是()A.70和
3、50B.70和67C.75和50D.75和67【解析】选B.设更正前甲、乙、的成绩依次为a1,a2,a50,则a1+a2+a50=5070,即60+90+a3+a50=5070,(a1-70)2+(a2-70)2+(a50-70)2=5075,即102+202+(a3-70)2+(a50-70)2=5075,更正后平均分为=(80+70+a3+a50)=70;方差为s2=(80-70)2+(70-70)2+(a3-70)2+(a50-70)2=100+(a3-70)2+(a50-70)2=(100+5075-102-202)=67.4.(多选题)有一笔统计资料,共有11个数据如下(不完全以大小
4、排列):2,4,4, 5,5,6,7,8,9,11,x,已知这组数据的平均数为6,则下列说法正确的是()A.x=5B.这组数据的众数是4C.这组数据的方差是6D.这组数据的中位数是8【解析】选AC.因为=(2+4+4+5+5+6+7+8+9+11+x)=(61+x)=6,所以x=5.方差为s2=6.这组数据的众数是5 ,中位数是5.二、填空题(每小题5分,共10分)5.一组数据的平均数是28,方差是4,若将这组数据中的每一个数据都加上20,得到一组新数据,则所得新数据的平均数是_,方差是_.【解析】设该组数据为x1,x2,xn;则新数据为x1+20,x2+20,xn+20;因为=28,所以=2
5、0+28=48.因为s2=(x1-)2+(x2-)2+(xn-)2,所以s2=x1+20-(+20)2+x2+20-(+20)2+xn+20-(+20)2=s2=4.答案:484【补偿训练】在一组数据中,共有10个数,其中3出现2次,9出现4次,-3出现1次,5出现3次,则这组数据的平均数为_.【解析】3出现2次,其和为6,9出现4次,其和为36,-3出现1次,其和为-3,5出现3次,其和为15,则这10个数据之和为6+36-3+15=54,则这组数据的平均数=5.4.答案:5.46.样本中共有五个个体,其值分别为a,0,1,2,3,若该样本平均数为1,则样本方差为_.【解析】因为样本的平均数
6、为1,所以(a+0+1+2+3)=1,解得a=-1.所以样本的方差为(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)2=2.答案:2【补偿训练】五个数1,2,3,4,a的平均数是3,则a=_,这五个数的标准差是_.【解析】由=3,得a=5;由s2=(1-3)2+(2-3)2+(3-3)2+(4-3)2+(5-3)2=2,得标准差s=.答案:5三、解答题7.(10分)(2019全国卷)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液,每组小鼠给服的溶液体积相同、摩尔浓度相
7、同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到直方图如图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值.(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).【解析】(1)由已知得0.70=a+0.20+0.15,故a=0.35.b=1-0.05-0.15-0.70=0.10.(2)甲离子残留百分比的平均值的估计值为20.15+30.20+40.30+50.20+60.10+70.05=4.05.乙离子残留百分比的平均值的估计值为
8、30.05+40.10+50.15+60.35+70.20+80.15=6.00.【补偿训练】从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:质量指标值分组75,85)85,95)95,105)105,115)115,125频数62638228(1)在下图中作出这些数据的频率分布直方图:(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表).(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定?【解析】(1)由频率分布表直接画出频率分布直方图:(2)
9、质量指标值的样本平均数为:=800.06+900.26+1000.38+1100.22+1200.08=100.质量指标值的样本方差为:s2=(-20)20.06+(-10)20.26+00.38+1020.22+2020.08=104.(3)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.08=0.68.由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定.(30分钟60分)一、选择题(每小题5分,共20分,多选题全部选对得5分,选对但不全对的得3分,有选错的得0分)1.某人5次上班途中所花的时间(单位:分
10、钟)分别为x,y,10,11,9(x,yN),已知这组数据的平均数为10,方差为2,则|x-y|的值为()A.4B.3C.2D.1【解析】选A.由这组数据的平均数为10,方差为2,可得x+y=20,(x-10)2+(y-10)2=8,因为不要直接求出x,y,只要求出|x-y|,设x=10+t,y=10-t,由(x-10)2+(y-10)2=8得t2=4,所以|x-y|=2|t|=4.故选A.【补偿训练】样本101,98,102,100,99的标准差为()A.B.0C.1D.2【解析】选A.样本平均数=100,方差为s2=2,所以标准差s=.2.甲、乙两人在相同的条件下投篮5轮,每轮甲、乙各投篮
11、10次,投篮命中次数的情况如图所示(实线为甲的折线图,虚线为乙的折线图),则以下说法错误的是()A.甲投篮命中次数的众数比乙的小B.甲投篮命中次数的平均数比乙的小C.甲投篮命中次数的中位数比乙的大D.甲投篮命中的成绩比乙的稳定【解析】选B.由折线图可知,甲投篮5轮,命中的次数分别为5,8,6,8,8,乙投篮5轮,命中的次数分别为3,7,9,5,9,则甲投篮命中次数的众数为8,乙投篮命中次数的众数为9,所以A正确;甲投篮命中次数的平均数为7,乙投篮命中次数的平均数为6.6,所以B不正确;甲投篮命中次数的中位数为8,乙投篮命中次数的中位数为7,所以C正确;甲投篮命中次数的数据集中在平均数的左右,方
12、差较小,乙投篮命中次数的数据比较分散,方差较大,所以甲的成绩更稳定一些,所以D正确.3.为了解某校一次期中考试数学成绩情况,抽取100位学生的数学成绩,得如图所示的频率分布直方图,其中成绩分组区间是40,50),50,60),60,70), 70,80),80,90),90,100 ,则估计该次数学成绩的中位数是()A.71.5B.71.8C.72D.75【解析】选C.40,50)的频率为:0.00410=0.04;50,60)的频率为:a10=10a;60,70)的频率为:0.0310=0.3;70,80)的频率为:0.0410=0.4;80,90)的频率为:0.0110=0.1;90,10
13、0的频率为:a10=10a.所以0.04+10a+0.3+0.4+0.1+10a=1,得:a=0.008.40,50),50,60),60,70)的频率和为:0.04+0.08+0.3=0.42.由=,得中位数为:70+10=72.【补偿训练】如图是一个容量为100的样本的重量频率分布直方图,则由图可估计样本重量的中位数为_. 【解析】根据频率分布直方图,得0.065=0.30.5,令0.3+0.1x=0.5,解得x=2,所以中位数是10+2=12.答案:124.(多选题)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则下列说法正确的是()A.甲的成绩的平均数等于乙的成绩
14、的平均数B.甲的成绩的中位数等于乙的成绩的中位数C.甲的成绩的方差小于乙的成绩的方差D.甲的成绩的极差小于乙的成绩的极差【解析】选AC.甲的平均数:(4+5+6+7+8)=6,乙的平均数:(53+6+9)=6,甲的成绩的方差为2,乙的成绩的方差为2.4.甲、乙的极差均为4,故AC正确.由图知甲的中位数为6,乙的中位数为5,所以B错,甲的成绩的极差为8-4=4,乙的成绩的极差为9-5=4,甲乙的极差相等,所以D错.二、填空题(每小题5分,共20分)5.已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是_.【解析】样本数据的平均数为5.1,所以方差为s2=(4.7-5.1)2+
15、(4.8-5.1)2+(5.1-5.1)2+(5.4-5.1)2+(5.5-5.1)2=(-0.4)2+(-0.3)2+02+0.32+0.42=(0.16+0.09+0.09+0.16)=0.5=0.1.答案:0.16.若6个数的标准差为2,平均数为1,则这6个数的平方和为_.【解析】由s=即2=得+=30.答案:307.为了考察某校各班参加课外书法小组的人数,从全校随机抽取5个班级,把每个班级参加该小组的人数作为样本数据.已知样本平均数为7,样本方差为4,且样本数据互不相同,则样本数据中的最大值为_.【解析】设5个班级中参加的人数分别为x1,x2,x3,x4,x5,则由题意知=7,(x1-
16、7)2+(x2-7)2+(x3-7)2+(x4-7)2+(x5-7)2=20,五个整数的平方和为20,则必为0+1+1+9+9=20,由|x-7|=3可得x=10或x=4.由|x-7|=1可得x=8或x=6,由上可知参加的人数分别为4,6,7,8,10,故最大值为10.答案:108.某学员在一次射击测试中射靶10次,命中环数如下:7,8,7,9,5,4,9,10,7,4.则:(1)平均命中环数为_;(2)命中环数的标准差为_.【解析】(1)=(7+8+7+9+5+4+9+10+7+4)=7.(2)s2=(7-7)2+(8-7)2+(7-7)2+(9-7)2+(5-7)2+(4-7)2+(9-7
17、)2+(10-7)2+(7-7)2+(4-7)2=4,所以s=2.答案:(1)7(2)2三、解答题(每小题10分,共20分)9.某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成五组,绘制成如图所示的频率分布直方图,已知图中从左到右的第一、二、三、四、五小组的频率分别是0.30,0.40,0.15,0.10,0.05.求:(1)高一参赛学生的成绩的众数、中位数;(2)高一参赛学生的平均成绩.【解析】(1)由图可知众数为65,因为第一个小矩形的面积为0.3,所以设中位数为60+x,则0.3+x0.04=0.5,得x=5,所以中位数为60+5=65.(2)依题意,平均成绩为550.3+6
18、50.4+750.15+850.1+950.05=67,故平均成绩约为67.10.某纺织厂订购一批棉花,其各种长度的纤维所占的比例如表所示:纤维长度/厘米356所占的比例(%)254035(1)请估计这批棉花纤维的平均长度与方差;(2)如果规定这批棉花纤维的平均长度为4.90厘米,方差不超过1.200平方厘米,两者允许误差均不超过0.10视为合格产品.请你估计这批棉花的质量是否合格?【解析】(1)=325%+540%+635%=4.85(厘米).s2=(3-4.85)20.25+(5-4.85)20.4+(6-4.85)20.35=1.327 5(平方厘米).由此估计这批棉花纤维的平均长度为4.85厘米,方差为1.327 5平方厘米.(2)因为4.90-4.85=0.050.10,故棉花纤维长度的平均值达到标准,但方差超过标准,所以可认为这批产品不合格.