1、课时作业61变量间的相关关系、统计案例一、选择题1(2020昆明市诊断测试)某商家今年上半年各月的人均销售额(单位:千元)与利润率统计表如下:月份123456人均销售额658347利润率(%)12.610.418.53.08.116.3根据表中数据,下列说法正确的是(A)A利润率与人均销售额成正相关关系B利润率与人均销售额成负相关关系C利润率与人均销售额成正比例函数关系D利润率与人均销售额成反比例函数关系解析:画出利润率与人均销售额的散点图,如图由图可知利润率与人均销售额成正相关关系故选A.2下列说法错误的是(B)A自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系B
2、在线性回归分析中,相关系数r的值越大,变量间的相关性越强C在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高D在回归分析中,R2为0.98的模型比R2为0.80的模型拟合的效果好解析:根据相关关系的概念知A正确;当r0时,r越大,相关性越强,当r6.635,有99%以上的把握认为“生育意愿与城市级别有关”二、填空题9经调查某地若干户家庭的年收入x(万元)和年饮食支出y(万元)具有线性相关关系,并得到y关于x的线性回归直线方程:0.245x0.321,由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加0.245万元解析:x变为x1,0.245(x1)0.3210.24
3、5x0.3210.245,因此家庭年收入每增加1万元,年饮食支出平均增加0.245万元10在一次考试中,5名学生的数学和物理成绩如下表:(已知学生的数学和物理成绩具有线性相关关系)学生的编号i12345数学成绩x8075706560物理成绩y7066686462现已知其线性回归方程为y0.36x,则根据此线性回归方程估计数学得90分的同学的物理成绩为73.(四舍五入到整数)解析:70,66,所以660.3670,40.8,即线性回归方程为0.36x40.8.当x90时,0.369040.873.273.11已知某次考试之后,班主任从全班同学中随机抽取一个容量为8的样本,他们的数学、物理成绩(单
4、位:分)对应如下表:学生编号12345678数学成绩6065707580859095物理成绩7277808488909395给出散点图如下:根据以上信息,判断下列结论:根据散点图,可以判断数学成绩与物理成绩具有线性相关关系;根据散点图,可以判断数学成绩与物理成绩具有一次函数关系;从全班随机抽取甲、乙两名同学,若甲同学数学成绩为80分,乙同学数学成绩为60分,则甲同学的物理成绩一定比乙同学的物理成绩高其中正确的个数为1.解析:由散点图知,各点都分布在一条直线附近,故可以判断数学成绩与物理成绩具有线性相关关系,但不能判断数学成绩与物理成绩具有一次函数关系,故正确,错误;若甲同学数学成绩为80分,乙
5、同学数学成绩为60分,则甲同学的物理成绩可能比乙同学的物理成绩高,故错误综上,正确的个数为1.12为了研究工人的日平均工作量是否与年龄有关,从某工厂抽取了100名工人,且规定日平均生产件数不少于80件者为“生产能手”,列出的22列联表如下:生产能手非生产能手总计25周岁以上25356025周岁以下103040总计3565100有90%以上的把握认为“工人是否为生产能手与工人的年龄有关”.P(K2k)0.100.0500.0100.001k2.7063.8416.63510.828解析:由22列联表可知,K22.93,因为2.932.706,所以有90%以上的把握认为“工人是否为生产能手与工人的
6、年龄有关”三、解答题13(2019全国卷)某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:满意不满意男顾客4010女顾客3020(1)分别估计男、女顾客对该商场服务满意的概率;(2)能否有95%的把握认为男、女顾客对该商场 服务的评价有差异?解:(1)由调查数据知,男顾客中对该商场服务满意的比率为0.8,因此男顾客对该商场服务满意的概率的估计值为0.8.女顾客中对该商场服务满意的比率为0.6,因此女顾客对该商场服务满意的概率的估计值为0.6.(2)K24.762.由于4.7623.841,故有95%的把握认为男、女顾客对
7、该商场服务的评价有差异14(2020长沙市统考)某互联网公司为了确定下一季度的前期广告投入计划,收集了近6个月广告投入量x(单位:万元)和收益y(单位:万元)的数据如下表:月份123456广告投入量/万元24681012收益/万元14.2120.3131.831.1837.8344.67他们用两种模型ybxa,yaebx分别进行拟合,得到相应的回归方程并进行残差分析,得到如图所示的残差图及一些统计量的值:iyi7301 464.24364(1)根据残差图,比较模型,的似合效果,应选择哪个模型?并说明理由(2)残差绝对值大于2的数据被认为是异常数据,需要剔除:()剔除异常数据后,求出(1)中所选
8、模型的回归方程;()广告投入量x18时,(1)中所选模型收益的预报值是多少?附:对于一组数据(x1,y1),(x2,y2),(xn,yn),其回归直线x的斜率和截距的最小二乘估计分别为:,.解:(1)应该选择模型,因为模型的残差点比较均匀地落在水平的带状区域中,且模型的带状区域比模型的带状区域窄,所以模型的拟合精度高,回归方程的预报精度高(2)()剔除异常数据,即3月份的数据后,得(766)7.2,(30631.8)29.64.iyi1 464.24631.81 273.44,36462328.3,29.6437.28.04.所以y关于x的回归方程为3x8.04.()所x18代入()中所求回归
9、方程得3188.0462.04,故预报值为62.04万元15(2020福建省高三检测)“工资条里显红利,个税新政入民心”随着2019年新年钟声的敲响,我国自1980年以来,力度最大的一次个人所得税(简称个税)改革迎来了全面实施的阶段某IT从业者为了解自己在个税新政下能享受多少税收红利,绘制了他在26岁35岁(2009年2018年)之间各年的月平均收入y(单位:千元)的散点图:(1)由散点图知,可用回归模型yblnxa拟合y与x的关系,试根据有关数据建立y关于x的回归方程;(2)如果该IT从业者在个税新政下的专项附加扣除为3 000元/月,试利用(1)的结果,将月平均收入视为月收入,根据新旧个税
10、政策,估计他36岁时每个月少缴纳的个人所得税附注:1.参考数据:i55,i155.5,(xi)282.5,(xi)(yi)94.9,i15.1,(ti)24.84,(ti)(yi)24.2,其中tiln xi;取ln 112.4,ln 363.6.2参考公式:回归方程vbua中斜率和截距的最小二乘估计分别为,.3新旧个税政策下每月应纳税所得额(含税)计算方法及税率表如下:解:(1)令tln x,则ybta.5,15.55,1.51,15.5551.518,所以y关于t的回归方程为y5t8.因为tln x,所以y关于x的回归方程为y5ln x8.(2)由(1)得该IT从业者36岁时月平均收入为y5ln11852.4820(千元)旧个税政策下每个月应缴纳的个人所得税为1 5003%3 00010%4 50020%(20 0003 5009 000)25%3 120(元)新个税政策下每个月应维纳的个人所得部为3 0003%(20 0005 0003 0003 000)10%990(元)故根据新旧个税政策,该IT从业者36岁时每个月少缴纳的个人所得税为3 1209902 130(元)