1、一、选择题1某商品的销售量y(件)与销售价格x(元/件)存在线性相关关系根据一组样本数据(xi,yi)(i1,2,n),用最小二乘法建立的回归方程为5x150,则下列结论正确的是()Ay与x具有正的线性相关关系B若r表示y与x之间的线性相关系数,则r5C当销售价格为10元时,销售量为100件D当销售价格为10元时,销售量为100件左右解析:选D由回归直线方程知,y与x具有负的线性相关关系,A错,若r表示y与x之间的线性相关系数,则|r|1,B错当销售价格为10元时,510150100,即销售量为100件左右,C错,故选D2利用独立性检验来考虑两个分类变量X和Y是否有关系时,通过查阅下表来确定“
2、X和Y有关系”的可信度如果k3841,那么有把握认为“X和Y有关系”的百分比为()P(K2k0)0500400250150100050025001000050001k004550708132320722706384150246635787910828A5%B75%C995% D95%解析:选D由图表中数据可得,当k3841时,有95%的把握认为“X和Y有关系”,故选D3广告投入对商品的销售额有较大影响某电商对连续5个年度的广告费x和销售额y进行统计,得到统计数据如下表(单位:万元):广告费x23456销售额y2941505971由上表可得回归方程为102x,据此模型,预测广告费为10万元时销售
3、额约为()A1012万元 B1088万元C1112万元 D1182万元解析:选C根据统计数据表,可得(23456)4,(2941505971)50,而回归直线102x经过样本点的中心(4,50),所以501024,解得92,所以回归方程为102x92,所以当x10时,y10210921112,故选C4某考察团对10个城市的职工人均工资x(千元)与居民人均消费y(千元)进行调查统计,得出y与x具有线性相关关系,且回归方程为06x12若某城市职工人均工资为5千元,估计该城市人均消费额占人均工资收入的百分比为()A66% B67%C79% D84%解析:选D因为y与x具有线性相关关系,满足回归方程0
4、6x12,该城市居民人均工资为x5,所以可以估计该城市的职工人均消费水平0651242,所以可以估计该城市人均消费额占人均工资收入的百分比为84%二、填空题5经调查某地若干户家庭的年收入x(万元)和年饮食支出y(万元)具有线性相关关系,并得到y关于x的回归直线方程:0245x0321,由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加_万元解析:x变为x1,0245(x1)03210245x03210245,因此家庭年收入每增加1万元,年饮食支出平均增加0245万元答案:02456在2018年1月15日那天,某市物价部门对本市的5家商场的某商品的一天销售量及其价格进行调查,5家商场
5、的售价x元和销售量y件之间的一组数据如下表所示:价格x995m10511销售量y11n865由散点图可知,销售量y与价格x之间有较强的线性相关关系,其线性回归方程是32x40,且mn20,则n_解析:8,6,回归直线一定经过样本中心(,),即63240,即32mn42又因为mn20,即解得故n10答案:10三、解答题7某公司的广告费支出x(单位:万元)与销售额y(单位:万元)之间有下列对应数据:x24568y3040605070(1)画出散点图,并判断广告费与销售额是否具有相关关系;(2)根据表中提供的数据,求出y与x的回归方程x;(3)预测销售额为115万元时,大约需要多少万元广告费解:(1
6、)散点图如图由图可判断:广告费与销售额具有相关关系(2)(24568)5,(3040605070)50,xiyi2304405606508701 380,x2242526282145,65,50655175所以线性回归方程为65x175(3)由题得y115时,65x175115,得x15故预测销售额为115万元时,大约需要15万元的广告费8共享单车为很多市民解决了出行难题然而,这种模式也遇到了一些让人尴尬的问题,比如乱停乱放,或将共享单车占为“私有”等为此,某机构就是否支持发展共享单车随机调查了50人,他们年龄的分布及支持发展共享单车的人数统计如下表:年龄15,20)20,25)25,30)3
7、0,35)35,40)40,45受访人数56159105支持发展共享单车人数4512973(1)由以上统计数据填写下面的22列联表,并判断能否在犯错误的概率不超过0.1的前提下,认为年龄与是否支持发展共享单车有关系;年龄低于35岁年龄不低于35岁合计支持不支持合计(2)若对年龄在15,20),20,25)的被调查人中各随机选取2人进行调查,记选中的4人中支持发展共享单车的人数为X,求随机变量X的分布列及数学期望参考数据:P(K2k0)0.500.400.250.150.100.050.0250.0100.0050.001k00.4550.7081.3232.0722.7063.8415.024
8、6.6357.87910.828参考公式:K2,其中nabcd.解:(1)根据所给数据得到如下22列联表:年龄低于35岁年龄不低于35岁合计支持301040不支持5510合计351550根据22列联表中的数据,得到K2的观测值为k2.382.706.所以不能在犯错误的概率不超过0.1的前提下,认为年龄与是否支持发展共享单车有关系(2)由题意,年龄在15,20)的5个受访人中,有4人支持发展共享单车;年龄在20,25)的6个受访人中,有5人支持发展共享单车所以随机变量X的所有可能取值为2,3,4.因为P(X2),P(X3),P(X4),所以随机变量X的分布列为X234P所以随机变量X的数学期望E
9、(X)234.1某市房地产相关数据显示,2016年该市新建住宅销售均价走势如图所示,3月至7月房价上涨过快,政府从8月份开始采取宏观调控措施,10月份开始房价得到很好控制(1)根据房地产数据发现,3月份至7月份的各月均价y(万元/平方米)与月份x之间具有较强的线性相关关系,试建立y关于x的回归方程;若政府不调控,依此相关关系预测12月份该市新建住宅的销售均价;(2)房地产数据研究所在2016年的12个月份中,随机抽取3个月的数据进行样本分析,若关注所抽3个月份的所属季度,记不同季度的个数为X,求X的分布列和数学期望参考数据:xi 25,yi5.36, (xi)(yi)0.64.参考公式:回归直
10、线x的斜率和截距的最小二乘估计分别为 所以0.064,yx1.0720.06450.752.所以y关于x的回归方程为0.064x0.752.将x12代入回归方程,得0.064120.7521.52,所以预测12月份该市新建住宅的销售均价约为1.52万元/平方米(2)根据题意,X的可能取值为1,2,3.P(X1),P(X3),P(X2)1P(X1)P(X3),所以X的分布列为X123P因此,X的数学期望E(X)123.2国内某知名大学有男生14 000人,女生10 000人,该体育学院想了解本校学生的运动状况,根据性别采取分层抽样的方法从全校学生中抽取120人,统计他们平均每天运动的时间,如表(
11、平均每天运动的时间单位:小时,该校学生平均每天运动的时间范围是0,3)男生平均每天运动的时间分布情况:平均每天运动的时间0,0.5)0.5,1)1,1.5)1.5,2)2,2.5)2.5,3人数212231810x女生平均每天运动的时间分布情况:平均每天运动的时间0,0.5)0.5,1)1,1.5)1.5,2)2,2.5)2.5,3人数51218103y(1)请根据样本估算该校男生平均每天运动的时间(结果精确到0.1);(2)若规定平均每天运动的时间不少于2小时的学生为“运动达人”,低于2小时的学生为“非运动达人”请根据样本估算该校“运动达人”的数量;请根据上述表格中的统计数据填写下面22列联
12、表,并通过计算判断能否在犯错误的概率不超过0.05的前提下认为“运动达人”与性别有关?运动达人非运动达人总计男生女生总计参考公式:K2,其中nabcd.参考数据:P(K2k0)0.100.050.0250.0100.0050.001k02.7063.8415.0246.6357.87910.828解:(1)由分层抽样可知,抽取的男生人数为12070,抽取的女生人数为1207050,故x5,y2.则该校男生平均每天运动的时间为:1.5,故该校男生平均每天运动的时间约为1.5小时(2)样本中“运动达人”所占比例是,故估计该校“运动达人”有(14 00010 000)4 000(人)运动达人非运动达人总计男生155570女生54550总计20100120K2的观测值k2.7433.841,所以不能在犯错误的概率不超过0.05的前提下认为“运动达人”与性别有关