多元统计分析及R语言建模(第五版)

您所在的位置:网站首页 概率统计与建模答案 多元统计分析及R语言建模(第五版)

多元统计分析及R语言建模(第五版)

#多元统计分析及R语言建模(第五版)| 来源: 网络整理| 查看: 265

第4章 多元相关与线性回归分析

本文用到的数据可以去这个网址下下载多元统计分析及R语言建模(第5版)数据 练习题 1)一家保险公司想了解其总公司营业部加班时间与签发的新保单数目之间的关系,经过10周时间,收集了每周加班工作时间x(小时)和签发的新保单数目y的数据(张),… (1)绘制散点图,并以此判断x与y之间是否大致呈线性关系

x = c(3.5,1,4,2,1,3,4.5,1.5,3,5) y = c(825,215,1070,550,480,920,1350,325,670,1215) z = data.frame(x,y) z

在这里插入图片描述

plot(x,y,main = '散点图',xlab = '每周加班时间(小时)',ylab = '每周签发的新保单数目(张)') #绘制散点图

在这里插入图片描述根据散点图可知,x与y之间大致呈线性关系 (2)计算x与y的相关系数

cor(x,y) #计算相关系数,相关系数计算函数cor()

在这里插入图片描述 (3)用最小二乘估计法求回归方程

lm4.1 #标准回归系数 b = lm4.2 $ coef b si = apply(lm4.2 $ model,2,sd) si bs = b[-1] * si[-1]/si[1] bs } coef.sd(lm4.2)

在这里插入图片描述 标准化偏回归系数为 x1:0.474129333891668 x2:0.330013256080993, 由标准化偏回归系数可见,广告预算和销售代理的数目对年销售额的线性影响还是挺大的

(2)在5%的显著水平下确定每一解释变量与依赖变量是否呈线性关系

summary(lm4.2)

在这里插入图片描述P=0.2412>α=0.05,所以接受原假设H0,说明x与y没有显著的线性关系

(3)计算简单相关系数和复相关系数

cor(d4.2) #多元数据相关系数矩阵

在这里插入图片描述

(R2 = summary(lm4.2) $ r.sq)

在这里插入图片描述

(R_2 = sqrt(R2)) #计算复相关系数

在这里插入图片描述 3)要了解学校毕业生起始工资的变化是否能用学生的平均成绩点数(GPA)和毕业时的年龄来解释,…

(1)试做回归模型并解释各系数

library(openxlsx) d4.3 =read.xlsx('mvexer5.xlsx',sheet = 'E4.3') (lm4.3 = lm(起始工资~ GPA + 年龄,data = d4.3))

在这里插入图片描述 多元线性回归函数:起始工资 = -5213.1 + 8508.8 GPA + 181.6 年龄 在GPA不变的情况下,年龄增加一个单位,起始工资增加181.6个单位 在年龄不变的情况下,GPA增加一个单位,起始工资增加8508.8个单位 (2)确定学生的GPA和年龄是否能真正用来解释起始工资样本的变化

summary(lm4.3)

在这里插入图片描述 R^2=Multiple R-squared=0.0.1803不接近1,说明回归方程拟合度低,学生的GPA和年龄不能真正用来解释起始工资样本的变化

(R4.3 = summary(lm4.3) $ r.sq)

在这里插入图片描述

(R_2_4.3 = sqrt(R4.3))

在这里插入图片描述 (3)预测某GPA为3.00,年龄为24岁的毕业生的起始工资

predict(lm4.3,newdata = data.frame(GPA = 3,年龄 = 24))

在这里插入图片描述

4)研究货运总量y(万吨)与工业总产值x1(亿元)、农业总产值x2(亿元)、居民非商品支出x3(亿元)的关系,…

(1)计算y,x1,x2,x3的相关系数矩阵并绘制矩阵散点图

library(openxlsx) d4.4 = read.xlsx('mvexer5.xlsx',sheet = 'E4.4') cor4.4


【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3