r语言多元线性回归

您所在的位置:网站首页 多元线性回归中的多重共线性指的是 r语言多元线性回归

r语言多元线性回归

2024-07-16 17:07| 来源: 网络整理| 查看: 265

在前两讲中,我们介绍了多元线性回归的概念以及多元线性回归中的交互作用。今天学习的主要内容是多元线性回归中的多重共线性和方差膨胀因子。

1. 共线性的概念

1

共线性

在多元回归中,两个或多个预测变量可能彼此相关,这种情况称为共线性(multicollinearity)。

2

多重共线性

存在一种称为多重共线性的极端情况,其中三个或更多变量之间存在共线性,即使没有一对变量具有特别高的相关性。这意味着预测变量之间存在冗余。

重点:在存在多重共线性的情况下,回归模型的解变得不稳定 2. 共线性的评估

对于给定的预测变量(p),可以通过计算一个称为方差膨胀因子(variance inflation factor,VIF)的分数来评估多重共线性,该分数测量由于模型中的多重共线性而使回归系数的方差膨胀了多少。

VIF的最小可能值为1(不存在多重共线性)。根据经验,VIF值超过5或10表示有共线性问题。

面对多重共线性时,应删除相关的变量,因为多重共线性的存在意味着在存在其他变量的情况下该变量提供的有关响应的信息是多余的 。

3. 多重共线性检验的R实现 3.1 加载所需的R包 tidyverse 便于数据操作和可视化 caret 简化机器学习工作流程 library(tidyverse)library(caret)


【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3