VIF检验相关性

您所在的位置:网站首页 vif检验r语言 VIF检验相关性

VIF检验相关性

2023-10-12 06:26| 来源: 网络整理| 查看: 265

VIF可以用来度量多重共线性问题, V I F j = 1 1 − R j 2 \quad \mathrm{VIF}_{j}=\frac{1}{1-R_{j}^{2}} VIFj​=1−Rj2​1​ 式子中, R j 2 R_{j}^{2} Rj2​是第 j j j个变量在所有变量上回归时的确定系数。 如果VIF过大(比如大于5或10),则意味着存在多重共线性问题。关于多重共线性更多内容可以参考往期文章https://blog.csdn.net/weixin_45288557/article/details/111769464

(由于没有VIF临界值表,我们只能使用经验法则:若VIF>5,则存在严重多重共线性。也有人建议用VIF>10作为存在严重多重共线性的标准,特别在解释变量多的情形应当如此。)

#数据 df = pd.read_excel(io='数据.xlsx', sheet_name=0, usecols=range(1,5)) # 务必注意:一定要加上常数项,#如果没有常数项列,计算结果天差地别,可能VIF等于好几千 df['Constant Value']=1 #添加常数项 df.head() from statsmodels.stats.outliers_influence import variance_inflation_factor # 这里可以选择想要判断的变量列 df_tezheng=df[["var1","var2","var3","var4","var5", 'Constant Value']] # 进行vif检验 vif=[] for i in range(df_tezheng.shape[1]-1): #计算第i+1个变量的(第i+1列)的方差膨胀因子 vif.append(variance_inflation_factor(df_tezheng.values,i)) #result_out yy=pd.DataFrame(df_tezheng.columns[:-1,]) yy.rename(columns={0:"var_name"},inplace=True) yy["vif"]=vif print(yy)


【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3