美赛 6:相关性模型、回归模型(十大模型篇)

您所在的位置:网站首页 高级数据分析模型 美赛 6:相关性模型、回归模型(十大模型篇)

美赛 6:相关性模型、回归模型(十大模型篇)

2023-10-14 02:52| 来源: 网络整理| 查看: 265

目录

三、相关性模型(SPSS)

1.皮尔逊相关系数

2.皮尔逊相关系数假设检验

3.数据正态分布检验

4.斯皮尔曼相关系数

四、回归模型(Stata)

1.多元线性回归分析

2.逐步回归分析

3.岭回归和Lasso回归

三、相关性模型(SPSS)

        相关性模型涉及到两种最为常用的相关系数:皮尔逊person相关系数和斯皮尔曼spearman等级相关系数。

        它们可用来衡量两个变量之间的相关性大小,根据数值满足的不同条件,我们要选择不同的相关系数进行计算。

1.皮尔逊相关系数

这里的相关系数只是用来衡量两个变量线性相关程度的指标;

也就是说,你必须先确认这两个变量是线性相关的,然后这个相关系数才能告诉你这两个变量的相关程度如何。

总结:

1.如果两个变量本身就是线性的关系,那么皮尔逊相关系数绝对值大的就是相关性强,小的就是相关性弱;

2.在不确定两个变量是什么关系的情况下,即使算出皮尔逊相关系数,发现很大,也不能说明那两个变量线性相关,甚至不能说他们相关,一定要先画出散点图来看才行。

Matlab代码:

%文件名如果有空格隔开,那么需要加引号 load 'physical fitness test.mat' % 每一列的最小值 MIN = min(Test); % 每一列的最大值 MAX = max(Test); % 每一列的均值 MEAN = mean(Test); % 每一列的中位数 MEDIAN = median(Test); % 每一列的偏度 SKEWNESS = skewness(Test); % 每一列的峰度 KURTOSIS = kurtosis(Test); % 每一列的标准差 STD = std(Test); RESULT = [MIN;MAX;MEAN;MEDIAN;SKEWNESS;KURTOSIS;STD]

描述性统计(SPSS)

矩阵散点图(SPSS)

Matlab代码:

R = corrcoef(Test)

将得到的结果复制到Excel中进行作图。

2.皮尔逊相关系数假设检验

Python代码:

import numpy as np import matplotlib.pyplot as plt n=30 r=np.linspace(-0.999999,0.999999,10000) t=r*np.sqrt((n-2)/(1-np.square(r))) x=np.linspace(-50,50,10000) y=np.array([len(np.where(t


【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3