美赛 6:相关性模型、回归模型(十大模型篇) |
您所在的位置:网站首页 › 高级数据分析模型 › 美赛 6:相关性模型、回归模型(十大模型篇) |
目录 三、相关性模型(SPSS) 1.皮尔逊相关系数 2.皮尔逊相关系数假设检验 3.数据正态分布检验 4.斯皮尔曼相关系数 四、回归模型(Stata) 1.多元线性回归分析 2.逐步回归分析 3.岭回归和Lasso回归 三、相关性模型(SPSS)相关性模型涉及到两种最为常用的相关系数:皮尔逊person相关系数和斯皮尔曼spearman等级相关系数。 它们可用来衡量两个变量之间的相关性大小,根据数值满足的不同条件,我们要选择不同的相关系数进行计算。 1.皮尔逊相关系数这里的相关系数只是用来衡量两个变量线性相关程度的指标; 也就是说,你必须先确认这两个变量是线性相关的,然后这个相关系数才能告诉你这两个变量的相关程度如何。 总结: 1.如果两个变量本身就是线性的关系,那么皮尔逊相关系数绝对值大的就是相关性强,小的就是相关性弱; 2.在不确定两个变量是什么关系的情况下,即使算出皮尔逊相关系数,发现很大,也不能说明那两个变量线性相关,甚至不能说他们相关,一定要先画出散点图来看才行。 Matlab代码: %文件名如果有空格隔开,那么需要加引号 load 'physical fitness test.mat' % 每一列的最小值 MIN = min(Test); % 每一列的最大值 MAX = max(Test); % 每一列的均值 MEAN = mean(Test); % 每一列的中位数 MEDIAN = median(Test); % 每一列的偏度 SKEWNESS = skewness(Test); % 每一列的峰度 KURTOSIS = kurtosis(Test); % 每一列的标准差 STD = std(Test); RESULT = [MIN;MAX;MEAN;MEDIAN;SKEWNESS;KURTOSIS;STD]描述性统计(SPSS) 矩阵散点图(SPSS) Matlab代码: R = corrcoef(Test)将得到的结果复制到Excel中进行作图。 Python代码: import numpy as np import matplotlib.pyplot as plt n=30 r=np.linspace(-0.999999,0.999999,10000) t=r*np.sqrt((n-2)/(1-np.square(r))) x=np.linspace(-50,50,10000) y=np.array([len(np.where(t |
今日新闻 |
推荐新闻 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |