12种相关系数汇总，那些你不知道的相关系数

2024-06-10 11:25| 来源: 网络整理| 查看: 265

所谓相关关系是指2个或2个以上变量取值之间在某种意义下所存在的规律，其目的在于探索数据集所存在隐藏的关系网，在19世纪80年代，Galton通过研究人类身高遗传问题首次提出了相关的概念，文中指出相关关系可以定义为：一个变量变化时，另一个变量或多或少的相应的变量。这种相关关系的统计量称为相关关系。相关分析不只有我们常用的pearson相关，还有其它相关系数等等，本篇文章为大家梳理都有哪些相关系数。

一、两个变量

1、Pearson相关

Pearson相关分析的说明：

pearson 法则是一种经典的相关系数计算方法，主要用于表征线性相关性，假设2个变量服从正态分布且标准差不为0，他的值介于-1到1之间，pearson相关系数的绝对值越接近于1，表明 2个变量的相关程度越高，即这2个变量越相似。

Pearson相关分析的计算：

其相关系数计算如下：

Pearson相关分析的操作：

以SPSSAU为例，pearson相关系数路径【通用方法】→【相关分析】

分析前选择“pearson相关系数”按钮即可，au这里有提供两个分析项放置框，第二个分析项放置框可以不放置分析项为可选项，如果将分析项放置两个框和一个框内，结果不会改变，但是结果的表现形式会些许不一致，建议根据所需进行选择即可。

Pearson相关分析系数判断：

不同的文献相关系数的判断标准不同，如果在分析中，建议以及所参考的文献等进行参考，比如上面的文献就来自于贾俊平, 何晓群, 金勇进. 统计学.第7版[M]. 中国人民大学出版社, 2018.

Pearson的一般结果：

一般结果会提供相关系数以及p值等，可以根据p值结合相关系数进行分析，若p值小于显著性水平（比如显著性水平为0.05）则拒绝原假设，该模型显著，具有相关关系。反之，接受原假设，不具有相关关系。

2、Spearman相关

spearman相关分析的说明：

Spearman 相关性分析是对两组变量的等级大小作相关性分析，从而得到一个自变量与因变量之间的关系和自变量对因变量的影响强弱。它首先将两组变量的数据按照大小顺序排列，然后用等级代替原始数据，最后计算等级之间的相关性。

spearman相关分析的计算：

设自变量 X 和 Y 的 2 个随机样本为 ( x1 ,y1 ),⋯,( xn ,yn )，将 x1 ,⋯,xn和 y1 ,⋯,yn按升序方式进行排列，则X和Y的spearman秩相关系数为：

spearman相关分析的操作：

以SPSSAU为例，pearson相关系数路径【通用方法】→【相关分析】

spearman相关分析系数判断：

Spearman相关系数范围为-1――1，小于0代表负相关，大于0代表正相关，等于0则代表不存在相关关系。相关系数绝对值越接近0，相关关系越弱；绝对值越接近1，证明相关关系越强。

spearman的一般结果：

一般结果会提供相关系数（此相关系数为spearman相关系数）以及p值等，可以根据p值结合相关系数进行分析，若p值小于显著性水平（比如显著性水平为0.05）则拒绝原假设，该模型显著，具有相关关系。反之，接受原假设，不具有相关关系。

3、Kendall等级相关

kendall相关分析的说明：

kendall相关系数也叫kendall秩相关系数，广泛用于量化不同变量间的相关程度，作为一类无参数假设检验，用于衡量两变量之间的相关性，其并不要求数据满足正态分布，对于样本容量也没有过多要求，适用性比较广。

kendall相关分析的分类：

kendall相关系数常见的有 tau-a、tau-b、tau-c，除此之外还有tub_b等等。其中tau-a未对数据中的结做校正，tau-b对数据中的结做校正，tau-c适用于两列变量尺度不相等的情况。tub_b适合两个变量为定量变量。

kendall相关分析的操作：

这里以kendall tub_b为例，操作路径【通用方法】→相关分析；

kendall相关分析系数判断：

kendall相关系数取值范围介于-1到1之间，其中绝对值越接近于1说明相关性越强，越接近于0说明相关性越弱。

kendall的一般结果：

以kendall tub_b为例，结果如下：

分析结果一般提供kendall相关系数和p值，可以根据p值结合相关系数进行分析，若p值小于显著性水平（比如显著性水平为0.05）则拒绝原假设，该模型显著，具有相关关系。反之，接受原假设，不具有相关关系。

4、Hoeffding’D相关系数

Hoeffding相关分析的说明：

Hoeffding’D是由Wassily Hoeffding在1948年提出的，用于衡量两个变量之间的相关关系。

Hoeffding相关分析的计算：

其计算公式如下：

Hoeffding相关分析系数判断：

Hoeffding’D相关系数取值范围介于-1到1之间，其中绝对值越接近于1说明相关性越强，越接近于0说明相关性越弱。

二、多个变量 1、偏相关

偏相关分析的说明：

相关分析用于研究两两变量之间的关系情况，如果有第三个变量会干扰到分析结果，也就是我们常说的控制变量，这是控制变量也需要考虑在模型内，比如研究身高与肺活量之间的关系，如果直接进行相关分析，会出现有相关关系，但真实结论很可能并不应该这样，同样身高的人肺活量很可能明显不一样，原因是体重并不一样。所以此时在分析时需要将体重考虑在内，此种情况下适合使用的为偏相关。

偏相关分析的计算：

以au为例，其原理计算与pearson相关系数的计算一致：

偏相关分析的操作：

分析路径【进阶方法】→【偏相关】；

偏相关分析系数判断：

其判断也与pearson相关系数的判断标准类似：

偏相关的一般结果：

SPSSAU分析建议如下：

2、散点图

散点图的说明：

散点图是一种以点的分布反映变量之间的相关情况的统计图，根据散点图中的各点分布走向和密集程度，可以大致判断变量之间的相互关系。

散点图的操作：

以SPSSAU为例，pearson相关系数路径【可视化】→【散点图】

将左侧分析项拖拽到右侧分析框内，选择相应参数，点击开始分析，其中**“bins”为一种散点数据处理方式，当散点过多时可通过bins处理更清晰的查看散点数据关系情况，当散点数量>1000时，SPSSAU自动会进行bins处理（bins=100），与此同时，研究者也可自主设置bins数量。“矩阵排列图”**当自变量不止一项时，勾选矩阵排列图，结果会默认提供不同自变量的散点图排列图，比如：