Spearman相关性分析(Spearman Correlation Analysis)

您所在的位置:网站首页 jadior女鞋价格 Spearman相关性分析(Spearman Correlation Analysis)

Spearman相关性分析(Spearman Correlation Analysis)

2023-03-25 03:08| 来源: 网络整理| 查看: 265

Pearson相关性分析主要用于分析满足正态分布的两定量变量之间的关系,若两变量中包含等级变量,或变量不符合正态分布,或变量分布类型未知时,可以采用另一种相关性分析方法——Spearman等级相关性分析。Spearman相关性分析的基本思想是:分别对两个变量X、Y做秩变换(rank transformation),用秩次RX和RY表示;然后按Pearson相关性分析的方法计算RX和RY的相关性。对于满足Pearson相关性分析的数据,亦可以使用Spearman相关性分析,但统计效能要低。本篇文章将介绍Spearman相关性分析的适用条件及假设检验。

关键词:相关分析; Spearman相关分析; 连续变量相关分析; Spearman相关系数; 等级相关分析; 秩相关

一、适用条件

Spearman相关性分析,需要满足2个条件:

条件1:变量包含等级变量、或变量不服从正态分布或分布类型未知。

条件2:两变量之间存在单调关系。

二、统计量计算 (一) Spearman相关系数

计算Spearman相关系数rs的过程为:

先将变量X、Y分别从小到大排序编秩,用秩次RX和RY表示。排序时,出现数据相等从而造成秩次相同的现象称为相持(tie),此时,取其平均秩次为每个数据的秩次。Spearman相关系数rs的计算公式为:

\(r_{s}=\frac{\sum\left(R_{X}-\overline{R_{X}}\right)\left(R_{Y}-R_{Y}\right)}{\sqrt{\sum\left(R_{X}-\overline{R_{X}}\right)^{2} \sum\left(R_{Y}-\overline{R_{Y}}\right)^{2}}}=\frac{\sum R_{X} R_{Y}-\frac{\left(\sum R_{X}\right)\left(\sum R_{Y}\right)}{n}}{\sqrt{\left(\sum R_{X}^{2}-\frac{\left(\sum R_{X}\right)^{2}}{n}\right)\left(\sum R_{Y}^{2}-\frac{\left(\sum R_{Y}\right)^{2}}{n}\right)}}\)

与Pearson相关系数的计算公式对比, Spearman相关系数的计算公式只是将Pearson相关系数公式中的X、Y替换为了RX、RY。

(二) 假设检验

对总体相关系数ρs是否为0做零假设检验,根据样本含量n的大小有两种方法:

1. 查表法

当样本含量n≤50时,根据样本含量n查(rs界值表)。若|rs|≥rs(a,n),则P≤α,即两变量相关;若|rs|α,两变量不存在相关关系。

2. t检验

当n>50时,根据下式计算统计量t值:

\(t=\frac{\left|r_{s}\right|}{\sqrt{\frac{1-r_{s}^{2}}{n-2}}}, v=n-2\)

计算得到t值后,结合自由度υ,查(t界值表),获得P值。

三、案例数据

某医师收集了224例肺癌患者的生存时间(Time)和患者自评的卡氏评分(pat.karno)。问患者自评的卡氏评分与其生存时间是否相关?部分数据如图1所示。

图1 四、案例分析过程 (一) 适用条件判定 1. 正态性检验

对生存时间(Time)和患者自评的卡氏评分(pat.karno)分别绘制Q-Q图,如图2-1和图2-2所示。

图2-1    图2-2

两个变量的散点偏离对角线分布的较多,提示两个变量不服从正态分布;此外,也可对两变量进行Shapiro-Wilk正态性检验,P值均



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3