R计算两列数据的相关系数

您所在的位置:网站首页 r语言两列数据的相关性分析 R计算两列数据的相关系数

R计算两列数据的相关系数

#R计算两列数据的相关系数| 来源: 网络整理| 查看: 265

3767b033cd08d938ace459498ab07e3a.png

相关性分析用于评估两个或多个变量之间的关联。例如,如果我们想知道父亲和儿子的身高之间是否存在关系,可以计算相关系数来回答这个问题。

如果两个变量(父亲和儿子的身高)之间没有关系,则儿子的平均身高应该相同,而与父亲的身高无关,反之亦然。

注意,仅当数据呈正态分布时,才可以使用相关性分析。可以使用Shapiro-Wilk test进行检查。请参看第六讲

小编将描述几种相关性分析的方法,并提供示例。

1. 相关性分析的方法

相关分析的方法有多种:

皮尔逊(Pearson)相关(r),它测量两个变量(x和y)之间的线性相关性。它也称为参数相关性检验,因为它取决于数据的分布。仅当x和y来自正态分布时才可以使用它。y = f(x)的图称为线性回归曲线。 Kendall tauSpearman rho,它们是基于等级的相关系数(非参数)。

最常用的方法是Pearson相关方法。

相关公式

在下面的公式中

xy是长度为n的两个向量 mx和my分别


【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3