皮尔逊相关(Pearson correlation)系数概述及其计算例

您所在的位置:网站首页 算平方面积的公式系数 皮尔逊相关(Pearson correlation)系数概述及其计算例

皮尔逊相关(Pearson correlation)系数概述及其计算例

2024-07-05 01:28| 来源: 网络整理| 查看: 265

目录

1. 前言

2. 皮尔逊相关系数定义

3. 数学性质

3.1 对称性

3.2 位移不变性

3.3 尺度不变性

4. 5个假设

5. 几何解释

6. Some calculation examples

Example1: 

Example2: Two random sequence with normal distribution

Example3

1. 前言

        相关是最常用的统计度量。用一个数来描述两个变量之间的相关联的程度。相关系数的取值范围为[-1, +1]。负值表示随着一个变量值的增大另一个则减小;正值表示随着一个变量值的增大另一个也跟着增大;0则表示一个变量的增大减小对另一个的取值没有 影响。

        三种常用的相关系数为:皮尔逊相关系数,斯皮尔曼相关系数,Kendall相关系数.

        本文概要性地介绍皮尔逊相关系数。

       关于斯皮尔曼相关系数的介绍参见斯皮尔曼相关(Spearman correlation)系数概述及其计算例简要介绍了斯皮尔曼相关系数(Spearman correlation coefficient)的概念、计算公式,以及手动计算例、调用scipy函数、pandas函数计算的代码示例。。。https://blog.csdn.net/chenxy_bwave/article/details/121427036        关于Kendall相关系数,参见肯德尔(Kendall)相关系数概述及计算例https://chenxiaoyuan.blog.csdn.net/article/details/126919019

2. 皮尔逊相关系数定义

    最常用的相关就是皮尔逊相关(Pearson correlation),得名于Karl Pearson, 他从弗朗西斯·高尔顿在19世纪80年代提出的一个相似却又稍有不同的想法演变而来的,这个相关系数也称作“皮尔逊积矩相关系数(Pearson Product-Moment Correlation)”。皮尔逊相关系数通常用字母r表示(所以常常写作 Pearson's r,当然也有用\rho来表示),衡量两个随机变量之间的线性关系(或者说线性关联度)。

        两个变量之间的总体(population)的皮尔逊相关系数定义为两个变量之间的协方差和标准差之积的商(或者说,归一化的协方差),通常用\rho表示,定义如下:

watermark,type_ZHJvaWRzYW5zZmFsbGJhY2s,shadow_50,text_Q1NETiBA56yo54mb5oWi6ICV,size_20,color_FFFFFF,t_70,g_se,x_16

       估算样本的协方差和标准差,可得到(样本的)皮尔逊相关系数,常用英文小写字母 

r 代表,r 的表达式如下所示:

watermark,type_ZHJvaWRzYW5zZmFsbGJhY2s,shadow_50,text_Q1NETiBA56yo54mb5oWi6ICV,size_20,color_FFFFFF,t_70,g_se,x_16

        * 以上分母中后半部分应该是yi而不是xi. 

        其中,64a1ca75d10b4ace8d14915832f9c3c3.pngd0d401f6300d44f2bebe08561b37a779.png 分别表示两者的样本均值。

        R=1表示两者完美的正向线性相关,即满足Y = aX+b(a>0)的关系; R=-1表示两者完美的负向线性相关,即满足Y = aX+b(a



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3