Box plot (箱形图) 中 quartile (四分位数)原理,及python

您所在的位置:网站首页 iqr啥意思 Box plot (箱形图) 中 quartile (四分位数)原理,及python

Box plot (箱形图) 中 quartile (四分位数)原理,及python

2024-07-12 20:00| 来源: 网络整理| 查看: 265

1. 首先介绍Boxplot(箱形图)的定义,这里参考:Understanding Boxplots,非常精彩的一篇介绍boxplot的博文。

该图片显示的即是一个boxplot的基本组成部分, 它由5个基本数值决定,即 最小值 (minimum); 下四分位数 (first quartile, Q1); 中值或中位数 (median), 或第二个四分位数 (second quartile, Q2); 上四分位数 (third quartile, Q3); 最大值 (maximum)。 

其它定义:四分位间距 (interquartile range, IQR), 表示下四分位数Q1和上四分位数Q3的间距; 盒须 (wiskers), 上图中蓝色的延伸线,长度为1.5*IQR, 分为两段,分别是Q1延伸至minimum, Q3延伸至maximum; 离群值 (outliers), 上图中绿色的点,表示小于minimum的值和大于maximum的值。

这里需要注意,boxplot是用于显示数据分散情况的图,其中的minimum和maximum很可能不表示数据集中的最小、最大点,而是由Q1、Q3、IQR决定, 而不分布于[minimum, maximum]的点视为outlier.

2. 接下来介绍三个四分位数Q1、Q2和Q3的具体取值情况,这里部分参考:Wikipedia: Quartile  维基百科。

Q2,即median的取值比较简单,设n表示数据集中点的数目,a为该数据集的升序数组.

这里分为两种情况:

n = 2 * i + 1,  即数据点个数为奇数 (odd number), median (Q2) = a[i] n = 2 * i, 即数据点个数为偶数 (even number), median (Q2) = a[i-1] * 0.5 + a[i] * 0.5

Q1和Q3的取值,根据Wikipedia: Quartile上的解释,还没有通用的取值。

上面介绍了3种主要的取值方法,需要先将点的数量n分为4种情况:

n = 4 * i, 即数据点个数为偶数,将其平分后,每一份的个数仍是偶数; n = 4 * i + 2, 即数据点个数为偶数,  将其平分后,每一份的个数为奇数; n = 4 * i + 1, 即数据点个数为奇数,先将其去除中值Q2, 再平分后,每一份的个数为偶数; n = 4 * i +3, 即数据点个数为奇数,先将其去除中值Q2, 再平分后,每一份的个数为奇数。

3种方法对于Q1和Q3的具体取值为:

当n为偶数时,3种方法对于Q1和Q3的取值均相同,即先将a等分为下半 (lower half) 和上半 (upper half)(不去除用于计算中值的两个数),等分之后的数组再分别计算中值,Q1为下半的中值,Q3为上半的中值。

若 n = 4 * i, Q1 = a[i-1] * 0.5 + a[i] * 0.5; Q3 = a[3*i-1] * 0.5 + a[3*i] * 0.5

若 n = 4 * i + 2, Q1 = a[i]; Q3 = a[3*i+1]

3种方法对于Q1和Q3的取值不同体现在当n为奇数时:

Method 1:对其等分为下半和上半时,两个数组均不包含中间的那个中值,Q1为下半的中值,Q3为上半的中值:

若n = 4 * i + 1, Q1 = a[i-1] * 0.5 + a[i] * 0.5; Q3 = a[3*i] * 0.5 + a[3*i+1] * 0.5

若n = 4 * i + 3, Q1 = a[i]; Q3 = a[3*i+2]

Method 2: 对其等分为下半和上半时,两个数组均包含中间的那个中值,Q1为下半的中值,Q3为上半的中值: 

 若n = 4 * i + 1, Q1 = a[i]; Q3 = a[3*i]

 若n = 4 * i + 3, Q1 = a[i] * 0.5 + a[i+1] * 0.5; Q3 = a[3*i+1] * 0.5 + a[3*i+2] * 0.5

 

Method 3: 对其等分为下半和上半时,两种情况下,一种两个数组均包含中间的那个均值,另一种两个数组均不包含中间的那个中值,使两个半数组中数值个数为偶数,



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3