plt.boxplot()函数绘制箱图、常用方法及含义详解 |
您所在的位置:网站首页 › 箱形图的概念 › plt.boxplot()函数绘制箱图、常用方法及含义详解 |
箱图是一中用于统计数据分布的统计图,也可以粗略地看出数据是否具有对称性,分布的分散程度等信息。箱图中的信息含义如下: 异常值又称离群值,指大于1.5倍的四分位数间距的值。处于1.5倍~3倍四分位数间距的值用空心圆圈表示。极端值属于异常值中的一种。 极端值是指大于3倍的四分位数间距的值。 2.计算方法首先找出一组数据的五个特征值,包括除异常值外的最小值(minimum)和最大值(maximum)、中位数(median)、两个四分位数(上四分位数Q1和下四分位Q3数); 中位数:将所有数值从小到大排列,如果是奇数个数值则取最中间一个值作为中位数,之后最中间的值在计算Q1和Q3时不再使用;偶数个数值则取最中间两个数的平均数作为中位数,这两个数在计算Q1和Q3时继续使用。 Q1:中位数将所有数据分成两部分,最小值到中位数的部分按取中位数的方法取中位数作为Q1。 Q3:同Q1取法,取中位数到最大值的中位数。 IQR(四分位数间距)=Q3-Q1。 所有不在(Q1-1.5IQR,Q3+1.5IQR)的区间内的数为离群值,剩下的值最大的为最大值,最小的为最小值。 特征值(从下到上):最小值、Q1、中位数、Q3、最大值 将五个数值描绘在一个图上,五个特征值在一个直线上,最小值和Q1连接起来,Q1、中位数、Q3分别作平行等长线段, 然后,连接两个四分位数构成箱子。 最后连接两个极值点与箱子,形成箱式图,然后点上离群值即可。 3.绘图 3.1 绘制单个箱图 import matplotlib.pyplot as plt import numpy as np #生成data数据 np.random.seed(100) data = np.random.normal(size=(1000,),loc=0,scale=1) # 绘图 plt.boxplot(data) plt.show() |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |