详解pandas.DataFrame.boxplot()(绘制数据框箱线图)函数使用方法

您所在的位置:网站首页 minitab画多组别箱线图 详解pandas.DataFrame.boxplot()(绘制数据框箱线图)函数使用方法

详解pandas.DataFrame.boxplot()(绘制数据框箱线图)函数使用方法

2024-07-12 05:54| 来源: 网络整理| 查看: 265

pandas.DataFrame.boxplot()是Pandas库中的一个函数,它可以将数据框的数据进行箱线图的可视化展示,从而帮助我们更好地理解数据的分布情况及异常值情况。本文将对该函数的作用、使用方法进行详细讲解,并提供两个实例说明。

函数作用

函数的作用是将数据框的每个列进行箱线图的可视化展示,我们可以通过观察图表来判断数据分布的偏态及异常值情况。箱线图用于展示数据的分布情况,其中箱体代表数据的中位数,箱子上下两端的线段代表75%分位数与25%分位数,箱子外部的小点则代表异常值。

函数参数 column:指定要绘制箱型图的列名,默认为全部列; by:指定分类变量,按照该变量进行分组绘制箱型图; grid:布尔值,表示是否显示网格线; ax:指定绘图的Aaxes对象; figsize:指定绘制图像的尺寸大小; layout:用于显示子图的布局方式; return_type:指定绘制的图像类型,默认为matplotlib.axes.Axes; **kwds:其他参数。 函数示例

下面提供两个示例,以便更好地理解函数的使用方法。

示例1

导入Pandas库并创建数据框:

import matplotlib.pyplot as plt import pandas as pd import numpy as np df = pd.DataFrame(np.random.rand(10, 3), columns=['col1', 'col2', 'col3'])

输出:

col1 col2 col3 0 0.420447 0.029967 0.854970 1 0.574840 0.182032 0.627002 2 0.387047 0.757678 0.288685 3 0.437122 0.058667 0.957747 4 0.496488 0.268264 0.150822 5 0.798227 0.605551 0.493125 6 0.460259 0.333671 0.858922 7 0.446345 0.357164 0.536836 8 0.463891 0.743068 0.601117 9 0.807246 0.550213 0.430407

绘制所有列的箱线图:

df.boxplot() plt.show()

输出:

详解pandas.DataFrame.boxplot()(绘制数据框箱线图)函数使用方法

可以看出,三列数据的分布情况大致相同,没有异常值。

示例2

继续使用示例1中的数据框,按照col2列进行分组绘制箱线图:

df.boxplot(by='col2') plt.show()

输出:

详解pandas.DataFrame.boxplot()(绘制数据框箱线图)函数使用方法

由于col2列中的数值不同,因此在绘图中出现了分组的情况,可以看出col2=0.33和col2=0.43的数据存在较多的异常值。

总结

pandas.DataFrame.boxplot()函数是Pandas库中的一个可视化函数,用于绘制数据框中数据的箱线图,可以帮助我们更好地理解数据的分布情况及异常值情况。通过该函数的示例,我们可以从实际应用中更好地理解其使用方法。

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:详解pandas.DataFrame.boxplot()(绘制数据框箱线图)函数使用方法 - Python技术站



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3