箱线图的理解 |
您所在的位置:网站首页 › 平均分差线是什么意思图片 › 箱线图的理解 |
一、箱线图概念
箱形图(Box-plot)又称为盒须图、盒式图或箱线图,是一种用作显示一组数据分散情况资料的统计图。 计算过程: (1)计算上四分位数(Q3),中位数,下四分位数(Q1) (2)计算上四分位数和下四分位数之间的差值,即四分位数差(IQR,interquartile range)Q3-Q1 (3)绘制箱线图的上下范围,上限为上四分位数,下限为下四分位数。在箱子内部中位数的位置绘制横线。 (4)大于 上四分位数 1.5倍四分位数差 的值,或者小于下四分位数1.5倍四分位数差的值,划为异常值(outliers)。 (5)异常值之外,最靠近上边缘和下边缘的两个值处,画横线,作为箱线图的触须。 (6)极端异常值,即超出四分位数差3倍距离的异常值,用实心点表示;较为温和的异常值,即处于1.5倍-3倍四分位数差之间的异常值,用空心点表示。 (7)为箱线图添加名称,数轴等 二、四分位数的计算分位数根据其将数列等分的形式不同可以分为中位数,四分位数,十分位数、百分位数等等。四分位数作为分位数的一种形式,在统计中有着十分重要的意义和作用,而大多数的统计学原理教材只介绍其基本含义,对其具体计算,尤其是由组距数列计算都不作介绍,成为统计学原理教材中的空白。那么,如何根据数列计算四分位数呢?一般来讲,视资料是否分组而定。 1、根据未分组的资料计算四分位数 第一步:确定四分位数的位置 四分位数是将数列等分成四个部分的数,一个数列有三个四分位数,设下分位数、中分位数和上分位数分别为
第二步:根据第一步所确定的四分位数的位置,确定其相应的四分位数。 例1:某车间某月份的工人生产某产品的数量分别为13、13.5、13.8、13.9、14、14.6、14.8、15、15.2、15.4、15.7公斤,则三个四分位数的位置分别为: 2、由组距式数列确定四分位数 第一步,向上或向下累计次数. 第二步,根据累计次数确定四分位数的位置. (1)、当采用向上累计次数的资料确定四分位数时,四分位数位置的公式是:
(2)、当采用向下累计次数的资料确定四分位数时,四分位数位置的公式是: 第三步,根据四分位数的位置算出各四分位数. (1)、当累计次数是向上累计时,按下限公式计算各四分位数. (2)、当累计次数是向下累计时,按上限公式计算各四分位数. 例3:某企业职工按月工资的分组资料如下: 按月工资分组职工人数向上累计职工人数向下累计职工人数600以下2323566600–700120143543700–800150293423800–900135428273900–1000955231381000以上4356643合 计566––根据上述资料确定某企业职工的月工资的三个四分位数如下: (1)、采用向上累计职工人数的资料得月工资四分位数的位置为: (2)、采用向下累计职工人数的资料得月工资四分位数的位置为: 3、异常值
四分位数全距:IQR= 限制线位置: 异常值:限制线以外的数据全部为异常值 三、画图 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |