【Udacity】数据的差异性:值域、IQR、方差和标准差

您所在的位置:网站首页 四分位数和四分位差的区别 【Udacity】数据的差异性:值域、IQR、方差和标准差

【Udacity】数据的差异性:值域、IQR、方差和标准差

2024-07-11 08:42| 来源: 网络整理| 查看: 265

一、值域(Range)

Range = Max - Min 受异常值(Outliers)影响

二、四分位差(IQR)

四分位距(interquartile range, IQR),又称四分差。是描述统计学中的一种方法,以确定第三四分位数和第一四分位数的区别(即Q1~Q3 的差距)。

三、异常值(Outlier)

异常值的常用定义:Outlier < Q1 - 1.5IQR

OR > Q3 + 1.5IQR 可视化——Box Plots(箱线图) & Whisker(盒须图)

1143923-20170925231641885-161713780.jpg

IQR的不足 值域和IQR都无法将所有数据考虑进来; 完全不同的两个数据集也可以有相同的IQR:Normal(正态分布)、Bimodel(双峰分布)和Uniform distribution(均匀分布)

we need one number that decribes the spread data that takes all the data into account.(数据分布+考虑所有数据)

四、方差(


【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3