统计基础之描述统计分析

您所在的位置:网站首页 四分位数是什么平均数 统计基础之描述统计分析

统计基础之描述统计分析

2024-05-24 07:08| 来源: 网络整理| 查看: 265

在开始学习统计学之前,我想分享一些经过统计数据发现的有趣现象:

提前退休会缩短寿命。网上约会评分越高,配对成功率就越低。素食主义者不太容易误机。公共体育活动会导致本地犯罪率上升。男人通常认为自己的驾驶技术比女人好,但男性的交通事故死亡率几乎是女性的两倍。

统计科学无处不在,它已经为我们打开了一个理性、客观的世界,即使你没有发现这个世界,也已经被数据洪流包围,只要你存在,你就是数据的使用者和制造者。

世界变成了数据组成的世界,而统计学则为我们提供了审视身边事物的独一无二的视角,让我们更加深入地理解我们的地球乃至整个宇宙。

一、什么是描述统计学

当我们面对大量信息的时候,经常会出现数据越多,事实越模糊的情况,因此我们需要对数据进行简化,描述统计学就是用几个关键的数字来描述数据集的整体情况。

描述数据集的整体情况,会用到以下几个指标:

集中趋势的量度:平均值、中位数、众数

离中趋势的量度:四分位数、标准差、标准分

二、集中趋势的量度

1、平均值

求平均值很简单,就是把所有数据加起来,再除以这些数据的个数。

如果数据有各自的频数,就将每个数据乘以其频数,把乘积相加再除以频数和。

案例:你的收入被平均了吗?

平均收入=(10+11+12+13)/ 4 = 11.5 万

如果数据中加入马云的年收入:

平均收入=10亿46万 / 5 人 =2亿9.2万

关于平均工资的数据,其本身具有相当大的误导性,因为平均值对异常数值并不敏感,容易求出一个不存在于数据集中区的数值。所以我们不应该用人均收入来衡量某行业或某地区的平均收入。

2、中位数

当异常值使平均值产生误导时,我们需要使用其他方式表示典型值,我们可以取中位数。

求中位数三步法:

① 从小到大按顺序排列数字

② 如果有奇数个数值,则中位数位于中间的数值。如果有n个数,则中间数的位置为(n+1)/ 2

③ 如果有偶数个数值,则将两个中间数相加,然后除以2。中间位置的算法是(n+1)/2,两个中间数分别位于这两个中间位置的两侧

中位数永远处于中间,它是个中间值。但是碰到数据较多的数据集时,计算中位数相对会比较麻烦

3、众数

众数是一批数字中出现次数最多的数值。众数可以不止一个。我们还可以用众数指定具有最高频数的数值组,被称为众数组。

求众数三步法:

① 把数据中的不同类别或数值全部找出来

② 写出每个数值或类别的频数

③ 挑出具有最高频数的一个或几个数值,得出众数。

当数据为类别数据而不是数值型数据时,众数比较有用,比如:



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3