统计基础之描述统计分析 |
您所在的位置:网站首页 › 四分位数是什么平均数 › 统计基础之描述统计分析 |
在开始学习统计学之前,我想分享一些经过统计数据发现的有趣现象: 提前退休会缩短寿命。网上约会评分越高,配对成功率就越低。素食主义者不太容易误机。公共体育活动会导致本地犯罪率上升。男人通常认为自己的驾驶技术比女人好,但男性的交通事故死亡率几乎是女性的两倍。统计科学无处不在,它已经为我们打开了一个理性、客观的世界,即使你没有发现这个世界,也已经被数据洪流包围,只要你存在,你就是数据的使用者和制造者。 世界变成了数据组成的世界,而统计学则为我们提供了审视身边事物的独一无二的视角,让我们更加深入地理解我们的地球乃至整个宇宙。 一、什么是描述统计学 当我们面对大量信息的时候,经常会出现数据越多,事实越模糊的情况,因此我们需要对数据进行简化,描述统计学就是用几个关键的数字来描述数据集的整体情况。 描述数据集的整体情况,会用到以下几个指标: 集中趋势的量度:平均值、中位数、众数 离中趋势的量度:四分位数、标准差、标准分 二、集中趋势的量度 1、平均值 求平均值很简单,就是把所有数据加起来,再除以这些数据的个数。 如果数据有各自的频数,就将每个数据乘以其频数,把乘积相加再除以频数和。 案例:你的收入被平均了吗? 平均收入=(10+11+12+13)/ 4 = 11.5 万 如果数据中加入马云的年收入: 平均收入=10亿46万 / 5 人 =2亿9.2万 关于平均工资的数据,其本身具有相当大的误导性,因为平均值对异常数值并不敏感,容易求出一个不存在于数据集中区的数值。所以我们不应该用人均收入来衡量某行业或某地区的平均收入。 2、中位数 当异常值使平均值产生误导时,我们需要使用其他方式表示典型值,我们可以取中位数。 求中位数三步法: ① 从小到大按顺序排列数字 ② 如果有奇数个数值,则中位数位于中间的数值。如果有n个数,则中间数的位置为(n+1)/ 2 ③ 如果有偶数个数值,则将两个中间数相加,然后除以2。中间位置的算法是(n+1)/2,两个中间数分别位于这两个中间位置的两侧 中位数永远处于中间,它是个中间值。但是碰到数据较多的数据集时,计算中位数相对会比较麻烦 3、众数 众数是一批数字中出现次数最多的数值。众数可以不止一个。我们还可以用众数指定具有最高频数的数值组,被称为众数组。 求众数三步法: ① 把数据中的不同类别或数值全部找出来 ② 写出每个数值或类别的频数 ③ 挑出具有最高频数的一个或几个数值,得出众数。 当数据为类别数据而不是数值型数据时,众数比较有用,比如: |
今日新闻 |
推荐新闻 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |