[统计学笔记] (四)数据分布的数字特征 |
您所在的位置:网站首页 › 平均数一定是一组数据中的一个数吗为什么 › [统计学笔记] (四)数据分布的数字特征 |
(四)数据分布的数字特征
数据的分布特征与使用的描述统计量
在统计研究中,需要搜集大量数据并对其进行加工整理,大多数情况下数据都会呈现出一种钟形分布,即各个变量值与中间位置的距离越近,出现的次数越多;与中间位置距离越远,出现的次数越少,从而形成了一种以中间值为中心的集中趋势。这个集中趋势是现象共性的特征,也是现象规律性的数量表现。 根据统计学知识,集中趋势指平均数,是一组数据中有代表性的值,这些数值趋向于落在数值大小排列的数据中心,被称为中心趋势度量。最常用的中心趋势度量有算术平均数、几何平均数、调和平均数、众数和中位数。 均值是一组数据的算术平均,它利用了全部数据信息,是概括一组数据最常用的一个值。 众数是一组数据中出现次数最多的变量值,它用于对分类数据的概括性度量,其特点是不受极端值的影响,但它没有利用全部数据信息,而且还具有不唯一性。一组数据可能有众数,也可能没有众数;可能有一个众数,也可能有多个众数。 中位数是一组数据按大小顺序排序后处于中间位置上的变量,它主要用于对顺序数据的概括性度量。 对于总体中的个体数据,有时会呈现出在一定范围内以某个数据为中心上下波动的分布特征,即数据有时具有它分布的中心,我们称之为数据分布的集中趋势。 集中趋势指标的分类
集中趋势指标的作用 可以反映一组数据分布的中心或一般水平; 可以反映同一现象在不同时间或空间条件下的发展趋势或差异; 以用来分析现象之间的依存关系; 样本平均数是统计推断的一个重要统计量。 集中趋势的测定 数值平均数数值平均数只适用于定量数据(数值型数据),而不适用于定性数据。 1、算术平均数 (1)简单算术平均数 简单算术平均数是根据未分组数据(原始数据)计算的一种平均数,它是将所有的原始数据相加再除以数据总个数得到的。 样本计算的简单算术平均数的计算公式是:
2、加权算术平均数 加权算术平均数是根据分组数据计算的一种平均数。设样本被分为k组,各组的频数为fi样本计算的加权算术平均数的计算公式为:
其中,Xi有两种情况:在单变量值分组中,Xi代表各组的变量值;在组距式分组中,Xi代表各组的组中值, 总体数据计算的加权算术平均数 的计算公式为: (3)算术平均数的主要数学性质 ①各变量值与其算术平均数的离差之和等于零; 即:
②各变量值与其算术平均数的离差平方和最小。 即:
3. 调和平均数 调和平均数加权算术平均数的一种变形。 调和平均数与加权算术平均数的关系是:若已知各组变量值 及其标志总量mi(mi=xifi ),而缺乏fi的数据时,则加权算术平均数可通过变形得到fi(fi=mi |
今日新闻 |
推荐新闻 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |