[统计学笔记] (四)数据分布的数字特征

您所在的位置:网站首页 平均数一定是一组数据中的一个数吗为什么 [统计学笔记] (四)数据分布的数字特征

[统计学笔记] (四)数据分布的数字特征

2023-11-04 06:52| 来源: 网络整理| 查看: 265

(四)数据分布的数字特征 数据的分布特征与使用的描述统计量

数据集中趋势

在统计研究中,需要搜集大量数据并对其进行加工整理,大多数情况下数据都会呈现出一种钟形分布,即各个变量值与中间位置的距离越近,出现的次数越多;与中间位置距离越远,出现的次数越少,从而形成了一种以中间值为中心的集中趋势。这个集中趋势是现象共性的特征,也是现象规律性的数量表现。

根据统计学知识,集中趋势指平均数,是一组数据中有代表性的值,这些数值趋向于落在数值大小排列的数据中心,被称为中心趋势度量。最常用的中心趋势度量有算术平均数、几何平均数、调和平均数、众数和中位数。

均值是一组数据的算术平均,它利用了全部数据信息,是概括一组数据最常用的一个值。

众数是一组数据中出现次数最多的变量值,它用于对分类数据的概括性度量,其特点是不受极端值的影响,但它没有利用全部数据信息,而且还具有不唯一性。一组数据可能有众数,也可能没有众数;可能有一个众数,也可能有多个众数。

中位数是一组数据按大小顺序排序后处于中间位置上的变量,它主要用于对顺序数据的概括性度量。

对于总体中的个体数据,有时会呈现出在一定范围内以某个数据为中心上下波动的分布特征,即数据有时具有它分布的中心,我们称之为数据分布的集中趋势。

集中趋势指标的分类

 

集中趋势指标的作用

可以反映一组数据分布的中心或一般水平;

可以反映同一现象在不同时间或空间条件下的发展趋势或差异;

以用来分析现象之间的依存关系;

样本平均数是统计推断的一个重要统计量。

集中趋势的测定 数值平均数

数值平均数只适用于定量数据(数值型数据),而不适用于定性数据。

1、算术平均数

(1)简单算术平均数

   简单算术平均数是根据未分组数据(原始数据)计算的一种平均数,它是将所有的原始数据相加再除以数据总个数得到的。

样本计算的简单算术平均数的计算公式是:

\large \overline{X} = \frac{\sum_{i=1}^{n}X_{i}}{n}

总体数据计算的简单算术平均数的计算公式为:

\large \mu = \frac{\sum_{i=1}^{N}X_{i}}{N}

 

2、加权算术平均数

加权算术平均数是根据分组数据计算的一种平均数。设样本被分为k组,各组的频数为fi样本计算的加权算术平均数的计算公式为:

 

其中,Xi有两种情况:在单变量值分组中,Xi代表各组的变量值;在组距式分组中,Xi代表各组的组中值,    称作权重(频率)。

 

总体数据计算的加权算术平均数 的计算公式为:

(3)算术平均数的主要数学性质

①各变量值与其算术平均数的离差之和等于零;

   即:

 

②各变量值与其算术平均数的离差平方和最小。

即:

 

 

3. 调和平均数

调和平均数加权算术平均数的一种变形。   

调和平均数与加权算术平均数的关系是:若已知各组变量值  及其标志总量mi(mi=xifi ),而缺乏fi的数据时,则加权算术平均数可通过变形得到fi(fi=mi



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3