如何选择“平均数、中位数、众数”代表一组数据的典型水平? |
您所在的位置:网站首页 › 平均数的分类 › 如何选择“平均数、中位数、众数”代表一组数据的典型水平? |
代表一组数据的典型特征和研究对象的一般水平,也是真值的最好代表值是集中量数。 集中量数表示一组数据中大量数据集中在某一点或其上下的情况说明了该组数据的集中趋势。集中量数有多种,包括算术平均数、中数、众数、加权平均数、几何平均数、调和平均数等。 具体选择何种方式,应该由调查的数据决定。所以分析前先画散点图,如下。 以这张图为案例说说来作为下面用个简单的案例分析。假设上图为某地空气监测数据,不同离地高度&粉尘主要含量。典型是——求140米-190米,&粉尘主要存在含量? 横轴是数据区间,组距为0.1米,纵轴是区间是粉尘含量。目测典型数据应该在红色方框内。&粉尘主要存在于165.1-166米之间。 1.算术平均数 算术平均数易受极端数据的影响,这是因为平均数反应灵敏,每个数据的或大或小的变化都会影响到最终结果。 若出现模糊不清的数据时,无法计算平均数。所以这个数据不适合算术平均。 上述数据有明显的的离散型极值,用算术平均数无法体现典型。 2.中数 中数(Median),又名中位数。 对一组数进行排序后,正中间的一个数(数字个数为奇数);或者中间两个数的平均数(数字个数为偶数)。 中数是按顺序排列在一起的一组数据中居于中间位置的数,即在这组数据中,有一半的数据比它大,有一半的数据比它小。这个数可能是数据中的某一个,也可能根本不是原有的数。 优点:计算简单,容易理解,不受极端值影响;缺点:反应不够灵敏,受抽样影响较大;中数乘以总次数于总数不相等;不能进一步代数运算。 上图数据为样本的全部,不用考虑抽样情况,中数比较合适上图。 算出中位数大概就处于方框区间。 3.众数(Mode),一组数据中出现次数最多的数值,叫众数,用M表示。众数有两种求法, 一是,根据单项数列求众数,不需要任何计算,可以直接从分配数列中找出出现次数或频率最大的一组标志值,就是所求的众数。 二是,对组距数列求众数。对众数的计算有两种公式: 这里就不计算了,按第一种来计。众数又两个值,160和165,两个众数组距相差较大的,所以该组数据不适合。 最后,如何选择“平均数、中位数、众数”代表一组数据的典型水平,先看数据再用方法。尽量说得通俗了,希望有帮助。 |
今日新闻 |
推荐新闻 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |