标准差(SD)与标准误(SE)的区别

您所在的位置:网站首页 平均值±2sd 标准差(SD)与标准误(SE)的区别

标准差(SD)与标准误(SE)的区别

2023-09-09 07:59| 来源: 网络整理| 查看: 265

标准误其实就是一种标准差

一方面,“标准误与标准差有什么差别”这个问题我个人觉得本身不太成立的。标准误需要对应一个样本统计量(比如均值就是一个统计量)。标准误不能单独存在,提起标准误就必须提起它究竟是去衡量什么,究竟什么“误”了,究竟什么的波动有多大。

另一方面,标准误其实就是一种标准差。现在想想我们做的实验,比如做了几次定量PCR检测基因表达水平。客观情况真正的表达水平我们是无法直接获知的,我们能够知道的仅仅是我们实验的结果,目的是希望这个实验结果能够尽量正确地代表客观、真理、实际存在但无从知道的数据。手里拿到的数据与客观事实颇有小圆环套在大圆环内的感觉,我们每一次的实验其实是对客观事实的采样。二者能不能划上等号?这个至少对于生物来说不太可能。今天做的、明年做的;你自己做的、师兄做的,这些结果都不太相同,各自的均值都不尽相同。为了衡量这些均值的波动性,均值标准误的概念就出现了。所以标准误其实也是一种标准差,都是去衡量波动。

描述数据

在很多期刊里总能看见诸如69.4±9.3 kg 此类的数据说明,但是这一加一减的东西究竟是什么?所以我想,其实更多的误解是来自于标准差与均值标准误。

如第一篇文献里说的:

The terms “standard error” and “standard deviation” are often confused. The contrast between these two terms reflects the important distinction between data description and inference, one that all researchers should appreciate.

标准差的用途是描述数据的波动性,所以它是用于描述数据;标准误则是用于统计推断的。在说统计推断之前先说说均值标准误是怎么被滥用的。均值标准误(SEM)与标准差二者在数字上的关系是这样的:

 (公式图片来自维基百科)

 SE_x是均值标准误,s是你手里有的数据的标准差,n是你手里数据的数量。也一如文献里提到的,SEM随着样本数变大而变小:

The standard error of the sample mean depends on both the standard deviation and the sample size, by the simple relation SE = SD/√(sample size). The standard error falls as the sample size increases, as the extent of chance variation is reduced—this idea underlies the sample size calculation for a controlled trial, for example. By contrast the standard deviation will not tend to change as we increase the size of our sample.

而且很容易发现,从数字上看,均值标准误是永远比标准差要小的。于是均值标准误就被错用为标准差,错误地用于数据描述,这样好像使得自己的数据看上去更加稳定。

均值标准误与置信区间

如果是正态分布,则95%的置信区间是 均值± 1.96 * SEM



【本文地址】


今日新闻


推荐新闻


    CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3