1.3 随机误差的正态分布

您所在的位置:网站首页 正态分布的抵偿性 1.3 随机误差的正态分布

1.3 随机误差的正态分布

2024-02-13 11:34| 来源: 网络整理| 查看: 265

1.3 随机误差的正态分布 1.3.1 测量结果的分布

在重复测量的条件下,不可避免受到许多误差因素的影响,这些影响最终都反映为测量结果的微小变化。例如,对某认定值为μ的标准物质进行n次独立测量,得到一系列测量值x1、x2、…、xn,如果不考虑系统误差,测量误差分别为δ1=x1-μ、δ2=x2-μ、…、δn=xn-μ。在重复测量条件下,由于大量微弱的随机因素的作用,出现的误差 δ1、δ2 、…、δn是大小不等、符号不同的数值,其数值的分布反映误差的随机性。

表1-2列出了用红外吸收法测定某碳素钢中碳含量的160次重复测量结果。这些未经整理的测量值参差不齐、高低不一,看不出有什么规律,能直接提供的信息有限。

表1-2 碳素钢中碳元素含量的测量结果  单位:%

为研究数据的分布规律,将这些数据加以整理,可获得许多有用的信息。绘制直方图是对大量原始数据进行初步整理的有效方法。

根据表1-2的测量结果,可按如下方法绘制直方图:

①将测量结果由小到大排列,得最大值xmax=0.597%,最小值xmin=0.554%,极差R=0.043%,平均值=0.5755%;

②将全部测量数据按等组距(0.004%)分成12(m=12)组,计算每组的组中值及组中值的误差;

③计算测量结果在每组中出现的频数和积累频数及频率和积累频率,计算数据列于表1-3。为避免位于分组点上的测量结果在分组时发生跨组的问题,组界值的有效数字比原测量结果多取一位。上下组界值的平均值为组中值。

表1-3 碳含量分组的频数与频率分布表

注:误差指测量组中值与平均值(0.5755%)之差。

从频数和频率的分布基本可看出测量结果的变化规律,测量结果离平均值愈近,其出现的频数和频率愈大;而离平均值愈远,其出现的频数和频率愈小。

④以各组组距为横坐标,频数和频率为纵坐标,绘制测量结果分布直方图(图1-3)。

图1-3 测量结果频数和频率直方图

注:绘制直方图时,分组数(m)可按m=1.52(n-1)2/5算式估计,n为样本量,当n=160时,计算得m=11.55,可分为12组;也有推荐分组数取近似为样本量平方根的数值。表1-3所有参数由表1-2数据通过Excel表格计算完成。

分析测试中,在消除了系统误差的条件下,许多不可控制的随机因素引起测量误差,并使测量值随之变动。因此,测量结果和测量误差都是一个以概率取值的随机变量。图1-3表明了测量结果和测量误差的分布规律:一是测量结果有明显的集中趋势,在平均值0.5755%附近出现的频数(频率)最高,即误差为零附近测量值的频数(频率)最高;二是各测量值相对应平均值而言,大小相等、符号相反的误差出现的频数大体相等;三是正误差和负误差的分布大体呈对称图形,误差小的测量结果出现的频率远比误差大的测量结果出现的频率多,大误差出现的频率趋于零。当测量次数进一步增加,各组距相对频数趋向于一个稳定值,相对频数分布的直方图逐渐趋于一条中间高、两边对称并渐渐降低、最终趋于零的平滑的铃形曲线。这一铃形曲线就是表示测量误差分布的正态分布曲线。

数据处理的目的就是要从这种变动的数据中找出其中的统计规律。分析测试中,可认为随机变量是由众多互相独立的随机因素的微小影响叠加而成。由概率统计理论,随机变量在数值上服从正态分布。因此,测量值和测量误差都可以用正态分布来描述。

1.3.2 正态分布

正态分布函数是1809年德国数学家高斯(Gauss)推导出来的。

正态分布是连续随机变量x的一种概率分布,其分布函数可表示为:

  (1-9)

正态分布的概率密度函数为:

  (1-10)

式中,x是正态分布总体中随机抽取的样本值;μ是正态分布总体的均值,-∞



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3