第三种内生性:衡量偏误(测量误差)如何检验

您所在的位置:网站首页 三种误差模型误差 第三种内生性:衡量偏误(测量误差)如何检验

第三种内生性:衡量偏误(测量误差)如何检验

#第三种内生性:衡量偏误(测量误差)如何检验| 来源: 网络整理| 查看: 265

Stata 连享会   主页 || 视频 || 推文

温馨提示: 定期 清理浏览器缓存,可以获得最佳浏览体验。

✌ 课程详情: https://gitee.com/arlionn/Course   |   lianxh.cn

✨ 课程主页: https://gitee.com/arlionn/Course

作者: 陈贤孟 (厦门大学) 邮箱: [email protected]

[编者按]: 本文介绍的内容来自如下论文,特此致谢!

[Source]: Lee, Y. J., & Wilhelm, D. (2020). Testing for the presence of measurement error in Stata. The Stata Journal, 20(2), 382-404. -Link-

目录

1. 引言2. 检验测量误差的参数方法2.1 基本原理2.2 简单示例3. 检验测量误差的非参数方法3.1 基本原理3.2 dgmtest 命令介绍3.3 简单示例4. 蒙特卡罗模拟4.1 蒙特卡罗模拟设计4.2 蒙特卡罗模拟结果呈现5. 应用实例5.1 实例背景介绍5.2 检验过程介绍与结果呈现6. 总结参考文献相关课程课程一览

1. 引言

「测量误差」 (Measurement Error,也称为「衡量偏误」) 是内生性的主要来源之一。相对于另外两种文献中经常提及的内生性来源——「遗漏变量」、「互为因果」,大家对「测量误差」的关注非常有限。在实证研究过程中,若解释变量存在测量误差,往往会使得研究者无法一致地估计解释变量的系数。那们如何判断解释变量是否存在测量误差?

Lee and Wilhelm (2020) 系统介绍如何运用 Stata 检验解释变量的测量误差。

首先,构建如下检验假设: H0:P(X=X∗)=1(1)

  其中,X 表示解释变量的观测值,X∗ 表示解释变量的真实值。

然后,他们又分别通过「参数方法」和「非参数方法」对上述假设进行检验。

接下来,我们将对上述两种检验方法进行详细介绍。

2. 检验测量误差的参数方法 2.1 基本原理

首先,考虑以下的一元线性回归模型:

Y=α+βX∗+εE(εX∗)=0(2)

通常,我们无法直接观测到真实值 X∗,故会使用观测值 X 作为真实值 X∗ 的度量。为检验 X 是否存在测量误差,我们需要找到一个合适的工具变量 Z (满足外生性条件和相关性条件)。

Hausman (1978) 指出,若不存在测量误差,OLS 估计量和 IV 估计量均是一致的,反之,则仅有 IV 估计量是一致的。因此,我们可以将 OLS 估计量和 IV 估计量进行对比,若 IV 估计量和 OLS 估计量存在显著差异,则解释变量存在测量误差。

在实践中,一种常见的等价做法是,对如下方程进行回归,并检验工具变量 Z 的系数 γ¯ 是否显著为 0,以判断解释变量是否存在测量误差,具体如下:

(3)Y=α¯+β¯X+γ¯Z+ε¯ (4)H0:γ¯=0

Lee and Wilhelm (2020) 指出,当式 (2) 成立时,拒绝假设 (4) 等价于拒绝假设 (1),表明解释变量存在测量误差问题。反之,则不成立,即无法拒绝假设 (4) 并不意味着解释变量不存在测量误差。为了让上述两个假设完全等价,需进一步作出如下限定:

记 X=X∗+ηX,其中 ηX 表示 X 的测量误差,并且 ηX 满足 E(X∗ηX)=0 和 E(εηX)=0。这里的 ηX 又被称为「经典测量误差」。 2.2 简单示例

接下来,我们将通过一个模拟的例子来说明如何用参数方法检验解释变量的测量误差。

*-设定样本量为200,同时设置随机数种子 clear all set obs 200 set seed 982 *-用随机数生成变量x、y、z和扰动项u和e generate double z = rnormal(0,1) generate double u = rnormal(0,0.5) generate double e = rnormal(0,0.5) generate xs = 0.5*z + u generate x = xs //没有测量误差的清形 generate y = xs + e *-将y回归在x和z上 regress y x z est store m1 *-引入测量误差eta generate double eta = rnormal(0,0.5) drop x *-生成新的x,此时x与真实值xs之间存在测量误差 generate x = xs + eta *-重新将y回归在x和z上 regress y x z est store m2 *-输出结果 esttab m1 m2, b(%6.3f) ar2 nogap star(* 0.1 ** 0.05 *** 0.01) /// mtitles("no error" "error") -------------------------------------------- (1) (2) no error error -------------------------------------------- x 1.062*** 0.514*** (14.02) (8.15) z -0.031 0.196*** (-0.63) (3.71) _cons -0.028 -0.033 (-0.77) (-0.75) -------------------------------------------- N 200 200 adj. R-sq 0.633 0.452 -------------------------------------------- t statistics in parentheses * p


【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3