第十章 工具变量法

您所在的位置:网站首页 每个国家的简写 第十章 工具变量法

第十章 工具变量法

2024-05-14 02:59| 来源: 网络整理| 查看: 265

10.5 使用数据集acemoglu.dta复制Acemoglu et al.(2001)的部分结果。该数据集包含64个曾为欧洲殖民地的国家,主要变量为logpgp95(1995年人均GDP,购买力平价),avexpr(1985~1995年间的平均产权保护程度,0为最低,10为最高),lat_abst(首都纬度的绝对值除以90),以及logem4(殖民者死亡率的对数)。另外,变量shortnam以三个字母作为每个国家的筒称。

(1)散点图如下所示。

(2)回归结果如下所示。

从统计意义上看,在5%的显著性水平下,方程整体以及两个解释变量的回归系数均显著;

从经济意义上看:

①avexpr的回归系数说明,在其他条件不变的情况下,1985~1995十年间平均产权保护程度每上升1个等级,1995年按购买力平价的人均GDP就会平均提高0.47%,比较合理;

②注意到lat_abst的取值是纬度的绝对值除以90,取值在[0,1]之内,解释含义时需要考虑单位。lat_abst的回归系数说明,在其他条件不变的情况下,首都处于位置的维度绝对值每增加1度会使GDP平均提高(1.577/90)%=0.0175%,从量纲上看比较合理。

(3)使用稳健标准误进行2SLS回归,并显示第一阶段回归结果。

使用工具变量法进行回归后,虽然回归方程仍显著,但R2下降为10.25%,说明模型的解释能力下降了;并且解释变量lat_abst不再显著,认为国家首都的地理位置对经济发展的影响不大;avexpr的回归系数说明,在其他条件不变的情况下,1985~1995十年间平均产权保护程度每上升1个等级,会使1995年按购买力平价的人均GDP平均提高约1%,仍然是比较合理的范围。

(4)F统计量超过10,因此通过经验判断logem4不是弱工具变量。

10.6 生育行为如何影响劳动力供给?具体来说,如果妇女多生一位小孩,其劳动力供给将下降多少?本题使用来自美国1980年人口普查的数据集fertility_small.dta进行估计。此数据集包含美国21~35岁已婚且有两个或更多子女的妇女信息,主要变量为weeks(1979年的工作周数),morekids(是否有两个以上小孩),以及samesex(头两个小孩是否性别相同)。

(1)回归结果如下。方程线性关系和morekids解释变量均非常显著,因此可以认为有两个以上孩子的妇女在1979年的工作周数比只有两个孩子的妇女平均少6周。但需要注意的是解释变量过少,导致R2才不到0.02,所以模型的解释能力很差。

(2)不能,可能存在双向因果。从经济含义的角度分析,一方面,子女数量增加会导致妇女工作时间的减少;另一方面,工作时间的减少会导致妇女有时间或者动机去养育更多的子女。因此模型可能存在联立方程偏差,考虑使用工具变量法处理。

(3)回归系数不到0.07,显著但效应不大。

(4)判断samesex是否可以作为工具变量,主要验证以下两个问题:

①相关性:工具变量和内生解释变量相关;

②外生性:工具变量与扰动项不相关。

首先,通过上一问可知,虽然效应不强,但工具变量和内生解释变量之间的相关性仍是(统计上)显著的。

其次,判断工具变量的外生性。由于只有一个内生解释变量morekids,一个工具变量samesex,所以最多是恰好识别,不可能是过度识别,因此无法使用过度识别检测来判断有无外生性,只能通过“排他性约束/定性讨论”方法解决。一方面,头两个孩子的性别会影响母亲后续的生育决策,进而影响其工作时长;另一方面,头两个孩子的性别对母亲的工作时长没有直接影响,因此可以认为满足外生性的假设。

综上所述,可以使用samesex作为工具变量。

(5)F=143.15远远大于10,认为samesex不是弱工具变量。

(6)回归结果如下。效应与一元线性回归时差别不大,但在10%显著性水平下不再显著。

(7*)先使用工具变量回归。

方程整体显著,但morekids和hispan在10%显著性水平下不显著。再看使用全部解释变量直接进行OLS回归的情况。

使用esttab命令对比两次回归的结果,morekids在OLS以1%显著,在2SLS不显著。

但morekids正是我们关心的解释变量,它不显著这个模型就没意义了。尝试使用Hausman test和DWH test检验纳入所有变量后的方程是否还存在内生解释变量的问题,如果不存在话我们倾向于使用OLS模型。

结果均不显著,认为不再存在内生性,使用工具变量法的大前提不存在了,所以采用OLS回归的方程即可。

个人认为原因在于,内生性的来源主要有遗漏变量偏差、联立方程偏差(双向因果关系)、测量误差偏差3个方面。原模型(只有morekids解释变量)内生性主要来自于遗漏变量偏差,而非(2)问中回答的双向因果关系,因此在本小问中,将OLS模型中的samesex、age、black等解释变量补充完全以后,遗漏变量偏差和内生性显著减小,故没有使用工具变量法的必要了。

总结:工具变量法的使用步骤

①选取足够的解释变量进行OLS回归,避免产生遗漏解释变量偏差;

②判断哪个解释变量是内生的,并结合经济意义引入满足条件的工具变量;

③使用2SLS进行回归,不满足球形扰动则使用稳健标准误;

④通过2SLS第一阶段回归结果中的回归系数p值判断iv是否满足相关性。(这一步也可以跳过,若⑥中检验不是弱工具变量,那么一定满足相关性,因为强>弱>无关)

⑤判断iv是否满足外生性:

1)若方程为过度识别,则使用过度识别检验;

2)若方程为恰好识别,则使用排他性约束定性讨论。

⑥在不使用稳健标准误的2SLS下,利用经验规则判断是否为弱解释变量,如果是:

1)回到步骤②重新找iv;

2)放弃2SLS,并使用LIML方法。

⑦使用Hausman test或DWH test检验是否存在内生解释变量。这是工具变量法的大前提,从逻辑上讲应该首先进行,之所以放到后面是因为这两个检验是基于2SLS方程的,如果iv是无效的,那么2SLS方程也就没意义了。

⑧汇报结果,视经济意义选择最合适的方程。

更正:原来的10.5题有错误。

双对数模型(单对数同理) lny=a+blnx 的经济含义是“x每增加1%,则y平均增加b%”,而不是“y平均增加100*b%(b的百分数形式)”,即解释经济含义时要b%才能反映y的变动情况。

仅供参考,有错误请在评论区反馈。



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3