不可不知的双重差分法(DID)经典案例合集

您所在的位置:网站首页 平均数的两种分法 不可不知的双重差分法(DID)经典案例合集

不可不知的双重差分法(DID)经典案例合集

2024-07-15 01:22| 来源: 网络整理| 查看: 265

假定1:此模型设定正确。特别地,无论处理组还是控制组,其时间趋势项都是。此假定即“平行趋势假定”(parallel trend assumption)。DID最为重要和关键的前提条件:共同趋势(Common Trends)

双重差分法并不要求实验组和控制组是完全一致的,两组之间可以存在一定的差异,但是双重差分方法要求这种差异不随着时间产生变化,也就是说,处理组和对照组在政策实施之前必须具有相同的发展趋势。

假定2:暂时性冲击与政策虚拟变量不相关。这是保证双向固定效应为一致估计量(consist estimator)的重要条件。在此,可以允许个体固定效应与政策虚拟变量相关(可通过双重差分或组内变换消去,或通过LSDV法控制)。

DID允许根据个体特征进行选择,只要此特征不随时间而变;这是DID的最大优点,即可以部分地缓解因 “选择偏差”(selection bias)而导致的内生性(endogeneity)。

2、命令介绍

下载安装命令方法为:

ssc install diff, replace 下载安装方法(外部命令)

语法格式为:

diff outcome_var [ if] [ in] [weight] ,[ options]

模型必选项介绍:

其中“outcome_var”表示结果变量

“treat(varname) ”为必选项,用来指定处理变量

“period(varame)”用来指定实验期虚拟变量(1=实验期,0=非实验期)

可选项介绍:

cov(varlist),协变量,加上kernel可以估计倾向得分

kernel, 执行双重差分倾向得分匹配

id(varname),kernel选项要求使用

bw(#) ,核函数的带宽,默认是0.06

ktype(kernel),核函数的类型

qdid(quantile),执行分位数双重差分

pscore(varname) 提供倾向得分

logit,进行倾向得分计算,默认probit回归

ddd(varname),三重差分

SE/Robust

cluster(varname) 计算聚类标准误。

robust 稳健标准误

3、操作应用案例1:垃圾焚化炉的区位对住房价格的影响

来源:混合横截面政策分析:垃圾焚烧厂的区位对住房价格的影响

本文以伍德里奇书籍配套数据为例,介绍新建垃圾焚烧厂对房价影响。

原文为:

House Prices during Siting Decision Stages: The Case of an Incinerator from Rumor through Operation

Author:Katherine A. Kiel Katherine T. McClain

垃圾焚化炉的区位对住房价格的影响

基尔和麦克菜思( Kiel and Mcclain,1995)曾研究,在马萨诸塞州北安德沃市,一个新建的垃圾焚化炉对住房价值的影响。他们利用多年的数据并作了相当复杂的计量经济分析,我们将只利用两年的数据和些简化模型,但我们的分析仍与之相似。

1978年开始传言要在北安德沃市兴建一座垃圾焚化炉,而于1981年开始动工,人们预料动工后不久化炉便会投入运转;事实上1985年オ开始运转。我们将利用1978年住房出售的价格数据和1981年售价的另一个样本数据。我们的假设是,靠近焚化炉的房价相对远离焚化炉的房价要下跌。

为便于说明,若房子位于焚化炉3英里以内,我们便称之为靠近。

我们先来看看距离的远近对房价的美元影响。这就要求我们用不变美元来度量价格。我们一律用波士顿住房价格指数接1978年美元计算房价,令rprice为真实住房价格。

一位天真的分析者会仅仅使用1981年的数据并估计一个非常简单的模型

其中, nearinc是在住房靠近焚化炉时等于1,否则等于0的一个二值变量,用 KIELMC中的数据估计这个方程,

因为这是一个仅对单个虚拟变量的简单回归,所以截距就是远离焚化炉的住房平均售价,而 nearinc的系数则代表靠近焚化炉与远离焚化炉的住房平均售价之差。估计结果表明,前者的平均售价比后者的要低30688.27美元。统计量的绝对值大于5;从而我们可以强有力地拒绝靠近焚化炉的住房与远离的有相同价值这一原假设

1978年回归结果表明靠近焚化炉的住房比远离他的平均房价低了18824.37美元;而且这一差额也是统计显著的。这正符合焚化炉本来就要建造在房价低地带的观点。

3.1、导入并且查看数据

use "C:\Users\admin\Desktop\KIELMC.DTA".

ed

desc

数据介绍:在这里面的我们将1978年作为y81=0,然后1981这样的一个新建垃圾焚烧厂建立时期等于1。nearinc表示新建垃圾焚烧厂的距离,lprice 表示房价

3.2、nearinc表示=1 if dist |t| [95% conf. interval]

-------------+----------------------------------------------------------------

nearinc | -.402572 .0645888 -6.23 0.000 -.5302675 -.2748765

_cons | 11.74242 .0342802 342.54 0.000 11.67465 11.81019

------------------------------------------------------------------------------

.

.

.

.

.

. regress lprice nearinc ify81==0

Source | SS df MS Number of obs = 179

-------------+---------------------------------- F(1, 177) = 40.31

Model | 4.44632519 1 4.44632519 Prob > F = 0.0000

Residual | 19.5249099 177 .110310226 R-squared = 0.1855

-------------+---------------------------------- Adj R-squared = 0.1809

Total | 23.9712351 178 .13466986 Root MSE = .33213

------------------------------------------------------------------------------

lprice | Coefficient Std. err. t P>|t| [95% conf. interval]

-------------+----------------------------------------------------------------

nearinc | -.339923 .0535412 -6.35 0.000 -.4455842 -.2342618

_cons | 11.28542 .0299471 376.84 0.000 11.22632 11.34452

------------------------------------------------------------------------------

.

3.4、双重差分

regress lprice y81 nearinc y81nrinc

Source | SS df MS Number of obs = 321

-------------+---------------------------------- F(3, 317) = 73.15

Model | 25.1332147 3 8.37773824 Prob > F = 0.0000

Residual | 36.3057706 317 .114529245 R-squared = 0.4091

-------------+---------------------------------- Adj R-squared = 0.4035

Total | 61.4389853 320 .191996829 Root MSE = .33842

------------------------------------------------------------------------------

lprice | Coefficient Std. err. t P>|t| [95% conf. interval]

-------------+----------------------------------------------------------------

y81 | .4569953 .0453207 10.08 0.000 .3678279 .5461627

nearinc | -.339923 .0545555 -6.23 0.000 -.4472595 -.2325865

y81nrinc | -.062649 .0834408 -0.75 0.453 -.2268167 .1015187

_cons | 11.28542 .0305145 369.84 0.000 11.22539 11.34546

------------------------------------------------------------------------------

.

上述回归分析结果与did命令结果一致,可以发现y81nrinc变量是不显著的,可以加入其他影响变量。

. regress lprice y81 nearinc y81nrinc age agesq lintst lland larea rooms baths

Source | SS df MS Number of obs = 321

-------------+---------------------------------- F(10, 310) = 116.91

Model | 48.5621258 10 4.85621258 Prob > F = 0.0000

Residual | 12.8768595 310 .041538256 R-squared = 0.7904

-------------+---------------------------------- Adj R-squared = 0.7837

Total | 61.4389853 320 .191996829 Root MSE = .20381

------------------------------------------------------------------------------

lprice | Coef. Std. Err. t P>|t| [95% Conf. Interval]

-------------+----------------------------------------------------------------

y81 | .425974 .0284999 14.95 0.000 .3698963 .4820518

nearinc | .032232 .0474876 0.68 0.498 -.0612067 .1256708

y81nrinc | -.1315133 .0519712 -2.53 0.012 -.2337743 -.0292524

age | -.0083591 .0014111 -5.92 0.000 -.0111358 -.0055825

agesq | .0000376 8.67e-06 4.34 0.000 .0000206 .0000547

lintst | -.0614482 .0315075 -1.95 0.052 -.1234438 .0005474

lland | .099845 .024491 4.08 0.000 .0516554 .1480346

larea | .3507722 .0514865 6.81 0.000 .2494649 .4520794

rooms | .0473344 .0173274 2.73 0.007 .0132402 .0814285

baths | .0942767 .0277256 3.40 0.001 .0397225 .1488309

_cons | 7.651756 .4158832 18.40 0.000 6.833445 8.470067

--------------------------------------------------------------------------

加入协变量使用双重差分命令diff进行分析,结果为:

diff lprice,t(nearinc) p(y81 ) robust

DIFFERENCE-IN-DIFFERENCES ESTIMATION RESULTS

Number of observations inthe DIFF-IN-DIFF: 321

Before After

Control: 123 102 225

Treated: 56 40 96

179 142

--------------------------------------------------------

Outcome var. | lprice | S. Err. | |t| | P>|t|

----------------+---------+---------+---------+---------

Before | | | |

Control | 11.285 | | |

Treated | 10.946 | | |

Diff (T-C) | -0.340 | 0.062 | -5.45 | 0.000***

After | | | |

Control | 11.742 | | |

Treated | 11.340 | | |

Diff (T-C) | -0.403 | 0.071 | 5.65 | 0.000***

| | | |

Diff-in-Diff | -0.063 | 0.095 | 0.66 | 0.509

--------------------------------------------------------

R-square: 0.41

* Means and Standard Errors are estimated by linear regression

**Robust Std. Errors

**Inference: *** p



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3