Stata生成虚拟变量的几种方式

您所在的位置:网站首页 stata01变量怎么设置 Stata生成虚拟变量的几种方式

Stata生成虚拟变量的几种方式

2024-06-14 14:53| 来源: 网络整理| 查看: 265

说明

之前已经做过了关于此问题的视频Stata入门——生成虚拟变量,此文是对视频中的方法进行整理,方便查看。

定义

虚拟变量 ( Dummy Variables) 又称虚设变量、名义变量或哑变量,用以反映质的属性的一个人工变量,是量化了的自变量,通常取值为0或1。

举例说明,反映文化程度的虚拟变量可取为:1:本科学历;0:非本科学历;反应性别的变量,1:男,0:女。

Stata的生成方式

注:虚线内是stata的代码

先调用一个数据集用作说明:

sysuse auto,clear

目标:我们要生成一个虚拟变量,如果是本地车为0,外国车为1

方法一:

*生成一个变量,将非缺失的样本全部赋值为0

gen dummy1 = 0 if !missing(foreign) 

*再将外国车的样本的值替换为1

replace dummy1 = 1 if !missing(foreign)  & foreign == 1

方法二:

*可以直接用条件函数进行生成

*如果满足foreign == 1这个条件,赋值为1,否则为0

gen dummy2 = cond(foreign == 1,1,0)

*不要忘了对缺失值进行操作,将缺失值保留下来

replace dummy2 = . if misssing(foreign)

方法三:

如果生成的类别较多,比如这个数据集中的制造商的虚拟变量,如果用上面两种方法工作量较大,可以用tab方法。

*此处为英文括号

*car_ 是新生成变量的前缀,可以根据自己的需要替换

tab make,gen(car_)

结语

以上就是我比较常用的三种生成虚拟变量的方法。

参考文献:

【1】(如何创建虚拟变量)https://stata-club.github.io/%E6%8E%A8%E6%96%87/20161025/

【2】(百度百科:虚拟变量)https://baike.baidu.com/item/%E8%99%9A%E6%8B%9F%E5%8F%98%E9%87%8F



【本文地址】


今日新闻


推荐新闻


    CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3