Stata生成虚拟变量的几种方式 |
您所在的位置:网站首页 › stata01变量怎么设置 › Stata生成虚拟变量的几种方式 |
说明 之前已经做过了关于此问题的视频Stata入门——生成虚拟变量,此文是对视频中的方法进行整理,方便查看。 定义虚拟变量 ( Dummy Variables) 又称虚设变量、名义变量或哑变量,用以反映质的属性的一个人工变量,是量化了的自变量,通常取值为0或1。 举例说明,反映文化程度的虚拟变量可取为:1:本科学历;0:非本科学历;反应性别的变量,1:男,0:女。 Stata的生成方式注:虚线内是stata的代码 先调用一个数据集用作说明: sysuse auto,clear 目标:我们要生成一个虚拟变量,如果是本地车为0,外国车为1 方法一: *生成一个变量,将非缺失的样本全部赋值为0 gen dummy1 = 0 if !missing(foreign) *再将外国车的样本的值替换为1 replace dummy1 = 1 if !missing(foreign) & foreign == 1 方法二: *可以直接用条件函数进行生成 *如果满足foreign == 1这个条件,赋值为1,否则为0 gen dummy2 = cond(foreign == 1,1,0) *不要忘了对缺失值进行操作,将缺失值保留下来 replace dummy2 = . if misssing(foreign) 方法三: 如果生成的类别较多,比如这个数据集中的制造商的虚拟变量,如果用上面两种方法工作量较大,可以用tab方法。 *此处为英文括号 *car_ 是新生成变量的前缀,可以根据自己的需要替换 tab make,gen(car_) 结语以上就是我比较常用的三种生成虚拟变量的方法。 参考文献:【1】(如何创建虚拟变量)https://stata-club.github.io/%E6%8E%A8%E6%96%87/20161025/ 【2】(百度百科:虚拟变量)https://baike.baidu.com/item/%E8%99%9A%E6%8B%9F%E5%8F%98%E9%87%8F |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |