(二)数据清理之stata的使用

您所在的位置:网站首页 怎么删除stata数据中不需要的数据 (二)数据清理之stata的使用

(二)数据清理之stata的使用

2024-01-02 15:46| 来源: 网络整理| 查看: 265

上一篇忘记说了,我对命令完全是靠自己的理解来进行阐述的,可能阐述的不是那么规范化,但我希望我写的仅仅是大家能明白就行了。

先补充几个基本命令。

 

cd:很多编程软件中都有该命令,该命令主要负责更改当前工作路径,一般stata的默认路径是你安装的路径,所以保存的文件也在你安装的路径中,如果你想更改当前的工作路径,需输入:cd  D:\example,之后你的工作路径便在  D:\example。ssc install xx(软件包名称):由于一些程序包可能并不是stata自带的,此时需要这个命令安装该程序包才可以进行使用。use:此命令主要负责导入dta格式的文件,具体使用方法为:use   文件名clear:清楚当前文件,由于stata每次只能打开一个文件,所以如果想打开另一个文件,必须在命令行输入clear。save:将当前文件保存为dta格式,具体使用方法为:save  文件名。rename:对变量名进行更改,具体用法为:rename  oldname newnamelabel:对变量进行加标签,具体用法为 label  gdp  "国内生产总值"(label    变量名称    标签内容)replace:主要用于内容的替换,我常用的有两种情形,一是对样本进行替换,例如 replace year=2015 in  15

该命令行的含义是将变量year的第15个样本替换为2015,另一种是文件的替换,例如

save 2016,replace

该命令行的含义是将已有的文件2016替换为新文件2016,但建议最好不要这样操作,一旦文件用了replace,那么你原来的文件便没了,比如你有一份原始数据,该数据没有经过任何修改,此时你对该文件进行了一系列的数据处理,如果你直接replace,那么你的基本数据便没了,一旦以后模型构建出现任何问题,你需要原始数据,那么会造成很多问题。

drop:主要用于变量、样本的删除,具体使用方法为:drop 变量名 

keep:drop是用于删除使用的命令,那么keep就是用来保留满足条件的值,具体使用方法为:keep 变量名,当然keep经常会和一些逻辑判断指令一起进行使用,如if

if:条件语句,该命令主要和其他命令相结合进行一定的逻辑判断。用一些具体命令来说明。if在各个编程软件包括excel都有很大的用处,所以建议大家一定要将这个命令用熟。同时需要了解一些符号的使用。

&(且,与,):需要同时满足所有条件

|(或):满足其中的一个条件即可

==:在筛选满足条件的数值时需要打入的是==,而不是=

keep if year==2015 drop if gdp>=1500 ​

 

我只是选择了连个命令和if一起进行使用,其实只要是进行逻辑判断的if都可以进行使用,具体问题具体分析吧。我举的例子可能相对比较简单,但我的初衷就是希望用简单的代码让大家明白这些命令的具体操作,尽量做到通俗易懂。

这片主要对一些基本指令进行了解释,这10个命令可以说是比较基础的指令,但他们又起着不可或缺的作用,之后我对一些数据处理具体指令进行详细的阐述。

 


【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3