使用stata完成毕业实证论文的基础操作(上)

您所在的位置:网站首页 stata怎么输入变量数据 使用stata完成毕业实证论文的基础操作(上)

使用stata完成毕业实证论文的基础操作(上)

2024-07-06 20:54| 来源: 网络整理| 查看: 265

想起本科毕业论文时要用 Stata 跑实证却一点都不会的痛苦,这学期学明白了一点,因此写个帖子帮助一点都不懂的小白上手使用 Stata 。

本文9000余字,非常详细地介绍了最基础的命令。上篇内容包括 Stata 简介,标签命名,格式设置,统计信息与文件管理等,希望这些内容能为小白打好良好的基础。我认为只有掌握了最基本的命令,才不会对 Stata 望而生畏,从而进一步掌握高阶技巧,大神看到一笑而过就行,谢谢!数据处理的部分会放在下篇。 

另外 csdn 并无 Stata 专属代码段,每一个新内容的命令我会加粗加斜标红显示,文段主要含义以及我认为需要强调的地方也会加粗表示。

Stata初步了解 获取

Stata 目前最新版本为 Stata17,相比于网络上各种混杂的下载地址,我推荐搜索“羽兔网”,进入网页内在右上角搜索栏里输入Stata,找到软件结果一栏,选择 17 版下载即可。该网站对于软件的获取与安装给予了详细的介绍,且广告较少,非常推荐。资源以百度网盘存储,这是唯一的缺点。(羽兔网地址:常见软件免费下载-羽兔网)

安装后运行你会看到如下界面:

整个页面分为四个区。左上方为代码运行结果区,在命令输入台输入任何代码,无论正确与否,运行后都会返回结果。右上方为变量管理区域,右下角用的较少;代码运行除在命令输入台输入外,还可以编写 do 文档选中对应代码运行,我认为应理清STATA基本用法后再学习do文档,初期还是使用命令控制台;拖动红箭头所指的竖线与横线区域可以放大对应区。

 

 

简单练习

我们用STATA自带数据集进行一些使用上的练习。Stata 专属存储数据格式为 dta,在命令输入台输入sysuse nlsw88.dta, clear(其实不加 dta 也行,但是初学还是培养一下写后缀的意识)。

我们需对该命令进行介绍。sysuse 表示的是 (system use),即从系统中调用数据。使用非 Stata 自带数据只需输入 use,但自带的必须写 sysuse;Nlsw88 是1988 年收集的 2246 个美国年轻妇女相关资料的数据集,其格式存储为 dta,所以需在名字后加上格式后缀;clear 表示清除上一个数据集使用所占用的各种空间,研究时可能在各个数据集间穿梭,clear非常重要,请你导入新的数据集时,每次都在后面加入clear。另一个需讨论的问题是为什么clear是在逗号之后而不是之前,原因在于 Stata 命令通常会以几个字符开头,而后跟上最为关键的参数,缺少这些参数便无法运行,输入完必须输入的参数后,往往会加上一个逗号,在此后面的参数相对来说不那么重要,通常是一些格式命令。

打开数据后先不要着急操作,我需要先教你清除内存空间与清屏的命令。导入数据后,右上方数据变量管理栏是有许多变量的,他们都占用了内存空间,此时输入 clear all 便可使 Stata 回到启动的初始状态,你会发现数据变量栏的变量都消失了。如果觉得代码运行结果碍眼,输入 cls,就可以实现代码运行结果区的完全清除。两个命令并没有关联,clear all 把数据使用的痕迹全部擦除,代码运行结果并不会清零。而 cls 只会清屏,对于数据集不会产生影响。

现在,请再次导入数据。右上角的变量你可能看不懂,我们可以先查看一下数据的具体内容。控制台输入 br(全称为 browse,简写为 br),会立马打开数据页面。现在是浏览模式,红色框第一个选项为编辑模式,你可以在此模式下对数据进行改写,但不建议这样做,通常会污染数据。另外,如果变量非常多但你只想查看几个特定变量时,输入 br 想查看的变量名 ,例如 br race grade 只会显示 race 和 grade 两列数据浏览。可以说,大部分查看数据结构,统计概要的命令,只输入命令会显示全部的结果,在命令后加入具体变量名则显示特定结果。

 

 

标签管理 为变量与数据集添加标签

返回命令输入栏,我们接下来对变量的标签进行处理。为什么需要标签?在数据非常少的时候,我们可以通过简要命名来理解变量,但数据非常多时,如政府一般公共预算所有变量都包含时(这可能有几百个),此时再靠变量性质命名就不可行了。我本科毕业论文指导老师给我的数据里变量名字是 a1 - a332。这样命名的好处是方便我们编写代码,但不利于我们了解这个变量的含义,此时我们就需要为变量添加标签。标签就像化学里玻璃瓶外面贴的字一样,不改变玻璃瓶里东西的性质,又能告诉使用者这是什么物质。

现在我们为变量加上中文标签使数据集更容易理解一些。对第一个表示个体编号的变量 idcode,我们输入 label var idcode "妇女个体编号",此时该变量后的标签就会显示为我们输入的文字。

label 表示标签类命令,var ( variable 简写) 表示我们要改变的是变量的标签,idcode 表示所要改变的变量,"妇女个体编号" 是我们输入的标签名称,请注意中文属于字符,需要用引号括起来,并且一定要使用英文引号,命令中的任何符号都是英文输入法下的符号,请不要使用中文符号。再输入 label var ttl_exp "已工作年数",改变另一个变量标签。如何对标签进行集体命名,很抱歉我目前也不清楚,似乎只能一个一个命名。如果你想去除一个变量



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3