在STATA使用statsby命令做分组回归精编版

您所在的位置：网站首页 › stata怎么分组回归 › 在STATA使用statsby命令做分组回归精编版

在STATA使用statsby命令做分组回归精编版

2022-03-26 23:48| 来源: 网络整理| 查看: 265

……………………………………………………………最新资料推荐…………………………………………………

在

STATA

使用

statsby

命令做分组回归

赵岩

徐畅

（吉林大学商学院会计系）

在实际的回归分析中，经常需要做多分组的回归，譬如：分别按年度、行业进行回归。

如果仅仅使用

regress

命令，那么必然造成进行重复多次的繁重劳动。当然，一种办法就是

通过编程来实现，

不过这需要拥有较好的编程能力，

绝大多数初学者甚至是资深人士都不愿

选择的。其实

STATA

中已经提供了相应的命令完成这个貌似繁重的工作，即

statsby

，这个

可以专门用来处理分组数据的命令。

一、

statsby

的命令格式及说明

statsby

命令格式为：

statsby [exp_list] [, options ]:

command

其具体内容，请参见

STA

的

help

文件，即：

help statsby

在分组回归中，

statsby

最重要的是如下三个部分：

（

）

[, options ]

，应使用分组变量，如：

“

,by(year industry)

”

；

（

）

command

，应选用相应的回归命令，如果是

OLS

，那么就为“

regress y x1 x2

”

；

（

）

[exp_list]

，要统计的相应参数，如：系数拟合值、拟和优度、自由度等，可参见

对应

command

的

help

文件。

综合起来，命令可以写为：

use

“

d:\statsbydata.dta

”

,clear

sort year industy

Statsby

_se

e(r2)

e(r2_a)

e(df_m)

e(df_r)

e(F)

e(N),

by(year

industry)

saving(d:\statsbyresults.dta, replace): regress y x1 x2

其中：

d:\statsbydata.dta

为举例使用数据库，包括变量为：

、

year

和

industry

，其中

year

和

industry

是用来做分组回归的分组标识变量；

sort

是排序命令，建议养成好习惯对分组变量排序，为了后续研究做准备。

为各变量的回归系数；

_se

为各变量的标准误；

e(r2)

为回归方程的拟和优度

；

e(r2_a)

为回归方程的调整后

；

e(df_m)

为回归方程的模型自由度，一般的统计、计量的书籍都记为

(K-1)

；

e(df_r)

为回归方程的剩余自由度，一般的统计、计量的书籍都记为

(n-K)

；

e(F)

为回归方程的

值；

e(N)

为进入回归方程的有效样本数

，一般的统计、计量的书籍都记为

，也即前述提

及的

；

by(year industry)

，使用变量

year

和

industry

作为分组变量，进行分组统计；

saving(d:\statsbyresults.dta, replace)

，将结果保存，也可以保存在临时表里；

regress y x1 x2

，进行回归，这部分可以参看

regress

命令自身格式进行扩充。

此命令结束后，将在

盘下产生一个名字为

statsbyresults.dta

的文件，上述统计量都将

在此文件中。

这里需要说明的是

和

_se

是系统生成的向量，

因此不能随便赋给变量，

而

e()

【本文地址】

在STATA使用statsby命令做分组回归精编版

在STATA使用statsby命令做分组回归精编版

今日新闻

推荐新闻