在STATA使用statsby命令做分组回归精编版

您所在的位置:网站首页 stata怎么分组回归 在STATA使用statsby命令做分组回归精编版

在STATA使用statsby命令做分组回归精编版

2022-03-26 23:48| 来源: 网络整理| 查看: 265

……………………………………………………………最新资料推荐…………………………………………………

 

 

STATA

使用

statsby

命令做分组回归

 

赵岩

 

徐畅

 

(吉林大学商学院会计系)

 

 

在实际的回归分析中,经常需要做多分组的回归,譬如:分别按年度、行业进行回归。

如果仅仅使用

regress

命令,那么必然造成进行重复多次的繁重劳动。当然,一种办法就是

通过编程来实现,

不过这需要拥有较好的编程能力,

绝大多数初学者甚至是资深人士都不愿

选择的。其实

STATA

中已经提供了相应的命令完成这个貌似繁重的工作,即

statsby

,这个

可以专门用来处理分组数据的命令。

 

 

一、

statsby

的命令格式及说明

 

statsby

命令格式为:

 

statsby [exp_list] [, options ]: 

 

command 

其具体内容,请参见

STA

TA

help

文件,即:

 

help statsby 

在分组回归中,

statsby

最重要的是如下三个部分:

 

1

[, options ]

,应使用分组变量,如:

,by(year industry)

 

2

command

,应选用相应的回归命令,如果是

OLS

,那么就为“

regress y x1 x2

 

3

[exp_list]

,要统计的相应参数,如:系数拟合值、拟和优度、自由度等,可参见

对应

command

help

文件。

 

综合起来,命令可以写为:

 

use 

d:\statsbydata.dta

,clear 

sort year industy 

Statsby 

_b 

_se 

e(r2) 

e(r2_a) 

e(df_m) 

e(df_r) 

e(F) 

e(N), 

by(year 

industry) 

saving(d:\statsbyresults.dta, replace): regress y x1 x2 

其中:

 

d:\statsbydata.dta

为举例使用数据库,包括变量为:

y

x1

x2

year

industry

,其中

year

industry

是用来做分组回归的分组标识变量;

 

sort

是排序命令,建议养成好习惯对分组变量排序,为了后续研究做准备。

 

_b

为各变量的回归系数;

 

_se

为各变量的标准误;

 

e(r2)

为回归方程的拟和优度

r

2

 

e(r2_a)

为回归方程的调整后

r

2

 

e(df_m)

为回归方程的模型自由度,一般的统计、计量的书籍都记为

(K-1)

 

e(df_r)

为回归方程的剩余自由度,一般的统计、计量的书籍都记为

(n-K)

 

e(F)

为回归方程的

F

值;

 

e(N)

为进入回归方程的有效样本数

N

,一般的统计、计量的书籍都记为

n

,也即前述提

及的

n

 

by(year industry)

,使用变量

year

industry

作为分组变量,进行分组统计;

 

saving(d:\statsbyresults.dta, replace)

,将结果保存,也可以保存在临时表里;

 

regress y x1 x2

,进行回归,这部分可以参看

regress

命令自身格式进行扩充。

 

此命令结束后,将在

D

盘下产生一个名字为

statsbyresults.dta

的文件,上述统计量都将

在此文件中。

这里需要说明的是

_b

_se

是系统生成的向量,

因此不能随便赋给变量,

e()



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3