在STATA使用statsby命令做分组回归精编版 |
您所在的位置:网站首页 › stata怎么分组回归 › 在STATA使用statsby命令做分组回归精编版 |
……………………………………………………………最新资料推荐…………………………………………………
1 在 STATA 使用 statsby 命令做分组回归
赵岩
徐畅
(吉林大学商学院会计系)
在实际的回归分析中,经常需要做多分组的回归,譬如:分别按年度、行业进行回归。 如果仅仅使用 regress 命令,那么必然造成进行重复多次的繁重劳动。当然,一种办法就是 通过编程来实现, 不过这需要拥有较好的编程能力, 绝大多数初学者甚至是资深人士都不愿 选择的。其实 STATA 中已经提供了相应的命令完成这个貌似繁重的工作,即 statsby ,这个 可以专门用来处理分组数据的命令。
一、 statsby 的命令格式及说明
statsby 命令格式为:
statsby [exp_list] [, options ]:
command 其具体内容,请参见 STA TA 的 help 文件,即:
help statsby 在分组回归中, statsby 最重要的是如下三个部分:
( 1 ) [, options ] ,应使用分组变量,如: “ ,by(year industry) ” ;
( 2 ) command ,应选用相应的回归命令,如果是 OLS ,那么就为“ regress y x1 x2 ” ;
( 3 ) [exp_list] ,要统计的相应参数,如:系数拟合值、拟和优度、自由度等,可参见 对应 command 的 help 文件。
综合起来,命令可以写为:
use “ d:\statsbydata.dta ” ,clear sort year industy Statsby _b _se e(r2) e(r2_a) e(df_m) e(df_r) e(F) e(N), by(year industry) saving(d:\statsbyresults.dta, replace): regress y x1 x2 其中:
d:\statsbydata.dta 为举例使用数据库,包括变量为: y 、 x1 、 x2 、 year 和 industry ,其中 year 和 industry 是用来做分组回归的分组标识变量;
sort 是排序命令,建议养成好习惯对分组变量排序,为了后续研究做准备。
_b 为各变量的回归系数;
_se 为各变量的标准误;
e(r2) 为回归方程的拟和优度 r 2 ;
e(r2_a) 为回归方程的调整后 r 2 ;
e(df_m) 为回归方程的模型自由度,一般的统计、计量的书籍都记为 (K-1) ;
e(df_r) 为回归方程的剩余自由度,一般的统计、计量的书籍都记为 (n-K) ;
e(F) 为回归方程的 F 值;
e(N) 为进入回归方程的有效样本数 N ,一般的统计、计量的书籍都记为 n ,也即前述提 及的 n ;
by(year industry) ,使用变量 year 和 industry 作为分组变量,进行分组统计;
saving(d:\statsbyresults.dta, replace) ,将结果保存,也可以保存在临时表里;
regress y x1 x2 ,进行回归,这部分可以参看 regress 命令自身格式进行扩充。
此命令结束后,将在 D 盘下产生一个名字为 statsbyresults.dta 的文件,上述统计量都将 在此文件中。 这里需要说明的是 _b 和 _se 是系统生成的向量, 因此不能随便赋给变量, 而 e() |
今日新闻 |
推荐新闻 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |