stata 学习记录

您所在的位置：网站首页 › 税务师题库app哪个好一点 › stata 学习记录

stata 学习记录

2023-09-05 12:44| 来源: 网络整理| 查看: 265

list

reghdfe

matrix

gsort

tab VS levelsof

tabout

collapse

contract

tag

list

list ,noobs clean //noobs 不显示行数；clean让输出结果更紧凑。总体来说让输出结果更好看。

list ,seq(n) //每n行绘制分隔线;默认是separator(5)

list ,seqby(varlist) //每当varlist值发生变化时，绘制分隔线

reghdfe

reghdfe depvar [indepvars] [if] [in] [weight] , absorb(absvars) vce() [options]

vce(r)稳健标准误 vce(cl varlist)在varlist上的聚类标准误，一般与固定效应一致

如: reghdfe y x ,a(id year) vce(cl id)

与以下命令(的系数和显著性)一致（但t统计量和标准误可能不同）

reg y x i.id i.year, vce(cl id) reg要求：i.varlist 因子变量必须是数值型，且会报告所有因子变量的估计量。如果不需要固定效应估计量（或者很多）、需要从非数值型分类变量生成因子变量。reg明显劣于reghdfextset id year xtreg y x i.year, fe r

matrix

注意：矩阵只能存储数值型变量

matrix A=(6+1,3,4\6/2,5,9) matrix input B = (1,2.3,4.5) //不能有运算符，所以优选无input Mat B=(3,4\5+7,8) mat dir mat list A mat drop A mat drop _all matrix rownames A =a b matrix colnames A=obs1 obs2 obs3 mat list A *提取元素 disp A[2,2] dis A[2,"obs2"] dis A[1..2,1] dis A[.,2...] //表示矩阵A的所有行，第2列至最后一列元素,当然也可以用行名和列名进行提取。 colnumb(X，name)//返回矩阵X中列名为name的所在列数。 rownumb(X，name)//返回矩阵X中行名为name的所在行数。 colsof(X)//返回矩阵X的列数。 rowsof(X)//返回矩阵X的行数。 /*矩阵和变量的转化: mkmat：将数值型变量中的观测值转变为矩阵。 svmat：将矩阵转变成变量。 */ sysuse auto,clear mkmat mpg matrix list mpg //导入auto数据，将变量mpg转化为矩阵 mkmat price foreign mpg, matrix(A) //将变量price foreign mpg 转化为74行3列的矩阵A matrix list A clear all mat B=(1,2,3\4,5,6\7,8,9) //输入一个矩阵B，将矩阵B转化为变量 svmat B,names(var) list * 保存矩阵 matsave matrix [, replace saving dropall path(path) type(type) ] // 保存到dta中 mat2txt , matrix(matrixname) saving(filename) [ title(text) note(text) format(formatlist) replace append ] // 保存为txt格式 dataout [, options] // word:转成rtf格式的word文档 excel:转成xml格式的excel⽂档 gsort

sort 只能升序排列 gsort -varlist 降序；gsort +varlist 降序

tab VS levelsof tab varlist , matrow() matcell() g() //g()生成多个指示变量；matrow 存储特征值到矩阵，但限于数值型变量；matcell 存储特征值的频数到矩阵 levelsof varlist, matrow() matcell() //levelsof优于tab，因为其返回 r(N) r(r) r(levels)-可以是字符串型特征值 tabout

https://www.lianxh.cn/news/d761ebd7ae49b.html

collapse

将原始数据集压缩为统计量（和、均值、方差……）的新数据集。clist必须是数值型变量！

preserve collapse save "",replace restore

collapse clist [if] [in] [weight] [, options] where clist is either [(stat)] varlist [ [(stat)] ... ] [(stat)] target_var=varname [target_var=varname ...] [ [(stat)] ...] or any combination of the varlist or target_var forms, and stat is one of mean means (default) //默认为均值 median medians //中位数 p1 1st percentile p2 2nd percentile ... 3rd-49th percentiles p50 50th percentile (same as median) //第50分位点 ... 51st-97th percentiles p98 98th percentile p99 99th percentile sd standard deviations //标准差 semean standard error of the mean (sd/sqrt(n)) //平均值的标准误 sebinomial standard error of the mean, binomial (sqrt(p(1-p)/n)) sepoisson standard error of the mean, Poisson (sqrt(mean)) sum sums //求和 rawsum sums, ignoring optionally specified weight except observations with a weight of zero are excluded count number of nonmissing observations //非缺失观测数 percent percentage of nonmissing observations //非缺失观测数百分比 max maximums //最大值 min minimums //最小值 iqr interquartile range //四分位范围 first first value // 第一个值 last last value //最后一个值 firstnm first nonmissing value //第一个非缺失值 lastnm last nonmissing value //最后一个非缺失值

Options by(varlist) varlist是分组统计的依据，与clist不重复。 cw 删除有缺失值的观测值

contract

压缩为频率数据集

preserve contract

save "",replace restore

contract varlist [if] [in] [weight] [, options] Options freq(newvar) 频数; 默认为 _freq cfreq(newvar) 累计频数 percent(newvar) 百分比 cpercent(newvar) 累计百分比 float 指定percent()和cpercent()生成的百分比变量是浮点数类型;默认为double型 format(format) 设置percent()和cpercent()生成的百分比变量的格式;默认format(%8.2f) nomiss 删除缺失值 tag

https://www.lianxh.cn/news/3f5d25925cd54.html

【本文地址】

stata 学习记录

stata 学习记录

今日新闻

推荐新闻