stata命令
【命令1】:导入数据 一般做实证分析使用的是excel中的数据,其后缀名为.xls,需要将其修改为.csv insheet usingname.csv, clear 【命令2】:删除重复变量 sortvar1 var2 duplicatesdropvar1 var2, force 【命令3】:合并数据 usedata1, clear merge m:mvar1 var2usingdata2 drop if _merge==2 drop if _merge==1 drop _merge 【命令4】:描述性统计分析 tabstatvar1var2, stat(n min mean median p25 p75 max sd), ifgroupvar==0 or 1 输出到word中: logout, save(name) word replace: tabstatvar, stat(n min mean p50 max sd) col(stat)f(%9.2g) 【命令5】:结果输出 安装 ssc install estout, replace 单个回归 reg y x esttab using name.rtf, compress nogap r2 ar2 star(* 0.1 ** 0.05 *** 0.01) 多个回归一起 reg y x1 est store m1 reg y x2 est store m2 esttabm1 m2usingname.rtf, compress nogap r2 ar2 star(* 0.1 ** 0.05 *** 0.01) 【命令6】 生成虚拟变量 tabyear, gen(year) tabindustry, gen(industry) 【命令7】 数据缩尾处理 findit winsor2 之后安装 winsor2varname, replace cut(1 99) 【命令8】异方差检验 怀特检验 ssc install whitetst reg y x1 x2 estat imtest, white 处理:“OLS+稳健标准差” reg y x1 x2 x3, robust 【命令9】 DW检验 gen id=_n tsset id estat dwatson 【命令10】 计算两个日期之间的间隔天数 gen td=date(trading_date,'YMD') gen ed=date(eventdate,'YMD') formtd ed%td gen d=ed-td 【命令11 】 生成滞后、差分数据 tsset code year gennewvarname=l.varname gen newvarname=d.varname 【命令12】多重共线检验之方差膨胀因子 reg y x1 x2 x3 vif 【命令13】多重共线修正之逐步回归 stepwise, pe(0.1): reg y x 【命令14】检验是否遗漏高次项 reg y x estat ovtest 或者estat ovtest, rhs 【命令15】 样本检验 两样本均值T检验 ttestvar, by(groupvar) 两样本中位数Z检验 ranksumvar, by(groupvar)
