stata应用回归分析(三)-残差的性质及度量单位的变化
一、软件操作及零碎概念
删除一系列变量的命令:
drop exper- tenursq
求变量的均值/总和等

tabstat wage yhat, statistics( mean sum )
回归完成后求拟合值:
reg wage educ
法一:直接找估计出的b0,b1代入
gen wageh= -.9048516+.5413593*educ
法二:用predict估计(xb表示 x*bhat)
predict yhat,xb
回归完成后求残差:
法一:实际值-拟合值作差
gen residual=wage-wageh
法二:用predict(两种写法都可以)
predict res,residual
predict res,r
有监督学习:已知成对的y和x
二、理论推导

几何意义:残差和X、Y的估计值没有关系(Y出平面,X和Y的估计值在平面内)
求二阶偏导(参数估计只求一阶导就能得到 残差平方和最小值 的验证)
1.B^2-AC<0有极值, B^2-AC>0 无极值:A>0极小,A<0极大
2.海赛矩阵(二阶偏导 ABBC构成的矩阵)是正定矩阵,则有极小值


求顺序主子式
三、代码验证
先生成乘积变量,再求和
1. 理论推导公式(1) : 残差和=0
tabstat res, statistics(sum )
2. 理论推导公式(2) :残差与X不相关
gen xr=educ*res
tabstat xr,statistic(sum)
3. 理论推导公式(3):残差与Y的估计值不相关
gen yr=yhat*res
tabstat yr,statistic(sum)
变量单位变化对参数估计的影响
一、理论推导

结论:
- 被解释变量扩大1000倍,b0和b1均扩大1000倍
- 解释变量扩大1000倍,b0不变,b1缩小1000倍
二、代码验证
1.Y放大1000倍查看系数
reg salary roe
g salardol=1000*salary //自变量:元->千元
reg salardol roe

放大前:b1=18.5,b2=963.19

放大后:b1=18501,b2=963191.3
Y放大1000倍后,b1和b0均放大1000倍
2. X放大1000倍查看系数
g roe1000=1000*roe
reg salary roe1000

放大后:b1=0.185,b2=963.19
X放大1000倍后,b1缩小1000倍,b0不变