最后知道真相的我眼泪也掉下来
第一章:
计量经济学方法论计量经济学方法论
大致地说,传统的计量经济学方法论按下列路线进行:
(1)理论或假说陈述(2)数学模型设定(3)计量模型设定(4)获取数据
(5)参数估计(6)假设检验(7)预测(8)利用模型进行控制或制定政策
计量经济学所用数据的类型:
(1)时间序列数据:对一个变量在不同时间取值的一组观测结果
(2)横截面数据:对一个或 多个变量在同一时间点上收集的数据
(3)混合数据:两者兼有
(4)综列、纵列或微观综列数据:混合数据的特殊类型,指对相同的横截面的单元在时间轴上进行跟踪调查的数据。
回归的现代意义:回归分析是关于研究一个所谓的因变量对另一个或多个所谓解释变量的依赖关系,其用意在于通过后者(重复抽样中)的已知或设定值,去估计和预测前者的均值。
二章
总体回归曲线就是(当)解释变量取给定值时因变量的条件均值或期望值的轨迹。
总体回归函数的概念:
反映Y的均值如何随X的变化而变化的函数被称为总体回归函数(PRF)。如
其中β1 和β2是未知但固定的参数,被称为回归系数
PRF的随机设定:
因为Y是随机的,每个具体的Y不可能恰好等于其均值,他们之间的离差被设定为一个随机扰动项:
E(Y|Xi)被称为Yi的系统性或确定性成分
ui 称为随机或非系统性成分
在给定X的条件下,随机扰动项的均值等于0
样本回归函数:SRF P44(各种定义)
在大部分情况下,我们很难获得总体的数据,而是通过对总体的抽样来探索总体的性质。
类比于总体回归函数(总体Y条件均值与X的关系),可以定义样本回归函数:抽样Y与X之间的关系。如:
其中Yi(帽)是总体均值的估计量,β1(帽)和β2(帽)分别是β1和β2的估计量
随机形式的样本回归函数为:
样本回归线有以下性质:
1穿过Y和X的样本均值点
2Y的估计值的均值等于实际Y值的均值
3残差帽ui的均值为零
4残差帽ui和Yi的预测值不相关
5残差帽ui和Xi不相关
第三章
估计量和估计量方差矩阵形式
最小二乘法的基本假定P51
假定1:参数线性模型。回归模型对参数而言是线性的。
假定2:X非随机(条件回归分析)。在重复抽样X值是固定的。
假定3:扰动项均值为0。对给定的X值,随机干扰项ui的均值或期望值为0
假定4:扰动项同方差。给定X值,对所有的观测,ui的方差都是相同
假定5:扰动项无自相关。给定任意两个两个X值,ui和uj直接的相关性为0
假定6:观测次数n大于待估参数个数。观测次数n必须大于解释变量的个数。
假定7:X有变异性。在一个给定的样本中,X值不可以全是相同的。
最小二乘估计的性质:
1线性的:它是一个随机变量 2无偏的:它的均值或者期望值等于真实值beta
3它在所有的这样的线性无偏估计量有最小方差,有最小方差的无偏估计量叫做有效估计量
高斯-马尔科夫定理
在给定经典线性回归模型的假定下,最小二乘估计量在无偏性估计量一类中,有最小方差。(最优线性无偏估计量)。
在正态性假定下OLS估计量的性质
它们是无偏的。2.它们有最小方差。3.一致性。4.帽beta1是正太分布的。5.帽beta2是z正态分布。6.(n-2)*帽吊塔的平方/吊塔的平方服从n-2个自由度的卡方分布。
7.帽beta1,帽beta2)的分布独立于帽吊塔的平方。
8.帽beta1,帽beta2在所有无偏估计中,无论是线性还是非线性,都有最小方差
OLS估计量的统计性质
1OLS估计量是纯碎可观测的量表达的,因此它们容易计算
2它们是点估计量,即对给定样本,每个估计量仅提供有关总体参数的一个值
3一旦从样本数据得到ols估计值,容易画出样本回归线。
判定系数:拟合优度的度量
总平方和(TSS):
回归(解释)平方和(ESS):
残差平方和(RSS):
r2=ESS/TSS r2被称为(样本)判定系数,它是对回归线拟合优度的最为常用的度量,r2测度了在Y的总变异中由回归模型解释的那个部分所占的比例或百分比
显然ESS占TSS的比重越大,表明Y的变化主要由回归方程所决定,反之由扰动项决定。ESS与TSS的比值定义为r平方。
R平方介于0和1之间,R平方越大拟合效果越好。
TSS自由度为n-1 ESS自由的为k-1 RSS自由度为n-k (k为参数个数)
e.g:当ESS自由度为1时,RSS 自由度为n-2 TSS自由度为n-1
自由度:回归部分(ESS)1 剩余部分(RSS)N-2 TSS N-1
第五章
回归系数的置信区间 (Eviews结果中的t统计量如何?如何决策?)
1、置信区间
(1)满足
的区间被称为置信区间
其中 1-alfa称为置信系数 alfa称为 显著性水平
(2)为了获得置信区间需要知道 beta的分布函数,或是包含beta的统计量的分布函数。在回归系数的置信区间估计中采用的是后一个概念。
(3)因为beta是确定的值,因此前面定义的区间估计的含义为:该区间包含beta的概率为 1-alfa
(4)上述定义的区间是一个随机的区间,因为beta是随机变量。从而beta(帽)是平均意义上的概率1-alfa
2、回归系数的置信区间
在扰动项服从正态分布的假定下,OLS的回归系数beta(帽)也服从均值为 beta标准差为se(beta)的正态分布,从而标准化的统计量服从自由度为n-k的t分布,其中n为样本个数,k为估计参数的个数。即 :
给定显著性水平alfa,t的置信区间为:
因为beta(帽)已经从OLS估计中获得,从而有
决策规则:落入区间内接受、落入区间外拒绝P108
假设检验:置信区间方法(t检验)P109
原理:在给定的置信度下,计算参数的置信区间,如果原假设的参数值落在该区间之内,则接受原假设,反之拒绝原假设。
第六章
回归模型的函数形式(对参数线性)
测度弹性:对数线性模型
模型
斜率系数的意义:Y对X的弹性
模型设定的约束条件:Y对X的弹性为常数,Y和X的对数散点图近似线性
测度增长率:线性到对数
模型:
Beta系数的意义:Y的瞬时增长率
对数到线性模型
模型:
Beta系数的意义:X变化1%时,Y的绝对变化量
模型的意义:Y和X受共同因素的影响(如随时间t增长),其中Y为线性增长(Y=at),X为指数增长(X=exp(t)),则Y与X的关系满足对数到线性模型。恩格尔支出模型
倒数模型
模型:
模型的适用条件:Y受X变化的影响,但随着X的增大,X的变化对Y的影响逐渐削弱,Y存在理论上的渐进线
典型应用:儿童死亡率与人均GDP的关系;通胀与失业率的关系(菲利普斯曲线)
第八章(关注多元回归的t检验、F检验、邹检验)
单个回归系数的检验:显著性检验
方法:T检验
原假设 H0:beta=0 备择假设 H1 :beta<>0
统计量 t=
若1-@ctdist(|t|)接近0,拒绝原假设(P值)
整体回归显著性检验
问题:斜率系数是否都(同时)不等于0
H0:beta1=beta2=0
H1:至少有一个不等于0
方法:F检验
如果@cfdist(F)接近0或1,拒绝原假设(P值)
R-2与F统计量之间的关系
F=
F与R-2两者之间同向变化。当R2=0,F随之等于0。R2越大,F值也越大。终其极限,当R=1时,F变为无限大。
F检验的扩展: 何时增加一个(组)变量
当增加变量时,系数显著不等于0,且R2增大,则可增加。
检验两个回归系数是否相等
检验方法:t检验
在扰动项正态分布的假定下,若原假设成立,则以下定义的t统计量服从t(n-k)分布
检验线性等式约束条件
问题:回归系数是否满足某个线性等式。如c(2)+c(3)=1,在CD生产函数中意味着规模报酬不变。
检验方法(一)t检验
(1)估计模型
(2)构造t统计量,并计算原假设成立时该统计量的值
(3)计算p值(n-k各自由度)
(4)判断
检验方法(二)F检验(受约束的OLS)
(1)估计无约束方程,得RSS_ur
(2)估计约束方程,得RSS_u
(3)构造F统计量,原假设成立(约束条件成立),F服从自由度为(m,n-k)的F分布,其中m为约束条件的个数,k为无约束方程的参数个数
(4)计算p值,判断
一般的F检验
问题:检验回归方程中若干个(多于一个,但非全部)系数同时等于0
方法:将检验问题看成约束条件下的回归
(1)估计无约束方程
(2)估计约束方程
(3)计算F统计量
(4)计算P值
结构或参数的稳定性:Chow检验
问题:回归方程是否随时间发生变化(系数改变)。如边际消费倾向是否在两个相邻的时期发生变化
方法:邹检验
假设
1、相邻两个子区间的扰动项服从相同的正态分布 2、两个子区间的扰动项独立
检验原假设:无结构变化
检验机制
1、估计整个区间的回归方程(约束回归:无结构变化的原假设成立),得RSS_r,自由度为(n1+n2-k)
2、估计第一子区间回归方程,得RSS_ur1,自由度为(n1-k)
3、估计第二子区间回归方程,得RSS_ur2,自由度为(n2-k)
4、无约束RSS-ur= RSS_ur1+ RSS_ur2,自由度为(n1+n2-2k)
5、构造F统计量,计算p值
第九章 虚拟变量
写出当u >=0 或u<0 时的方程形式 (记得合并同类项)
第10章
多重共线性的性质
多重共线性:回归元之间存在完全或准确的线性关系。即某个回归元可以由其他回归元线性表示(或增加一个小的扰动,此时为非完全共线性)。
完全共线性导致回归系数是不确定的,且标准误为无穷大。
非完全共线性虽然回归系数可确定,但标准误非常大。
多重共线性产生的原因
1、数据采集所用方法:如在回归元的有限范围内取值
2、模型或从中取样的总体受到约束:回归元在本质上联系密切
3、模型设定:在回归中添加多项式,但X的变化范围较小
4、过度决定模型:观测值个数少于参数个数
5、回归元有相同的趋势
多重共线性的实际后果
1、OLS估计量虽然是BLUE,但有大的方差和协方差,故难以做出精确的估计
2、置信区间更宽,更容易接受系数等于0的原假设
3、一个或多个系数的t统计量很小(绝对值)倾向于统计不显著
4、拟合优度R-2可能很高
5、OLS估计量及其标准误对数据的微小变化很敏感
多重共线性的侦察
多重共线性本质上是一种样本现象(非总体现象),且只有强度大小之分,而无存在与否之分。没有侦查多重共线性强弱的唯一方法
经验侦查方法:
1、R-2高,少且显著的t比率
2、回归元之间有高度的两两相关
3.检验相关系数
4、辅助回归:经验法则——仅当来自一个辅助回归的R-2大于Y对所有回归元的R-2时,多重共线性才是严重的
5、本征值和病态指数
6、容许度(1-Ri-2):越小表明多重共线性程度越严重
7.散点图
第11章
异方差性的性质:没有同方差,Yi的方差随i的变化而变化
异方差检验的方法有哪些?
1.帕克检验 2.格莱泽检验 3.斯皮尔曼的等级相关检验 4.戈德菲尔德―匡特检验 5.布劳殊―培干―戈弗雷 6.怀特异方差检验 7.游程检验. 8其他异方差检验 :寇因特—巴塞特检验
在出现异方差时的OLS估计:帽B2仍是线性无偏的,帽B2是一个一致估计量,即随着样本无限扩大,收敛于真实值,且在一定条件下,还是渐近正态分布的。
*异方差检验的补救措施
当σ2为以知:加权最小二乘法
当σ2为未知:
如果样本够大,则可获取OLS估计量的怀特异方差校正标准误并以之作为统计推断的依据。
可根据OLS残差,合理地猜测方差性的可能模型,以便将原始数据变换成没有异方差性的变换数据。
关于异方差性模式的可能假定:
假定1:误差方差正比Xi2:E(ui2)= σ2 *Xi2
假定2:误差方差正比Xi。平方根变换:E(ui2)= σ2*Xi
假定3:误差方差正比Y均值的平方。E(ui2)= σ2*[E(Yi)]2
假定4:和回归Yi=β1+β2+ui相比,诸如:lnYi=β1+β2Xi + ui
第12章
自相关出现时的OLS估计量
Ut=pUt-1+et -1<p<1 p被称为自协方差系数或一阶自相关系数 e是白噪音误差项 公式称为马尔代夫一阶自回归模型,记AR
自相关出现时OLS的后果]
在自相关出现时,OLS估计量仍是线性无偏和一致性的,但不再是有效(亦即最小方差)的了
一、考虑自相关的OLS估计:
斜率系数不是BLUE,即使使用调整的方差作为系数估计方差,仍可能比GLS的方差大,更容易接受系数等于0的假设。
二、忽视自相关的OLS估计
1、残差方差可能低估真实的扰动项方差
2、可能高估R-2
3、可能低估调整的系数方差
4、t检验,F检验无效
自相关的侦察
1、图形法:残差和标准化残差图 2、DW检验 3. Breusch-Godfrey检验(LM检验) 4. Q检验
补救方法
1尽力查明自相关是否纯碎自相关,而不是模型误设的结果
2若是纯碎自相关,可对原模型做适当改变,使变换后的模型不存在自相关问题。如果出现异方差时,我们必须使用某种广义最小二乘。
3在大样本下,我们可以用尼威-威斯特的方法,以得到OLS估计量在对自相关加以修正之后的标准误。
4在某些情形下,我们可以继续用OLS方法
DW检验
DW检验的基本假定
1、回归模型含有截距项
2、X非随机
3、扰动项一阶自相关,不能检验高阶自相关
4、误差项服从正态分布
5、回归方程不包含因变量的滞后项
6、无缺失数据
操作步骤:
1.做OLS回归并获取残差。 2.计算d (DW统计量) 3.对给定样本大小和给定解释变量个数找出临界值dL和dU
4.按以下规则决策
虚拟假设 决策 如果
无正自相关 拒绝 0<d<dL
无正自相关 无决定 dL《d《dU
无负自相关 拒绝 4-dL < d < 4
无负自相关 无决定 4-dU < d < 4-dL
无自相关,正或负 不拒绝 dU < d < 4-dU
DW统计量接近0,序列正相关;接近4序列负相关;在2附近无序列相关
如果d落入无决定域,不妨使用以下修订的d检验程序
Ho:ρ=0 H1:ρ>0 。如果估计的d<dU,则在水平alfa上拒绝Ho,就是存在着统计上显著的正相关。
Ho:ρ=0 H1:ρ<0 。如果估计的(4-d) < dU,则在水平alfa上拒绝Ho,就是存在着统计上显著的负相关。
Ho:ρ=0 H1:ρ不等于0 。如果估计的d<dU或 (4-d) < dU,则在水平2*alfa上拒绝Ho,就是存在着统计上显著的自相关。
第13章(书上内容要整体看看)
嵌套模型
AB
非嵌套模型
CD
我们说模型B嵌套在模型A之中,是因为它是模型A的一个特殊情形:如果我们估计模型A ,然后检验假设Ho:β4=β5=0,并且不拒绝它(比方说基于F检验),那么模型A就简化为模型A就简化为模型B。若我们在模型B中增加变量X4,那么模型A在β5=0时就简化为模型B。我们说C、D模型是非嵌套,因为不能把一个作为另一个的特殊情形而推导。
非嵌套假设的检验
1、判别法
基于某些拟合优度准则在非嵌套模型之间进行选择,如R-2、调整的R-2(越大越好),AIC准则、SC准则(越小越好)等
2、辨识法
在考察一个模型时,同时考虑其他模型提供的信息,如混合模型(或人工嵌套模型法),戴维森-麦金农J检验法等
混合模型法
要比较C、D两个模型哪个更好
CD
构造混合模型
F
对模型的两组参数进行F检验
D-M J检验
1、估计模型D,得Y的拟合值计为Y_D
2、将Y_D作为回归元加入到模型C中,若Y_D 在此模型中的系数不显著异于0,则表明模型D的因素无助于解释Y,从而模型C是更好的模型,反之模型C不是恰当的模型
3、重复步骤1和2,将D和C的位置调换
模型选择准则
1.R2准则 2.调整R2准则 3赤池信息准则 4.施瓦茨信息准则 5马娄斯Cp准则 6预测X2准则 (都是是平方)
1.用AR(P)模型修正自相关(AR(1)为一阶自回归)P791
要求:用AR(p)对自相关修正,并检验新模型是否存在残差序列相关
e.g估计方程方程 log(inv_p) r_p(-1) log(gnp_p) ar(1),在新的方程中做Q检验和LM检验,观察是否仍有序列相关
计量经济学方法论计量经济学方法论
大致地说,传统的计量经济学方法论按下列路线进行:
(1)理论或假说陈述(2)数学模型设定(3)计量模型设定(4)获取数据
(5)参数估计(6)假设检验(7)预测(8)利用模型进行控制或制定政策
计量经济学所用数据的类型:
(1)时间序列数据:对一个变量在不同时间取值的一组观测结果
(2)横截面数据:对一个或 多个变量在同一时间点上收集的数据
(3)混合数据:两者兼有
(4)综列、纵列或微观综列数据:混合数据的特殊类型,指对相同的横截面的单元在时间轴上进行跟踪调查的数据。
回归的现代意义:回归分析是关于研究一个所谓的因变量对另一个或多个所谓解释变量的依赖关系,其用意在于通过后者(重复抽样中)的已知或设定值,去估计和预测前者的均值。
二章
总体回归曲线就是(当)解释变量取给定值时因变量的条件均值或期望值的轨迹。
总体回归函数的概念:
反映Y的均值如何随X的变化而变化的函数被称为总体回归函数(PRF)。如
![]() |
其中β1 和β2是未知但固定的参数,被称为回归系数
PRF的随机设定:
因为Y是随机的,每个具体的Y不可能恰好等于其均值,他们之间的离差被设定为一个随机扰动项:
![]() |
E(Y|Xi)被称为Yi的系统性或确定性成分
ui 称为随机或非系统性成分
在给定X的条件下,随机扰动项的均值等于0
样本回归函数:SRF P44(各种定义)
在大部分情况下,我们很难获得总体的数据,而是通过对总体的抽样来探索总体的性质。
类比于总体回归函数(总体Y条件均值与X的关系),可以定义样本回归函数:抽样Y与X之间的关系。如:
![]() |
其中Yi(帽)是总体均值的估计量,β1(帽)和β2(帽)分别是β1和β2的估计量
随机形式的样本回归函数为:
![]() |
样本回归线有以下性质:
1穿过Y和X的样本均值点
2Y的估计值的均值等于实际Y值的均值
3残差帽ui的均值为零
4残差帽ui和Yi的预测值不相关
5残差帽ui和Xi不相关
第三章
估计量和估计量方差矩阵形式
![]() |
![]() |
最小二乘法的基本假定P51
假定1:参数线性模型。回归模型对参数而言是线性的。
假定2:X非随机(条件回归分析)。在重复抽样X值是固定的。
假定3:扰动项均值为0。对给定的X值,随机干扰项ui的均值或期望值为0
假定4:扰动项同方差。给定X值,对所有的观测,ui的方差都是相同
假定5:扰动项无自相关。给定任意两个两个X值,ui和uj直接的相关性为0
假定6:观测次数n大于待估参数个数。观测次数n必须大于解释变量的个数。
假定7:X有变异性。在一个给定的样本中,X值不可以全是相同的。
最小二乘估计的性质:
1线性的:它是一个随机变量 2无偏的:它的均值或者期望值等于真实值beta
3它在所有的这样的线性无偏估计量有最小方差,有最小方差的无偏估计量叫做有效估计量
高斯-马尔科夫定理
在给定经典线性回归模型的假定下,最小二乘估计量在无偏性估计量一类中,有最小方差。(最优线性无偏估计量)。
在正态性假定下OLS估计量的性质
它们是无偏的。2.它们有最小方差。3.一致性。4.帽beta1是正太分布的。5.帽beta2是z正态分布。6.(n-2)*帽吊塔的平方/吊塔的平方服从n-2个自由度的卡方分布。
7.帽beta1,帽beta2)的分布独立于帽吊塔的平方。
8.帽beta1,帽beta2在所有无偏估计中,无论是线性还是非线性,都有最小方差
OLS估计量的统计性质
1OLS估计量是纯碎可观测的量表达的,因此它们容易计算
2它们是点估计量,即对给定样本,每个估计量仅提供有关总体参数的一个值
3一旦从样本数据得到ols估计值,容易画出样本回归线。
判定系数:拟合优度的度量
总平方和(TSS):
回归(解释)平方和(ESS):
残差平方和(RSS):
![]() |
r2=ESS/TSS r2被称为(样本)判定系数,它是对回归线拟合优度的最为常用的度量,r2测度了在Y的总变异中由回归模型解释的那个部分所占的比例或百分比
显然ESS占TSS的比重越大,表明Y的变化主要由回归方程所决定,反之由扰动项决定。ESS与TSS的比值定义为r平方。
R平方介于0和1之间,R平方越大拟合效果越好。
TSS自由度为n-1 ESS自由的为k-1 RSS自由度为n-k (k为参数个数)
e.g:当ESS自由度为1时,RSS 自由度为n-2 TSS自由度为n-1
自由度:回归部分(ESS)1 剩余部分(RSS)N-2 TSS N-1
第五章
回归系数的置信区间 (Eviews结果中的t统计量如何?如何决策?)
1、置信区间
(1)满足
![]() |
的区间被称为置信区间
其中 1-alfa称为置信系数 alfa称为 显著性水平
(2)为了获得置信区间需要知道 beta的分布函数,或是包含beta的统计量的分布函数。在回归系数的置信区间估计中采用的是后一个概念。
(3)因为beta是确定的值,因此前面定义的区间估计的含义为:该区间包含beta的概率为 1-alfa
(4)上述定义的区间是一个随机的区间,因为beta是随机变量。从而beta(帽)是平均意义上的概率1-alfa
2、回归系数的置信区间
在扰动项服从正态分布的假定下,OLS的回归系数beta(帽)也服从均值为 beta标准差为se(beta)的正态分布,从而标准化的统计量服从自由度为n-k的t分布,其中n为样本个数,k为估计参数的个数。即 :
给定显著性水平alfa,t的置信区间为:
![]() |
![]() |
因为beta(帽)已经从OLS估计中获得,从而有
![]() |
![]() |
决策规则:落入区间内接受、落入区间外拒绝P108
假设检验:置信区间方法(t检验)P109
原理:在给定的置信度下,计算参数的置信区间,如果原假设的参数值落在该区间之内,则接受原假设,反之拒绝原假设。
第六章
回归模型的函数形式(对参数线性)
测度弹性:对数线性模型
模型
![]() |
斜率系数的意义:Y对X的弹性
![]() |
模型设定的约束条件:Y对X的弹性为常数,Y和X的对数散点图近似线性
测度增长率:线性到对数
模型:
![]() |
Beta系数的意义:Y的瞬时增长率
![]() |
![]() |
对数到线性模型
模型:
![]() |
Beta系数的意义:X变化1%时,Y的绝对变化量
模型的意义:Y和X受共同因素的影响(如随时间t增长),其中Y为线性增长(Y=at),X为指数增长(X=exp(t)),则Y与X的关系满足对数到线性模型。恩格尔支出模型
倒数模型
模型:
![]() |
模型的适用条件:Y受X变化的影响,但随着X的增大,X的变化对Y的影响逐渐削弱,Y存在理论上的渐进线
典型应用:儿童死亡率与人均GDP的关系;通胀与失业率的关系(菲利普斯曲线)
第八章(关注多元回归的t检验、F检验、邹检验)
单个回归系数的检验:显著性检验
方法:T检验
原假设 H0:beta=0 备择假设 H1 :beta<>0
统计量 t=
![]() |
若1-@ctdist(|t|)接近0,拒绝原假设(P值)
整体回归显著性检验
问题:斜率系数是否都(同时)不等于0
H0:beta1=beta2=0
H1:至少有一个不等于0
方法:F检验
![]() |
如果@cfdist(F)接近0或1,拒绝原假设(P值)
R-2与F统计量之间的关系
F=
![]() |
F与R-2两者之间同向变化。当R2=0,F随之等于0。R2越大,F值也越大。终其极限,当R=1时,F变为无限大。
F检验的扩展: 何时增加一个(组)变量
当增加变量时,系数显著不等于0,且R2增大,则可增加。
检验两个回归系数是否相等
![]() |
![]() |
检验方法:t检验
在扰动项正态分布的假定下,若原假设成立,则以下定义的t统计量服从t(n-k)分布
![]() |
![]() |
检验线性等式约束条件
问题:回归系数是否满足某个线性等式。如c(2)+c(3)=1,在CD生产函数中意味着规模报酬不变。
检验方法(一)t检验
(1)估计模型
(2)构造t统计量,并计算原假设成立时该统计量的值
(3)计算p值(n-k各自由度)
(4)判断
![]() |
检验方法(二)F检验(受约束的OLS)
(1)估计无约束方程,得RSS_ur
(2)估计约束方程,得RSS_u
(3)构造F统计量,原假设成立(约束条件成立),F服从自由度为(m,n-k)的F分布,其中m为约束条件的个数,k为无约束方程的参数个数
(4)计算p值,判断
![]() |
一般的F检验
问题:检验回归方程中若干个(多于一个,但非全部)系数同时等于0
方法:将检验问题看成约束条件下的回归
(1)估计无约束方程
(2)估计约束方程
(3)计算F统计量
(4)计算P值
结构或参数的稳定性:Chow检验
问题:回归方程是否随时间发生变化(系数改变)。如边际消费倾向是否在两个相邻的时期发生变化
方法:邹检验
假设
1、相邻两个子区间的扰动项服从相同的正态分布 2、两个子区间的扰动项独立
检验原假设:无结构变化
检验机制
1、估计整个区间的回归方程(约束回归:无结构变化的原假设成立),得RSS_r,自由度为(n1+n2-k)
2、估计第一子区间回归方程,得RSS_ur1,自由度为(n1-k)
3、估计第二子区间回归方程,得RSS_ur2,自由度为(n2-k)
4、无约束RSS-ur= RSS_ur1+ RSS_ur2,自由度为(n1+n2-2k)
5、构造F统计量,计算p值
![]() |
第九章 虚拟变量
![]() |
写出当u >=0 或u<0 时的方程形式 (记得合并同类项)
第10章
多重共线性的性质
多重共线性:回归元之间存在完全或准确的线性关系。即某个回归元可以由其他回归元线性表示(或增加一个小的扰动,此时为非完全共线性)。
完全共线性导致回归系数是不确定的,且标准误为无穷大。
非完全共线性虽然回归系数可确定,但标准误非常大。
多重共线性产生的原因
1、数据采集所用方法:如在回归元的有限范围内取值
2、模型或从中取样的总体受到约束:回归元在本质上联系密切
3、模型设定:在回归中添加多项式,但X的变化范围较小
4、过度决定模型:观测值个数少于参数个数
5、回归元有相同的趋势
多重共线性的实际后果
1、OLS估计量虽然是BLUE,但有大的方差和协方差,故难以做出精确的估计
2、置信区间更宽,更容易接受系数等于0的原假设
3、一个或多个系数的t统计量很小(绝对值)倾向于统计不显著
4、拟合优度R-2可能很高
5、OLS估计量及其标准误对数据的微小变化很敏感
多重共线性的侦察
多重共线性本质上是一种样本现象(非总体现象),且只有强度大小之分,而无存在与否之分。没有侦查多重共线性强弱的唯一方法
经验侦查方法:
1、R-2高,少且显著的t比率
2、回归元之间有高度的两两相关
3.检验相关系数
4、辅助回归:经验法则——仅当来自一个辅助回归的R-2大于Y对所有回归元的R-2时,多重共线性才是严重的
5、本征值和病态指数
6、容许度(1-Ri-2):越小表明多重共线性程度越严重
7.散点图
第11章
异方差性的性质:没有同方差,Yi的方差随i的变化而变化
异方差检验的方法有哪些?
1.帕克检验 2.格莱泽检验 3.斯皮尔曼的等级相关检验 4.戈德菲尔德―匡特检验 5.布劳殊―培干―戈弗雷 6.怀特异方差检验 7.游程检验. 8其他异方差检验 :寇因特—巴塞特检验
在出现异方差时的OLS估计:帽B2仍是线性无偏的,帽B2是一个一致估计量,即随着样本无限扩大,收敛于真实值,且在一定条件下,还是渐近正态分布的。
*异方差检验的补救措施
当σ2为以知:加权最小二乘法
当σ2为未知:
如果样本够大,则可获取OLS估计量的怀特异方差校正标准误并以之作为统计推断的依据。
可根据OLS残差,合理地猜测方差性的可能模型,以便将原始数据变换成没有异方差性的变换数据。
关于异方差性模式的可能假定:
假定1:误差方差正比Xi2:E(ui2)= σ2 *Xi2
假定2:误差方差正比Xi。平方根变换:E(ui2)= σ2*Xi
假定3:误差方差正比Y均值的平方。E(ui2)= σ2*[E(Yi)]2
假定4:和回归Yi=β1+β2+ui相比,诸如:lnYi=β1+β2Xi + ui
第12章
自相关出现时的OLS估计量
Ut=pUt-1+et -1<p<1 p被称为自协方差系数或一阶自相关系数 e是白噪音误差项 公式称为马尔代夫一阶自回归模型,记AR
自相关出现时OLS的后果]
在自相关出现时,OLS估计量仍是线性无偏和一致性的,但不再是有效(亦即最小方差)的了
一、考虑自相关的OLS估计:
斜率系数不是BLUE,即使使用调整的方差作为系数估计方差,仍可能比GLS的方差大,更容易接受系数等于0的假设。
二、忽视自相关的OLS估计
1、残差方差可能低估真实的扰动项方差
2、可能高估R-2
3、可能低估调整的系数方差
4、t检验,F检验无效
自相关的侦察
1、图形法:残差和标准化残差图 2、DW检验 3. Breusch-Godfrey检验(LM检验) 4. Q检验
补救方法
1尽力查明自相关是否纯碎自相关,而不是模型误设的结果
2若是纯碎自相关,可对原模型做适当改变,使变换后的模型不存在自相关问题。如果出现异方差时,我们必须使用某种广义最小二乘。
3在大样本下,我们可以用尼威-威斯特的方法,以得到OLS估计量在对自相关加以修正之后的标准误。
4在某些情形下,我们可以继续用OLS方法
DW检验
DW检验的基本假定
1、回归模型含有截距项
2、X非随机
3、扰动项一阶自相关,不能检验高阶自相关
4、误差项服从正态分布
5、回归方程不包含因变量的滞后项
6、无缺失数据
操作步骤:
1.做OLS回归并获取残差。 2.计算d (DW统计量) 3.对给定样本大小和给定解释变量个数找出临界值dL和dU
4.按以下规则决策
虚拟假设 决策 如果
无正自相关 拒绝 0<d<dL
无正自相关 无决定 dL《d《dU
无负自相关 拒绝 4-dL < d < 4
无负自相关 无决定 4-dU < d < 4-dL
无自相关,正或负 不拒绝 dU < d < 4-dU
DW统计量接近0,序列正相关;接近4序列负相关;在2附近无序列相关
如果d落入无决定域,不妨使用以下修订的d检验程序
Ho:ρ=0 H1:ρ>0 。如果估计的d<dU,则在水平alfa上拒绝Ho,就是存在着统计上显著的正相关。
Ho:ρ=0 H1:ρ<0 。如果估计的(4-d) < dU,则在水平alfa上拒绝Ho,就是存在着统计上显著的负相关。
Ho:ρ=0 H1:ρ不等于0 。如果估计的d<dU或 (4-d) < dU,则在水平2*alfa上拒绝Ho,就是存在着统计上显著的自相关。
第13章(书上内容要整体看看)
嵌套模型
AB
![]() |
![]() |
非嵌套模型
CD
![]() |
![]() |
我们说模型B嵌套在模型A之中,是因为它是模型A的一个特殊情形:如果我们估计模型A ,然后检验假设Ho:β4=β5=0,并且不拒绝它(比方说基于F检验),那么模型A就简化为模型A就简化为模型B。若我们在模型B中增加变量X4,那么模型A在β5=0时就简化为模型B。我们说C、D模型是非嵌套,因为不能把一个作为另一个的特殊情形而推导。
非嵌套假设的检验
1、判别法
基于某些拟合优度准则在非嵌套模型之间进行选择,如R-2、调整的R-2(越大越好),AIC准则、SC准则(越小越好)等
2、辨识法
在考察一个模型时,同时考虑其他模型提供的信息,如混合模型(或人工嵌套模型法),戴维森-麦金农J检验法等
混合模型法
要比较C、D两个模型哪个更好
CD
![]() |
构造混合模型
F
![]() |
对模型的两组参数进行F检验
D-M J检验
1、估计模型D,得Y的拟合值计为Y_D
2、将Y_D作为回归元加入到模型C中,若Y_D 在此模型中的系数不显著异于0,则表明模型D的因素无助于解释Y,从而模型C是更好的模型,反之模型C不是恰当的模型
3、重复步骤1和2,将D和C的位置调换
模型选择准则
1.R2准则 2.调整R2准则 3赤池信息准则 4.施瓦茨信息准则 5马娄斯Cp准则 6预测X2准则 (都是是平方)
1.用AR(P)模型修正自相关(AR(1)为一阶自回归)P791
要求:用AR(p)对自相关修正,并检验新模型是否存在残差序列相关
e.g估计方程方程 log(inv_p) r_p(-1) log(gnp_p) ar(1),在新的方程中做Q检验和LM检验,观察是否仍有序列相关