内生变量VS外生变量
在大多数回归模型中,有一个响应变量和一个或多个预测变量。从模型的角度来看,这些预测因子是否用于预测、调节、解释或控制并不重要。重要的是它们都是X,在等式的右侧。
然而,结构方程建模是一个方程组。当然它足够灵活:可以是一个只有一个方程的简单系统,也可以包含有很多个方程。
而当你有多个方程时,同一个变量可以是一个方程中的响应变量,也可以是另一个方程中的预测变量。因此,简单的响应/预测变量这种分法会稍微有些不足,因为可能两三个变量只是预测变量,或只是响应变量。
但仍然存在一个重要且相关的二分法:内生变量和外生变量。让我们来看看它是什么吧~
1
外生和内生之间的区别
壹
/ 内生
内生变量是模型中某个方程中的响应变量,并且它可以在任何位置。换句话说,如果在模型的某个地方,有一个指向它的单向箭头,则该变量是内生的。比如说,最终的响应变量(如果有的话)始终是内源性的,中介也是如此。
在下图中,所有 x 变量都是内生性的。

而在下图中,我们有六个内生变量:M₁,a₁,a₂,a₃,Y和M₂

贰
/ 外生变量
而外生变量从来都不是响应变量。同时,由于它们可以与其他变量相关联,因此,它可以被双向箭头的一端指向,但绝不会被单向箭头所指向。
2
为什么这种区分很重要
当你定义一个变量成为外生变量时,你就假设了没有其他变量会影响或导致该变量发生改变。这个假设在进行因果推论的过程中特别重要。
对于某些变量来说,例如随机分配或某些人口统计变量(如年龄),这很容易假设;但对于观察变量来说,这需要我们去慎重地考虑。
外生变量和内生变量之间的最大结构差异是:
/ 内生变量
具有误差项。换句话说,我们声明两种不同的东西会影响它们的值:
- 其他变量,由指向它们的箭头表示。
- 随机无法解释的方差,由误差项表示。
/ 外生变量
没有误差项。这意味着你也假设它们是在没有误差的情况下测量的。同样,对于某些变量来说,这是一个非常简单就能达成的假设,比如某人是否接受了治疗或安慰剂。但在某些情况下这是一个更难做出的假设,比如收入。
因此,对于模型及其建造者来说,了解变量是外生的还是内生的非常重要。如果它是内生的,则变量的误差方差将有一个参数估计值。如果它是外生的,就不会有。