关于mediation effect的注记
最近跑mediation比较多,随手记几句。
几年前在博士课程里学到的mediation的检验方法已经不那么流行了 (David Kenny)。现在证实bootstrap estimation更靠谱,也更贴合复杂的现实世界。所以,有些观念必须破除,比如total effect应显著是检验indirect effect的前提。
total effect不显著但indirect effect成立的情况也分两种。最著名的应该是inconsistent mediation了,即indirect 和 direct effect的大小相当、方向相反,彼此抵消。另一种情况是,用置信区间检验后发现,indirect effect确实显著,但放到total effect里,与不显著的direct effect综合评估后,total effect被明显冲淡,因此不显著。
total effect不显著,有意义么?答,有,可以了解机制。
但这种机制是真实存在的么?答,可能吧,多弄点数据反复validation,才能最终确立。
所以说,machine learning里的training data, validating data, testing data其实就是把好多年,好多学者,写了好多论文才能完成的一个hypothesis的最终确立缩短在一个ML 项目里完成。好处是:时间短,效率高。坏处是:每一次validating 都是黑箱,给出的只是最终结果。
几年前在博士课程里学到的mediation的检验方法已经不那么流行了 (David Kenny)。现在证实bootstrap estimation更靠谱,也更贴合复杂的现实世界。所以,有些观念必须破除,比如total effect应显著是检验indirect effect的前提。
total effect不显著但indirect effect成立的情况也分两种。最著名的应该是inconsistent mediation了,即indirect 和 direct effect的大小相当、方向相反,彼此抵消。另一种情况是,用置信区间检验后发现,indirect effect确实显著,但放到total effect里,与不显著的direct effect综合评估后,total effect被明显冲淡,因此不显著。
total effect不显著,有意义么?答,有,可以了解机制。
但这种机制是真实存在的么?答,可能吧,多弄点数据反复validation,才能最终确立。
所以说,machine learning里的training data, validating data, testing data其实就是把好多年,好多学者,写了好多论文才能完成的一个hypothesis的最终确立缩短在一个ML 项目里完成。好处是:时间短,效率高。坏处是:每一次validating 都是黑箱,给出的只是最终结果。
还没人转发这篇日记