关于结构方程模型(SEM),本人决定不再接受咨询,请各位勿发邮件询问相关事宜,特此告知。我于05年底在杜老的多元统计分析课上接触到SEM,因为课上对原理讲得并不清楚(确切地说颇有误导性),加上后来查阅了国内这方面的论文,发现几乎没有一篇论文提到SEM的原理,但与此同时,却有诸多作者撰文大肆吹捧SEM,甚至将其供奉为“各种统计模型之母”(李伟明,1998),SEM在各行各业应用的论文也是铺天盖地:心理学、管理学、商学、经济学等等。带着诸多疑惑,我将SEM作为了本科毕业论文的选题,那段时间里才算弄清楚了协方差建模技术以及SEM目标函数的来龙去脉,同时也逐渐丧失了对SEM的兴趣,因为我个人难以认同这种统计建模技术(参见此文),也对其应用价值高度怀疑。
这两年来我收到过很多询问SEM问题的邮件,现在实在是已经回答累了,主要原因是很多提问者根本没有弄清楚SEM的基本原理。不管是主观原因不想弄清楚,还是客观原因无法弄清楚,我都觉得这种事情颇为荒唐。并非我要求统计应用者对统计技术掌握得多么精通,但如果最基础的知识都不具备,如何敢跑模型,如何敢作解释?
那么话说回来,什么是基础呢?
- 结构模型和测量模型分别长什么模样;
- 知道一点矩阵知识,可以把自己画的超复杂的圈圈框框线条用矩阵表达出来(我戏称这种图形为“意大利面条图”),矩阵中包含各种已知参数(一个协方差矩阵)和未知参数(八大矩阵),能分辨哪些已知哪些未知,相应地,知道自由度该怎样数;
- 知道各种目标函数对应的模型假设是什么,以及假设是否可以被验证;
- 知道拟合指标的大致公式是什么模样以及指标有什么直观意义;
- 非常清楚统计假设检验的原理(通常情况下只可能有把握拒绝零假设,而接受零假设犯错误的概率常常是不知道的,即:P值大的时候也许存在若干个“真相”都不能被拒绝)。
我经常被问到的问题有:请帮忙看看模型可不可以这样画、模型为什么解不出来或不可识别、模型拟合指标有些很好有些很差该怎么办、模型拟合很好是不是就可以下结论说事实就是我设想的这样、模型的系数该怎样解释等等。如果各位还有类似的问题,请务必反思以上五点基础。我相信90%的人不会再提问,而对于剩下10%的人,你们的问题超出了我的知识范围,恕我没有能力回答,抱歉。