Fighting到死都不够!

谢益辉 2005-12-05

算是体会到了,什么叫“学,而后知不足”,如同被卷入了一片汪洋大海,此处感叹几句,也算是“望洋兴叹”。

真不是我太懒,我发现把人的精力同时分散到很多方向上,人便会有种虚脱的感觉;我一天之中所接触到的知识,真的是用一辈子都研究不透的。比如今天,从我12点起床吃饭开始,我已经在头脑中开始发动岭回归模型了,想OLS的估计$(X'X)^{-1}X'Y$与岭回归的估计$(X'X+kI)^{-1}X'Y$孰优孰劣,比较各自的优势,然后想来想去,发现这世道真是简单,大部分问题归到最后总是一个对一种不可调和的普遍矛盾的权衡问题,这“缤纷绚丽”的世界,便是由这些矛盾而推动的;像岭回归与普通最小二乘法的比较,说到底就是估计的无偏精度之间的较量——在多重共线性的情况下,保证无偏性,便保证不了精度;保证精度,便要放弃无偏性。人不可贪心——这是在东区食堂门口想到的。

多重共线性的解决、回归模型的改进,一辈子研究得透么?

中午在办公室打游击——不停在Amos和LISREL之间来回看,尝试着用,可是研究了一中午,仍旧一无所获。一方面,结构方程模型(SEM)中存在太多理论困惑;另一方面,完全陌生的软件,尤其是专业软件,如果没有人教,真的是很难入门。

结构方程模型的理论和应用、Amos和LISREL的使用,一辈子研究得透么?

这次多元统计分析布置的变态作业,里面数据度量尺度问题可以说是几大难题之一,好多变量都是离散型变量(定类、定序),这种数据的处理,阿杜上课用了些莫名其妙的方法,可以说是比较浅层和感性的,没有什么理论支撑,而往往人们偏向于简单并且看似有道理的数据处理,所以大家写作业时便一窝蜂地去综合变量,非要把离散型变量整合成连续性变量,方法一个比一个奇特,甚至到了怪异的地步。今日上课,令我匪夷所思的是吴翌琳同学都动用了ANOVA的方法来求得一个系数去综合这些离散变量从而得到一个所谓的数值型变量(连续型),我当时就想到方差分析的坟头上去烧纸,ANOVA您安息吧,别生气……此事不提也罢,不提也罢。只是突然间想起了曾经教过我们计量经济学的李静萍老师,如今愈发感到佩服。使用一种理论,务必要熟悉该理论是用来解决什么样的问题的,哪怕不知道理论的详细内容。至少,计量经济学的期末考试,给了我这样一种警示。

分类变量的分析方法,一辈子研究得透么?

下午上多元统计分析课,对于课程本身我就不评论了,说正事。课上提到了同样也是困扰人们很长时间的一个问题——Missing Value的处理方法。真不是我胡说八道,我们每个人都应该多看看书了。这种空想主义的课,还是少一些比较好。阿杜总强调“有道理就行”,可事情岂能是“有道理”就可以的?我不知道他有没有听说过“Bootstrap”方法,我看我提出来之后他也没反应,多半是不知道,不过从他嘴里我听到了“多重插补”,还是给点面子好了。悻悻。这样的课上下去,势必会禁锢我们的思维。上次台湾大学的黄光国教授在逸夫讲“科学哲学与中国人的创造力”,到最后提到怎样创新,其中一点就是首先要“站在巨人肩膀上”(于是当时我就站在他肩膀上把他K了一顿),可是我们现在这样,根本就是置“巨人”于不顾,好好的科学方法不用,偏要在那儿争得面红耳赤。

缺失值的处理方法,一辈子研究得透么?

听课听得寡然无味,便怂恿马绍晶看数学建模的获奖作品,让他尝尝痛苦:)我无聊得恨不得数手指头……杜大人又扯起毛杀人千万的事情,总算说了一句我认同的话:研究问题不要太多,集中精力讲清楚一个就行了。于是想起前天赵老师站在他的房间门口,跟我讲了好半天他学生生涯的体会(虽说讲了好半天可每次我都发现记不住什么),讲当年别的同学都去讲课赚钱时,他一个人巍然不动,苦心钻研学术,一步一步走到现在;大意也就是告诉我要有一个明确的方向,坚持做下去,不要东边有意思东边瞧瞧,西边好玩儿西边瞅瞅,什么都想做。

可即使就一个方向,一辈子研究得透么?

熬到下课,逃离了那Desriptive Statistics,回到办公室,遇到西部大开发杂志社的一个人(霍治利),要找赵老师,可赵老师当时不在,我便跟他聊了一会儿。他现在研究与农产品产出、销售有关的时间序列预测,向我打听SPSS中Time Series的有关情况,尤其是TS的实际应用案例。薛老师那本书我没看完,TS更是不熟悉,于是就着我的一点薄弱底子跟他聊,发现此人功底一点不浅,关系数据库、空间数据库等等似乎如数家珍的样子,想必也是一位专家了。我边聊边想,就凭我这点TS知识,根本都羞于跨出人民大学的门,呜乎哀哉……大三学的那点理论,除了让我们知道这世界的某个角落还存在AR和MA以外,几乎什么都不剩了。前一段日子,BBS上一位同学提到ARCH模型,我更是一无所知,后来在图书馆的一堆书中终于发现一本讲ARCH和GARCH模型的。无疑又是一个警示,时间序列的理论研究,已经颇有些跟不上实际应用需要了。

时间序列的问题,一辈子研究得透么?

晚上,吃完饭,在中科大数学FTP(ftp://202.38.70.51/)上找到一大堆数学建模的书,看得我眼花缭乱。顺便也看了看有关统计的电子书,再次感慨,陈希孺老先生不简单,中国统计的前辈如茆诗松等都不简单。在这些书里面,也再一次看到了Resample的身影,于是下决心要把Bootstrap研究明白。回头来说数学建模,说是一座大山毫不夸张,前两天我还过于乐观,如今发现它与统计思维相差太远,几乎完全不是一个套路。还有一大障碍,便是软件,MatLab,Mathematica,颇感头大。大年初四我就得回到学校,初五到初七是建模大赛的时间。惨。

数学建模、统计新前沿知识,一辈子研究得透么?

眼下,扳着指头数一数,中清研那边的实习、学年论文、各位老师的任务、澳大利亚那边的三项任务(Elias的模型、Ping Yu的路径分析、A梦筹划的汽车估价系统)、法国老头儿的R手册翻译、博乐网的人大活动筹划、博客网的战略研究部,还有山东曲阜师范大学、南京财经大学、浙江工商大学、浙江大学、东北财经大学、西南财经大学,天津财经学院,还有双安那边不知叫什么的公司,还有环保局的,R,SAS,机场,天南地北天昏地暗天旋地转……

所以,岂是Fighting to Death就足够的?

还好,我有时是一只特立独行的猪。“修短随化,终期于尽。古人云:‘死生亦大矣。’岂不痛哉!”我懒得去痛哉悲哉,赶紧认真努力生活,足矣。