知识与常识:分析大学生挂科因素?

谢益辉 2010-04-15

流浪荡云儿提到

我最近想做下关于大学生挂科率影响因素。但是我感觉在出调查问卷的时候,很多人不会将自己的挂科情况如实反应,这该怎么办?还有变量之间或多或少都有一定的相关性,这该怎么办啊?

又及:

只是老师布置的期末作业——选择合适的题目,收集相应的数据,建立统计模型,进行统计分析,直到你认为满意为止(咱们老师的原话)。是不是我的题目选的不好啊?

再及:

如果直接访谈的话,我感觉暨很费时间,而且结果也不一定准确(其中也会受很多因素的影响),如果用回归的话,做问卷我可以改成匿名形式,只是变量的选取和设定变的有难度(对于我来说)

原本这是一个如何保护受访者隐私的问题。这种问题有一些经典的解决办法,比如让受访者自己抛硬币,如果正面就回答“是否挂过科”,反面就回答“宿舍电话最后一位数字是否是奇数”,访员不干涉受访者填问卷的过程,最终我们也不知道受访者的硬币是正面还是反面(从而不知道他们究竟回答的是哪个问题),只知道他们回答了多少“是”和“否”。只要样本量充分大,我们就知道挂科的比例了。

至于变量间的相关性,这不是问题,因为世上完全独立的变量似乎还没生出来。即使再独立,不还存在所谓的“蝴蝶效应”么?退一步讲,回归也没有要求自变量相互独立,相关性太强也有解决办法。

我看到问题的第一个反应并非如何建模,而是在想这个问题真的需要模型来解决么?首先,挂科属于稀有事件,采集样本会比较困难(除非遭遇超级严厉的老师……灭绝师太?……);其次,在调查之前我们可不可以先考虑一下这个问题本身,在脑子里回放几遍:“为什么会挂科?什么会挂科?么会挂科?会挂科?挂科?科?……”看看能想到的主要答案是否只有一种:受试者没认真学习。要是果真如此,那么本来稀有的样本就更没太多分析价值了,辛辛苦苦调查了50个挂科学生(就算他们愿意承认挂科),发现49个都在玩,剩下1个在看别人玩,到那时,是否想找块豆腐撞死算了呢?

所以我推荐直接访谈。此时建模可能只具有脱离实际问题的数学意义,当然我们可以像模像样走完统计分析的整个流程,最终得出结论说“同志们呐,表再玩了”,如果是这样,没牙的老太太恐怕都能想出这种结论。而访谈呢,一方面能让我们接触到“血淋淋的真相”(语出自电视剧《武林外传》),免得我们肤浅猜测,另一方面,和活人接触,万一发现挂科的因素多种多样,超出想象,那时再设计一份更贴近实际的问卷也不迟。为啥小温要亲民?为啥有皇帝觉得百姓饥荒时可以喝肉粥?

统计模型就像把锤子,拿到锤子的人觉得到处都是钉子(金锤子定理)。我理解这种“诱惑”,但事实是生活不全是由抡锤子构成的。这个挂科问题本身是个很好的问题,看起来也很有意思,做好了对大学教育有很大贡献,但它是否能通过回归的方式解决则值得三思。访谈花时间,但也许窥一斑而知全豹。

这个老笑话想必多数人都看过了:

联合利华引进了一条香皂包装生产线,结果发现这条生产线有个缺陷:常常会有盒子里没装入香皂。总不能把空盒子卖给顾客啊,他们只得请了一个学自动化的博士后设计一个方案来分拣空的香皂盒。博士后拉起了一个十几人的科研攻关小组,综合采用了机械、微电子、自动化、X射线探测等技术,花了几十万,成功解决了问题。每当生产线上有空香皂盒通过,两旁的探测器会检测到,并且驱动一只机械手把空皂盒推走。

中国南方有个乡镇企业也买了同样的生产线,老板发现这个问题后大为发火,找了个小工来说:“你他妈给老子把这个搞定,不然你给老子爬走。”

小工很快想出了办法:他花了90块钱在生产线旁边放了一台大功率电风扇猛吹,于是空皂盒都被吹走了。

“知识”越来越多,会不会真的让我们变得“有知识没常识”?

那么我们打听一下在座的各位客官,你挂过科么,若挂过,原因是什么?(“考前没拜春哥/曾哥”这个原因除外)