一位余小伙儿,一位张小伙儿,俩人琢磨了几天时间,终于把我们的国际竞争力数据给修理了一遍,往后查询数据啥的都方便了。今天看了他们做的界面,很好很强大!
数据源的问题是我们做研究的大问题,国际竞争力数据时间跨度15年,里面的数据可能不是年鉴当年的,包含了六十多个国家地区以及成百个变量,麻烦的是这些乱七八糟的信息都放在不同的Excel文件中,对于做模型来说简直是一大灾难——每个人做分析都需要眼巴巴从每张Excel数据表里小心翼翼复制粘贴出自己需要的数据,这个工作不仅繁琐,而且一不小心容易出错(拜Excel所赐)。因此我认为,数据就应该放在标准的数据库中,需要的时候往外调用,而分析者不能干扰数据源。再往下我们甚至可以把分析的过程写进Sweave,这样我们连中间过程都省去了,直接从数据到报告,不用复制输出结果,也不用保存图形。不过在这之前仍然要有对数据的探索工作。
去年我曾经写过整理数据的一点代码,不过自我感觉不甚满意,这次终于有两位小伙儿把数据放进数据库了,再也不用担心Excel的各种毛病了,以后的分析将会真正走向流程化、规范化,以前大家千篇一律、群起而编书的时代将要过去,往后我们要开始脚踏实地把统计的技术活儿纳入竞争力研究的体系中来,再也不用拿着Excel天天烙大饼或折线图了。咱就等着一本高水平分析报告的出版吧!
感谢两位小伙儿为应用统计科学研究中心所做的具有划时代意义的工作!