在一篇题为《统计数字的快与慢》的文章中,作者提到一个有趣的现象:所有人都说伦敦的公交车很挤,但统计数字的事实是每辆公交车平均载客十七人,这并不能算挤。那为什么大家都说挤呢?因为根据定义,很挤的公交车上载着多数人。那些不拥挤的公交车上只有少数人(甚至是空车只有司机一人),而大众对公交车是否拥挤的印象会来自于多数人的反馈,不觉得挤的人不会反馈,或其声音被多数人掩盖。
我没去过伦敦,所以没有第一手资料。对这个盲人摸象的问题,我觉得统计上的平均乘客数量意义不是很大,不能用来说明公交车总体而言挤不挤。平均值已经被世人广为诟病,在谈论统计数字时,最好是给出统计分布,而不是单值汇总,而且最好是给出条件分布。我们为什么要提出这个公交车挤不挤的问题?可能是想要解决拥挤问题,那么首先就得知道在什么条件下拥挤,有针对性地去解决。比如可能是有些热门线路太挤,冷门线路却经常跑空车。那么在这些线路上配置的公交车数量是否合理?无条件增加全市公交车数量来解决拥挤问题应该不会是一个现实的方案。
其实吧,我觉得这种问题仍然是由于缺乏数据而造成的低效率。我狗胆臆想一下,如果乘客能事先(比如提前一天或甚至一小时)告诉公交车管理系统其大致出行安排,那么公交车管理系统完全可以按需灵活调度公交车,而不必按照死线路和死数量跑车。