今晚索性把这本书从头到尾读一遍,顺便记录一些零碎片断:
- Karl Pearson本来叫Carl,后来因为崇拜卡尔·马克思把自己的名字改成了Karl。
- 科学家在土壤肥力对农作物的影响上争吵了20年,被Fisher一篇论文用简单的数学公式结束了这场战争。后来Fisher还指出其实气象影响要远大于肥力影响。
- 在Fisher的实验设计提出之前,科学家浪费了好几十年时间在无谓的实验和争论上。
- Karl Pearson最早提出了统计的参数(分布)体系,由四个Moment(一到四阶矩)构成。
- Biometrika是世界上第一本印有全彩照片的期刊,Galton他们那时候太有钱了。
- Karl Peason关于分布函数和参数的思想统治了20 世纪的科学,并在21 世纪初仍保持着优势。
- 大名鼎鼎的t分布是Gosset拿笔算然后画图发现的。
- Karl Peason故意贬低Fisher的成果(嫉妒?),闹得二人彼此很不爽,Fisher在Biometrika上发表了两篇文章时就闪人了,把自己的文章都发到别的刊物上。
- Fisher从小视力严重受损,不能在人工光线下看东西,因此只好凭几何思维在脑子里想象,从而发展出强大的几何直觉能力,这种能力帮他解决了大量的数理统计难题,这些难题难度之高,别人花几个月或几年时间才能证明,而他一想就想出来了。他教学生很没有耐心,因为他总是觉得问题很简单,但学生无法理解。
- 当年Fisher的巨著都是拿一台原始的带有手摇曲柄的机械计算器摇着算出来的,据说光是一张表格就要花近200个小时去摇曲柄。(看样子那个年代写统计论文简直就是体力劳动)
- Fisher帮Tippett找到了极值分布的答案;1958年Gumbel出版了关于极值的权威教材"Statistics of Extremes"(少有的经典教材)
- Fisher提出了一致、有效和无偏性三大准则。
- Hoeffding提出了U统计量,为中心极限定理的证明提供了间接而重要的支持。
- 运筹学诞生于二战期间(军事需要)。
- Pearson提出了Chi-square拟合优度检验。
- Neyman和小Pearson合作(确切地说是前者给后者在数学上帮忙)诞生了假设检验中著名的NP引理,在此之前,首先是小Pearson对他爹的Chi-square检验提出了质疑(只有一个假设,没有备择)。
- 大Pearson打压Fisher,Fisher一辈子攻击Neyman,但Neyman态度非常好。
- 置信区间的概念自打Neyman提出之时就让人找不着北(概率的北),直至今天人们仍然对这个概念有着极深的误解。
- 贝叶斯定理的提出让统计学家们很恐慌,因为难以想象用后验概率推先验概率是一件多么可怕的事情。
- 凯恩斯的博士论文是关于概率的研究。
- 贝叶斯思想有两种:一种是贝叶斯层次模型(那个定理),另一种是个人概率(信仰),后者为凯恩斯所力挺。
- 柯尔莫哥洛夫的“概率论的公理化”(axiomization of probability theory),至今仍是学校中讲授概率论时采用的唯一方法。这种方法永久性地解决了有关概率计算有效性的所有问题。(若没有Kolmogorov,我们搞统计的可能至今还处于被排斥的地位)
- 弗洛伦斯·南丁格尔发明了饼图。
- Wilcoxon是化学家,由于实验中离群点的苦恼,产生了非参数的检验。
- Pitman解决了非参数统计的两大疑问:若本来有参数分布但仍然用非参方法会有多不好?数据应该多差才能体现非参的优势?(1948年Annals of Statistics,成名作)
- Mahalanobis家里非常有钱;他建立了印度统计研究所;Rao是他的学生之一。
- Wassily Leontief计算24*24的矩阵的逆矩阵时,曾经向哈佛大学购买过一个“逆矩阵”,主要原因是手工计算得花上几百年时间,而哈佛大学刚好发明了第一台原始的计算机,但是Leontief所在的政府部门却无法为此项服务付费,因为当时只有货物可以购买,服务不可以购买,这个会计问题后来就被作为固定资产处理了,购买发票上写着购买的固定资产是“逆矩阵”。
- George W. Snedecor在Iowa State College创建了美国第一个统计系。
- Gertrude Cox是Iowa State College统计学系的第一个统计学硕士。
- Grace Wahba的样条拟合对后世的样条理论产生了重大影响,她也提出了Log-linear模型。
- ETS的评分系统与Wilks有关。
- 计算机领域的两个基本术语bit和software竟然是John Tukey造出来的!(rootgram和boxplot就不说了)
- George Box是Fisher的女婿。
- W. Edwards Deming重塑了日本的产业界。
- Stella Cunliffe说:“我们经常嘲笑社会学家的分析方法过于粗略,然而作为统计学家,除非我们能为他们提供一些更加科学、更易接受的思想,否则又有什么资格嘲笑他们呢?要实现这一点,我们之间应该是互动的。”(很中肯的话)
- Levi在探索中心极限定理中正态分布成立条件时创建了鞅的概念:1. 变异是有界的,因此个别值不可能是无穷大的,也不可能是无穷小的。2.下一个数字的最佳估计值必是它的前一个数值。Martingale一词本身起源于法国一个小镇,镇上的人非常小气,据说他们下周要花的一点小钱,估计起来最有可能等于他们今天花的钱。
- Fisher在《统计方法和科学推论》(Statistical Methods and Scientific Inference)一书中建议,对于P值多大才有意义,最后结果应视情况而定。Fisher从没有很明确地说明他怎么使用P值,他只是提供一些例子。
- 1987年T. Yamakawa将核回归(Kernel-based regression)应用到调焦照相机(“模糊系统”)
八卦笔记到此结束。