友情提示:如果本网页打开太慢或显示不完整,请尝试鼠标右键“刷新”本网页!
富士康小说网 返回本书目录 加入书签 我的书架 我的书签 TXT全本下载 『收藏到我的浏览器』

女士品茶-第22部分

快捷操作: 按键盘上方向键 ← 或 → 可快速上下翻页 按键盘上的 Enter 键可回到本书目录页 按键盘上方向键 ↑ 可回到本页顶部! 如果本书没有阅读完,想下次继续接着阅读,可使用上方 "收藏到我的浏览器" 功能 和 "加入书签" 功能!


蒲а芯恐械淖饔茫」艽嬖诜研肽温涞募馊裾矗」艽嬖赪?爱德华兹?戴明这样的统计学家坚持认为假设检验毫无用途,尽管出现了根本不需要计算P值、不需要考虑显著性的贝叶斯统计学……总之,尽管在数理统计学家之间存在着上述这些争论,显著性检验和P值一直被使用着。考克斯就问了:科学家真的在使用这些检验吗?他们怎么会知道这些检验的结果是真的还是有用的呢?他发现,在实践中,科学家用假设检验主要是通过消除不必要的参数,来提高其对现实的了解程度,或是用来在两个不同的现实模型间进行选择。

博克斯的研究方法
博克斯(博克斯和考克斯中的另一位)从稍微不同的角度来研究这个问题。他认为,科学研究不只是做一个简单的实验,科学家在进行实验前,已经掌握了大量的知识,或者至少对实验的结果已经有了一个期望值,研究是为了提升知识、实验设计取决于你要提升的知识类型。在这一点上,博克斯和考克斯具有很多共同之处。对于博克斯来说,一次实验是一系列实验的一部分,将这次的实验数据与其它实验的数据进行比较,那么早先的知识就会在新的实验中和对以往实验的重新分析中得到重新审视。科学家从未停止过对以往研究的回顾,并从较新的研究视角去提升过去的认识。
举一个关于博克斯方法的例子。假设一个造纸厂引进了博克斯的一个主要创新方法——调优运算(evolutionary variation in operations,EVOP),按照博克斯的方法,这个工厂在生产过程中引入了一系列的实验,用不同的方法在温度控制、速度、硫磺处理过程以及温度控制等环节进行了微调,结果发现纸张的强度变化不大。如果要生产的产品仍然可销售的话,这种变化是不能大的。然而,根据费歇尔的方差分析(analysis of variance),用这些微弱的差别可以进行另外一个实验,在这个新的实验中,纸的平均强度稍微增大,这样,这个新的实验就可以用来确定可以提高纸张强度的工作方向。在过程操作改进中每个步骤的结果都与先前步骤的结果进行比较,当得到的结果看起来比较反常时,实验要重新做,这个过程周而复始——永远没有所谓最终“正确”的结论。在博克斯的模型里,这个不断进行着数据检验和再检验的科学实验是没有尽头的——没有最后的科学真相。

戴明的观点
戴明和其他许多统计学家坚决否定假设检验的作用。他们坚持认为费歇尔的估计方法才是统计分析的基础,认为真正应该估计的是统计分布的参数,而通过P值和武断的假设间接地处理这些参数而进行的分析是毫无意义。这些统计学家继续使用奈曼的置信区间去衡量他们研究结论的不确定性,但是他们却认为奈曼-皮尔逊的假设检验就象K?皮尔逊的矩法(method of moments)一样已经过时了。有趣的是,奈曼自己也很少在他的应用性论文里用到P值与假设检验。
对假设检验的拒绝以及博克斯与考克斯对费歇尔显著性检验定义的重新诠释,使得人们可能对于皮托在癌症临床研究中解决问题的方法提出质疑。但是他面对的这个根本问题始终没有解决。当接受治疗的病人改变治疗方法,实验因此被动地做了调整时你能怎么做?亚伯拉罕?沃尔德(Abraham Wald)已经指出在实验中怎样的调整是可以接受的,那就是序贯分析(sequential analysis)。但是在皮托的问题中,肿瘤学家不会采用沃尔德的序贯分析法,一旦他们察觉到必要时,他们就会采用不同的治疗方法。

科克伦的观测研究
从某种方面来说,皮托的问题也是约翰?霍普金斯大学的威廉?科克伦在20世纪60年代研究的问题。巴尔地摩(Baltimore)市政府想知道,公共住宅是否影响低收入人群的社会态度和生活水平的提高。他们联系了约翰?霍普金斯大学的统计小组,请求他们帮助设计一个实验。按照费歇尔的方法,约翰?霍普金斯大学的统计学家建议寻找一群人,不论他们是否申请了公共住宅,随机分配公共住宅给其中一部分人,而对其中的另外一些人不提供公共住宅。这个建议吓坏了市政官员,以往,在公布安置公共住宅时,他们通常的做法是先到先受理,这是惟一公平的做法,他们不能拒绝那些先提出申请而却是因为计算机的随机抽取而没有选中的人。但是约翰?霍普金斯大学的统计学家指出,不管使用何种方法,那些最先申请的人通常都是最积极并且有野心的人,如果这种说法是对的,那么住在公共住宅里的人本来就比另外一些人干得好,这与提供住宅本身无关。
科克伦的结论是,如果他们不能够采用已经设计好的科学实验,那么通过追踪那些住进公共住宅以及那些没有住进的家庭,他们可以采用观察研究的方法来替代。这些家庭有很多因素不同,如年龄、受教育程度、宗教信仰以及家庭的稳定状况。他对这类观察研究的统计分析提出了许多方法,在各种方法中,他会考虑不同家庭的上述因素对测量结果进行调整,建立一个数学模型,其中包括年龄、是否是单亲家庭、宗教信仰等因素的影响力。一旦代表这些因素的影响力参数估计出来了,剩下的影响就应该是由公共住宅造成的。
如果临床研究声称,治疗效果的差异已经根据病人年龄和性别的差异进行了调整,那就是说研究人员在估计治疗方法的主要效果时,已经应用了科克伦的方法,并且考虑了在治疗中为病人指定方法不平衡性的影响。几乎所有社会学研究都采用了科克伦的方法,但有些研究的作者可能没有认识到他们用的方法来自科克伦,而且认为其中很多特殊技术通常比科克伦的研究还要早。然而,科克伦为这些方法建立了稳定的理论基础,他写的关于观察研究的论文已经影响了医学、社会学、政治科学和天文不,在这些领域里“治疗方法”的随机指派,既不可能,也不道德。

鲁宾模型
在20世纪80年代和90年代,哈佛大学的唐纳德?鲁宾(Donald Rubin)提出了不同的方法,来解决皮托的问题。在鲁宾的模型中,假设每个病人对每个治疗方法都有一个可能的反应,也就是说,如果有两个治疗方法A和B,我们可以只观察采用其中一种治疗方法的病人,这些病人采用的方法是已经确定的。我们可以建立一个数学模型,在这个模型的公式中用一个符号来表示每种病人可能会有的反应。鲁宾界定了这个数学模型的使用条件,而在估计病人转而使用其它治疗方法会有什么样的反应时,这些条件是必需的。
鲁宾模型和科克伦的方法可以应用于现代统计分析中,因为应用计算机可以处理大量的数据。这些方法即使在费歇尔时代有人想到了,也是不可能实现的,因为这个数学模型涉及的数据太多,计算非常复杂,必须要借助于计算机。这个方法经常要求进行迭代计算,计算机要进行上万甚至百万次的计算,最后才会收敛于一个最终的答案。
科克伦和鲁宾的方法是高度依赖特定模型的,也就是说,除非所用的这个复杂的数学模型能非常准确地描述现实,否则就不会得出正确的答案。如果使用他们的方法,就要求分析人员要建立一个能够全面或近似全面描述事实各个方面的数学模型,如果事实与模型不符,那么分析的结论就不成立。像科克伦和鲁宾这些方法的一个伴生部分,已经成为去确定事实与模型怎样的拟合度下,结论是稳健的一种尝试。目前,数学界正在致力于研究:在结论不再成立之前,事实与模型之间可以有多大偏差。科克伦在直到1980年去世以前的日子里,一直在研究这些问题。
统计分析方法可以看作是一个连续过程,一端是高度依赖模型的方法,如科克伦和鲁宾的方法;另外一端则是一些非参数方法,采用最普通的方式检查数据。正如计算机的出现使模型模拟的方法得以实现一样,在使用非参数方法时,也发起了一场计算机革命,这种方法极少或根本不用设计数学结构,数据不必放在一个预想的模型中就可以展现它们的含义。这些方法在使用中都有一些奇怪的名字,像“解靴带”(“bootstrap”,我们称为“自助法”——译者注)。这是下一章要叙述的内容。
第28章 电脑随心所欲
圭多?卡斯泰尔诺沃(Guido Castelnuovo)出生于显赫的意大利犹太家庭,他的家庭背景可以追溯到古罗马最早的凯撒时代。1915年,卡斯泰尔诺沃当时是罗马大学(University of Rome)的数学教授,他正在进行一场孤独的战争,他想在研究生项目中引入一些有关概率和精算数学的课程。当时,安德烈?柯尔莫哥洛夫还没有建立起概率论的基础,数学家认为概率只是一个使用了复杂计算技术的众多方法的集合,是数学中的一个有趣的花絮,经常作为代数课里的一个部分来教授,在纯数学美丽的微光尚待关注的时候,没有人认为值得在研究生项目中开设这种课程。就精算数学而言,这段时间是应用数学最低迷的时期,人的寿命及意外事故发生频率的计算都只是采用简单算术,所以,系里其他的数学教授都认为没有开设这个课程的必要。
卡斯泰尔诺沃不仅在代数几何学这个抽象领域做了许多开创性工作,他对数学应用也有着浓厚的兴趣,他还劝说系里的其他人允许他开设这个课程。作为教学的成果,他在1919年出版了第一本关于概率与统计应用的教科书《概率运算与应用》(Calcolo della probabilità e applicazioni),这本书被意大利其它一些大学用于类似课程的教学中。到了1927年,卡斯泰尔诺沃已经在罗马大学成立了统计与精算科学学院(The School of Statistics and Actuarial Sciences),而且在整个20年代和30年代,意大利学校里致力于精算研究的统计学家越来越多,他们与瑞典该领域的专家进行极其活跃的交流。
1922年,贝尼托?墨索里尼(Benito Mussolini)在意大利实行法西斯主久,利用强权控制人民的言论自由,对大学里的学生和教职工都进行调查,以驱逐所谓的“国家的敌人”。在这次驱逐行动中,因为没有提及种族问题,所以卡斯泰尔诺沃是犹太人这件事没有被考虑进去 。所以最初的7年里他能够继续在法西斯政府的统计下工作。到了1935年,意大利法西斯与德国纳粹的联合导致在意大利实行反犹太的法律,70岁的卡斯泰尔诺沃失去了工作。
但是,这些并没有使这位不知疲倦的人停止工作,直到1952年去世。随着纳粹种族政策的实施,许多有前途的犹太研究生也被逐出大学。卡斯泰尔诺沃就在他和其他犹太教授的家里设立了特殊的课堂,坚持授课,以帮助这些犹太研究生继续他们的学业。卡斯泰尔诺沃除了写一些关于数学历史的书外,还在他87岁时的最后日子里,研究决定论和机遇之间的哲学关系,并试图去说明因果的概念——这些我们已经在前面的章节中接触过了,在本书的最后一个章节我将作进一步的探讨。
由于卡斯泰尔诺沃的努力而建立起来的意大利统计学派,拥有稳定的数学基础,但大多数研究都是以在实际应用中遇到的困难作为出发点。而与卡斯泰尔诺沃同时代的年轻人科拉多?基尼(Corrado Gini)则带领罗马中央统计研究所(Istituto Centrale Statistica in Rome)进行了在精算方面的深入研究。罗马中央统计研究所是一家由保险公司设立的私人研究机构。基尼对所有应用课题的极大兴趣促使他在20世纪30年代期间与活跃在数理统计领域大部分年轻的意大利数学家保持着密切的联系。

格利文科-坎泰利引理
在这些意大利数学家中有一位叫弗朗切斯科?保罗?坎泰利(Francesco Paolo Cantelli,1875-1966),他差不多先于柯尔莫哥洛夫就建立了概率论的基础。坎泰利对基础理论研究(如研究概率的意义是什么?)不感兴趣,没有像柯尔莫哥洛夫那样更深入地研究概率论,他只是满足于用概率运算的各种方法去推导出一些基本的数学定理,而这些概率运算的方法都是自18世纪数学家亚伯拉罕?棣莫弗将微积分引入概率计算后就存在的。1916年,坎泰利发现了我们所称的数理统计的基本原理。尽管它非常重要,却起了一个不起眼的名字“格利文科-坎泰利引理”(the GlivenkoCantelli Lemma )。坎泰利是第一个证明了这个定理的人,并且,他非常理解它的重要性。至于柯尔莫哥洛夫的学生——约瑟夫?格利文科(Joseph Glivenko)对此定理也做出了贡献,他采用一种新的数学符号,即斯蒂尔切斯积分(Stieltjes integral)概括了这一结果,他的论文在1933年发表于一本意大利的数学期刊。格利文科所采用的数学符号是现代教科书中使用最多的一个符号。
格利文科-坎泰利引理是那种直观上显而易见的,但是,只有当别人发现后,你才会意识到,否则看不出来。如果有一些数,我们对它们的概率分布一无所知,那么数据本身可以用来构造一个非参数分布,这是一个不那么好看的数学函数,其间有许多断点,怎么看都不优美,尽管它的结构不雅观,坎泰利还是可以通过增大观测值的数量,来使不那么美的经验分布函数(empirical distribution function)越来越接近真实的分布函数。
格利文科-坎泰利引理的重要性立刻得到了承认,在这之后的20年里,这个引理被用来还原并证明了许多重要的定理,它是一种经常用于证明中的数学研究工具之一。为了用这个引理,数学家在20世纪初,不得不想出一些计算方法的简便算法,如果没有小窍门,在大量的数据样本中用经验分布函数来进行参数估计,就需要有一部在一秒钟内可以进行数百万次计算的超强计算机。在20世纪50年代、60年代乃至70年代都还没有这样的机器,到了80年代,才有这样的计算机用于这样的计算。格利文科-坎泰利引理成为新统计方法的基础,而这种新统计方法只能生存在高速计算机的世界里。

埃弗龙的“解靴带”法
在1982年,斯坦福大学的布拉德利?埃弗龙(Bradley Efron)发明了所谓“解靴带”(Bootstrap)(我们称为“自助法”)的方法,它基于格利文科-坎泰利引理的两种简单应用。这两种应用方法的原理很简单,但是它们要求用电脑进行大量的计算、再计算,……如果对一组数量适中的数据进行典型的“解靴带”分析,即使是利用最好的计算机也需要花好几分钟的时间。
埃弗龙把这种方法称为“解靴带”,是因为整个计算过程是一个数据自身模拟提升的过程,就像是解靴带一样,一个接一个地被解开。计算机不会介意重复单调的工作,它一遍又一遍地做着同样的工作,从不抱怨。由于使用了现代的晶体管芯片,计算机可以在不到万分之一秒内完成这些工作。在埃弗龙的“解靴带”背后还有一些复杂的数学理论,他最初的论文中证明了,如果对真实的数据分布做出了恰当的假设,这个方法与标准方法是等同的。这个方法的应用非常广泛,从1982年开始,几乎在每个数理统计期刊上都刊载一篇或更多的与“解靴带”相关的文章。

重复抽样和其它运算密集方法
还有其它一些与“解靴带”类似的方法,总称为重复抽样(resampling)。事实上埃弗龙已经阐述了费歇尔的许多标准统计方法都可以看作是重复抽样,而且,重复抽样方法属于范围更广的统计方法的一种,我们称之为“运算密集”(puterintensive)。运算密集法充分利用现代计算机,对相同的数据不断地重复进行大量的运算。
20世纪60年代,美国国家标准局(the National Bureau of Standards)的琼?罗森布拉特(Joan Rosenblatt)和德州农工大学(Texas A&M University)的伊曼纽尔?帕仁(Emmanuel Parzen)发展了这种运算密集的程序,他们的方法被称为“核密度估计”(kernel density estimation),而且,由此产生了“核密度回归估计”(kernel densitybased regression estimation)。这两种方法涉及到两个任意参数,一个是“核”(kernel),另一个是“带宽”(bandwidth)。这些方法出现不久,1967年(远在计算机可以解决这些问题之前)哥伦比亚大学的约翰?范里津(John van Ryzin)利用格利文科-坎泰利引理确定了参数的最优配置。
当数理统计学家们还在研究理论,并在他们自己的期刊发表文章时,罗森布拉特和帕仁的核密度回归已经被工程界独立地发现了,在计算机工程师中,它被称为“模糊近似值”(fuzzy approximation)。它用了范里津所称的“非最优核”(nonoptimal kernel),并且,只是非常随意地选用了一个“带宽”。工程实践不是为了寻找理论上最佳的可能方法,而是在于追求可行性。当理论家们还在为抽象的最优标准而大费周折时,工程师们已经走出去,到了真实的世界,用模糊近似值的概念建立了以计算机为基础的模糊系统。模糊工程系统应用于傻瓜相机,可以自动对焦和调整光圈。这一系统还应用于新建筑物中,根据不同房间的不同需要调整和保持舒适的恒定室温。
巴特?科什科(Bart Kosko)是工程界一个私人咨询师,是模糊系统推广者中最成功的一位。当我读他书中列出的参考书目时,可以找到关于19世纪一些主流数学家,像戈特弗里德?威廉?冯?莱布尼茨(Gottfried Wilhelm von Leibniz)等的参考资料,还有对随机过程理论及其在工程领域的应用方面做出贡献的数理统计学诺伯特?维纳(Norbert Wiener)的一些资料。但我找不到罗森布拉特、帕仁、范里津或核回归理论(the theory of kernelbased regression)任何后来贡献者的资料。这表明,尽管模糊系统和核密度回归的计算机运算法则基本一致,但它们各自完全独立地得到了发展。

统计模型的胜利
运算密集法在标准工程实践中的扩展,是20世纪末统计革命已经渗透到科学界各个角落的一个实例。数理统计学家们已经不再是统计方法发展唯一的、甚至已经算不上是最重要的参与者了。在过去的70年中,科学家和工程师们并不知道那些刊载于他们期刊中最重要的理论经常一次次地被重新发现 。
有时,应用者应用基础定理时没有进行重新论证,仅仅凭直觉上以为是对的就假定它是正确的。还有的情况是,使用者使用了已经被证明是错误的定理,仅仅是因为这些定理直观上看起来是正确的。存在这种问题的原因,是因为在现代科学教育中概率分布的概念已经根深蒂固,以至于统计学家和工程师们思考问题的方式也是基于概率分布的角度。一百多年前,K?皮尔逊认为,所有的观测都来自于概率分布,而科学的目的就在于估计这些分布的参数。在这之前,科学界相信宇宙遵守着某些规律,如牛顿运动定律,而观测到的任何差异都是因为误差的存在。逐渐地,皮尔逊的观点占据了优势,其结果,每个在20世纪接受科学方法训练的人都理所当然地接受了皮尔逊的观点。这种观点深深地植根于现代数据分析的科学方法之中,几乎没有人去考虑其所以然。很多科学家和工程师使用这些方法,但从不考虑K?皮尔逊观点的哲学含义。
然而,当科学研究的真正“主体”是概率分布这一观念被广为接受时,哲学家和数学家发现了许多严重的基本问题,我已经在以上的章节中概略地列举了一些,在下一章节将详细论述。
第29章 “泥菩萨”
1962年,芝加哥大学的托马斯?库恩(Thomas Kuhn)出版了《科学革命的结构》(The Structure of Scientific Revolutions)一书。这本书深刻地影响了哲学家们和实践者们如何去看待科学。库恩指出,现实是复杂的,是绝对不可能由一个有组织的科学模型来完全描述出来的。他认为科学就是试图模拟建立一个描述现实的模型,符合可用的数据,并且可以用来预测新实验的结果。因为没有任何一个模型是完全真实的,所以,数据越来越多,要求不断地配合新的发现去修正模型以修正对现实的认知。这样,模型因为带有特例的直觉上难以置信的延伸,变得越来越来复杂,最终,这个模型不再适用了。这时,有创新精神的人将会考虑建立一个全新的模型,一场新的革命在科学领域即将展开。
统计革命就是模型变换的例子。用19世纪决定论的科学观,牛顿物理学已经成功地描述了行星、月球、小行星和彗星等天体的运动,运动都是遵守几个明确的运动和引力定律;在寻找化学规律方面也取得了一些成功;并且达尔文的自然选择学说为理解进化提供了有利的依据;甚至有些人试图将这种寻找科学规律的模型研究引入社会学、政治科学以及心理学等领域。那时,人们相信寻找规律的难点在于测量不准确。
19世纪初,一些数字家如皮埃
返回目录 上一页 下一页 回到顶部 0 0
快捷操作: 按键盘上方向键 ← 或 → 可快速上下翻页 按键盘上的 Enter 键可回到本书目录页 按键盘上方向键 ↑ 可回到本页顶部!
温馨提示: 温看小说的同时发表评论,说出自己的看法和其它小伙伴们分享也不错哦!发表书评还可以获得积分和经验奖励,认真写原创书评 被采纳为精评可以获得大量金币、积分和经验奖励哦!