友情提示:如果本网页打开太慢或显示不完整,请尝试鼠标右键“刷新”本网页!
富士康小说网 返回本书目录 加入书签 我的书架 我的书签 TXT全本下载 『收藏到我的浏览器』

女士品茶-第8部分

快捷操作: 按键盘上方向键 ← 或 → 可快速上下翻页 按键盘上的 Enter 键可回到本书目录页 按键盘上方向键 ↑ 可回到本页顶部! 如果本书没有阅读完,想下次继续接着阅读,可使用上方 "收藏到我的浏览器" 功能 和 "加入书签" 功能!


不过,在这些黑暗没有完全成为现实之前,欧洲的数学家们就已经解决了中心极限定理的证明问题。芬兰的亚尔?瓦尔德马?林德伯格和法国的保罗?利维分别发现了能够使中心极限定理这个猜想成立所必需的一组重叠的条件。这证明了至少存在三种解这个问题的方法,而且证明了中心极限定理不是只有一个单个的定理,而是有一组定理,其中每个中心极限定理都能从略有区别的一组条件中推导出来。到了1934年,中心极限定理(组)终于不再是猜想了,一个科学家必须要做的只是要证明林德伯格?利维条件(LindebergLévy Conditions)成立,那么中心极限定理就成立,于是,他就可以随意地把正态分布设为一个合适的模型。

林德伯格?利维条件与U统计量
然而,就一个特定情况而言,要证明林德伯格?利维条件成立很难。但在理解林德伯格?利维条件上倒有几分安慰,因为他们描述的条件看上去是合理的,而且在大多数情况下都是成立的。不过要证明其成立却是一个棘手的问题,这也正是战后远在北卡罗莱纳大学辛苦工作的瓦西里?霍夫丁(Wassily Hoeffding)在这个故事中竟会有如此重要地位的原因。1948年,霍夫丁在《数理统计年报》(Annals of Mathematical Statistics)上发表了一篇论文,题目是“渐近正态分布的一组统计量”。
回想费歇尔曾把统计量(statistic)定义为:从观察到的测量值得出的、可用来估计其分布参数的一个数值。费歇尔还建立了有用的统计量应该具备的一些准则,在这个过程中,他还指出了利用皮尔逊的许多方法导出的统计量不符合这些准则。有很多种计算统计量的不同方法,其中的很多统计量都能满足费歇尔提出的准则。一旦计算出统计量,为了要用它,我们必须知道它的分布。如果它服从正态分布,用起来就容易多了。霍夫丁提出了一种他所谓的“U统计量(Ustatistics),并指出一个统计量如果属于这种U统计量,则满足林德伯格?利维条件。正因为如此,我们只须指出一个新的统计量是否与霍夫丁的定义相一致,而不必去解那些很困难的数学来证明林德伯格?利维条件成立。霍夫丁所做的一切就是用一组数学必要条件取代另外一组。然而,霍夫丁的条件事实上很容易检查。因此,霍夫丁的论文发表之后,几乎所有的论文在证明一个新统计量服从正态分布的时候,都是通过证明该统计量是一个U统计量来完成的。

霍夫丁在柏林
第二次世界大战期间,霍夫丁处在一个不确定的微妙境况中。他1914年出生在芬兰,父亲是丹麦人,母亲是芬兰人。第一次世界大战之后,芬兰沦入俄罗斯帝国的统治,就在这个时候,霍夫丁随家人迁往丹麦,随后又迁往柏林,因此他拥有斯堪的纳维亚地区两个国家的双重国籍。1933年他高中毕业,随后开始在柏林攻读数学。就在那个时候纳粹开始在德国掌权。预料到以后可能发生的事,霍夫丁就读的那所大学的数学系的系主任R?冯?米泽斯早早地离开了德国,不久之后,为霍夫丁授课的其他许多教授,有的逃走了,有的被解除了职务。在动乱中,年轻的霍夫丁所选的课都是由一些低水平的教师来讲授的。即便如此,这些教师中的很多人也没能维持到把他们承担的课程教完,因为纳粹在持续不断地“净化”大学教师队伍,把大学教师中所有的犹太人和犹太人的同情者全都清除出去。
随同数学系里的其他学生一道,霍夫丁被迫去听路德维希?比贝尔巴赫(Ludwig Bieberbach)讲授的一堂课。比贝尔巴赫一直都是教师中的小角色,只是因为对纳粹党的狂热拥护,才合他成为数学系新的系主任。比贝尔巴赫这堂课讲的是“亚利安”数学与“非亚利安”数学的区别,他声称颓废的“非亚利安”(解读为犹太)数学家仰仗着复杂难解的代数符号做研究,相反,“亚利安”数学家则在更高贵、更纯粹的几何直觉领域里从事研究。结束了讲课的时候,他让学生提问题。坐在后排的一个学生问他,为什么偏偏是这个里夏德?库朗(Richard Courant,20世纪初德国伟大的犹太裔数学家之一)运用几何洞察力创建了他的实分析理论(theories of real analysis)。此后,比贝尔巴赫再也没有就这个题目上过公开课。但是他创办了《德国数学》(Deutsche Mathematik)杂志,这个杂志很快就成为当政者眼中居第一位的数学期刊。
1940年,霍夫丁完成了他的大学学业,像他这个年龄的其他男青年都要应征到部队去服兵役,但由于他的双重公民身份,并且当时的芬兰已成为德国的一个盟国这样的事实,他因此不必服兵役。他找到一份工作,在一家跨校际的精算杂志社的办公室兼职。与比贝尔巴赫创办的那个杂志不同,这是一个很难约到论文,因此也很难定期出版发生的杂志。霍夫丁甚至连寻找一份教书的工作都不能,因为他必须申请到正式的德国公民身份才有资格去教书。
1944年德国政府宣布,具有“德国血统或相关血统“的非德国籍青年也要服兵役。不过,在霍夫丁体检的时候,发现他患有糖尿病而免于服兵役。这时他终于有了找工作的资格。他兼职的那家期刊的编辑哈拉尔德?格佩特(Harald Geppert)建议他从事某种军事应用方面的数学研究工作,他提这项建议的当时,期刊的另一个编辑赫尔曼?施密德(Hermann Schmid)也在场。霍夫丁犹豫了一下,然后,出于对格佩特的谨慎的依赖,他对格佩特说,任何一种与战争有关的工作都违背他的良心。施密德出身于一个普鲁士贵族家庭,霍夫丁希望他的家族荣誉感能让他对这次谈话守口如瓶。
随后的几天里,霍夫丁一直提心吊胆的,但什么事都没有发生,他得以继续他的研究。当俄国军队逼近柏林的时候,一天早上,格佩特在早餐里放了毒药喂给他年幼的儿子,随后他和他的太太也服毒自杀了。1945年2月,霍夫丁和他的母亲一起逃到汉诺威的一个小镇上,他们在那里的时候,这个地方成为英军占领区的一部分。而他父亲仍滞留在柏林,在那里,他被俄国秘密警察以间谍罪逮捕,因为他一度曾为美国驻丹麦的商务参赞工作过。好几年时间,他杳无音信,直到他设法越狱,又历尽千辛万苦逃到了西方。在此期间,年轻的霍夫丁于1946年秋天到达纽约,继续他的学业,后来应邀到北卡罗莱纳大学任教。

运筹学
纳粹的这种反理智主义、反犹太主义倒行逆施的结果之一,就是让第二次世界大战的同盟国因此而丰收了许多才华横溢的科学家与数学家,在他们的鼎立相助下打赢了这场战争。英国生物学家彼得?布莱克特(Peter Blackett)向海军部建议,武装部队应该请一些科学家来协助解决战略和战术上的问题。无论是哪个专业研究领域的科学家们,他们都训练有素,能够应用逻辑和数学模型来解决问题。他建议组成科学家的攻关小组,让这些小组从事有关战争问题的研究,由此诞生了一门新学科——“运筹学”(operational research,在美国称之为operations research)。从事不同领域研究的科学家组成的科研小组联合起来共同研究,决定用远程轰炸机对付潜艇的最佳使用方案;为防空武器提供射击表;决定靠近前线的军火补给站的最佳选址;甚至还要解决军队的食物补给问题。
战争结束后,运筹学的应用由战场搬到了商场。那些在战争期间被征募到军队去服务的科学家已经证明了用数学模型和科学的思维来解决战事中的战术问题是多么有用。同样的步骤和许多相同的方法也能用来组织工厂里的生产,找出仓库与销售部门之间的最优关系,解决许多别的商务问题,均衡有限的资源,或改进生产与提高产量。从那时候起,大公司里大部分都设立了作业研究部门,而这个部门所从事的多数工作都与统计模型有关。
我在辉瑞公司工作的时候所做的几个项目,其目的都是为了改善对药物研究进行控制和提取新产品进行测试的方法,在所有这些研究中涉及到的一个重要方面就是,当条件可以满足时,有能力用正态分布去处理问题。
第10 章 拟合优度检验
20世纪80年代,出现了一种新型数学模型,激起了公众的遐想,主要是因为这种数学模型的名字——混沌理论(chaos theory )。这个名字提示着某种形式的统计建模明显带有杂乱无序特征的随机性。创造了这个名字的人有故意避开使用随机(random)这个词的嫌疑。实际上混沌理论是尝试着在一个更高端的层次上,通过复兴决定论(determinism)来动摇统计革命。
回想一下,在统计革命之前科学所处理的那些“事件”,要么是已有的测量,要么是生成这些测量值的自然事件。伴随着统计革命,科学的事件变成了能左右测量值分布的参数。在早期的确定性方法中,有一个信条是,越精确的测量,对所考察的自然客体的描述也就越精确;而在统计方法中,分布参数有时候不必有一个自然客体,无论多么精确的测量系统,分布参数的估计值终究是有误差的。例如,在确定性方法中,重力常数是描述物体如何向地球下落的一个恒定不变的值;而在统计方法中,我们对重力常数的测量值永远都不会是一样的。为了“通晓”落体的性质,这些测量值分布的离散状态才是我们想要确立的。
1963年,混沌理论专家爱德华?洛伦兹(Edward Lorenz)做了一个后来时常被引用的演讲,演讲题目为“巴西一只蝴蝶翅膀的翩翩舞动,会引起德克萨斯州的龙卷风吗?”洛伦兹的主要论点是,混沌的数学函数对初始条件非常敏感,初始条件的些微差异,经过多次迭代之后,中以导致全然不同的结果。洛伦兹相信,由于存在这种对初始条件微波差异的敏感性,以至于对所研究的问题不可能得出一个确定的答案。隐含在洛伦兹演讲中的是确定性假设,即理论上每一个初始条件都是促成某个最终结果的一个起因。这个被称之为“蝴蝶效应”(butterfly effect)的观念,已经被那些混沌理论的普及者们当作一个深邃而睿智的真理接受下来了。
然而,没有任何科学的证明揭示了这样一种因果关系的存在,也没有任何数学模型有准确的依据表明客观现实中存在着这一效应。它只是一种信念的表述而已,就其科学的有效性而言,它与关于鬼神的描述相去无几。而统计模型是用分布参数来对科学探索明确地进行解释,它们也是建立在对现实世界的一种信念所做的描述上。然而,我自己在科学研究上的经历让我确信,比起对信念的确定论的陈述,统计上的陈述更有可能是真实的。

混沌理论与拟合优度
混沌理论源于这样的观察:一个固定不变的确定性公式生成的数字有可能看上去是一个具有随机性的模型。早在一批数学家处理相对简单的迭代公式并绘出其结果的时候,就曾经发现过这种现象。在第9章,我曾经把一个迭代公式描述为:首先得到一个数,接着把这个数代入方程式中得到另一个数,用第二个数又得到第三个数,如此等等。其实,早在20世纪的最初几年,法国数学家亨利?普安卡雷(Henri Poincaré)就尝试着把这些连续的成对数值绘在图上,用这种方式理解一组复杂的微分方程式。普安卡雷在图中发现了一些值得关注的图式,却因不知道如何对这些图式做进一步的研究而放弃了深入研究的想法。而混沌理论就是以普安卡雷的这些图式为起点发展起来的。当你在绘制一张普安卡雷图形(Poincaré plots)时,会发现图纸上出现的那些点起初好像完全不成形状,表面上这些点以一种偶然的方式出现在随便什么地方,但承受着绘在图上的点数的不断增加,图式开始显现出来,有时是几组平行线,有时也可能是一组相互交叉的线,或许是很多个圆,或是和直线相交的圆。
混沌理论的拥护者认为,现实生活中那些看上去是纯随机的测量值,实际上是由某个确定性的方程组生成的,这些方程可以从普安卡雷图形的模式推演出来。例如,有些混沌理论的拥护者记录下了人类心脏动脉搏动的间隔时间,并绘成普安卡雷图形。他们声称在这些图上看到了一些形状,并且已经发现一些似乎能产生同类形状的确定性生成方程。
直到写这本书时为止,以这种方式应用的混沌理论仍存在着一个严重的缺陷。根据数据绘出的图形与用一组特定方程组生成的图形,这两者之间的拟合度如何,并未测量。他们只是要求读者观察两种相似的图形,并以此为依据证明给出的生成方程是正确的。统计分析上已经证明这种用肉眼检验的方式难免出错。因为,用肉眼判断类似的或几乎完全相同的两个图形,如果改用为此目的创建的统计分析工具仔细检验之后会发现,两者往往是大不相同的。

皮尔逊的假使优度检验
这是K?皮尔逊在他的学术生涯早期就已经意识到的一个问题,K?皮尔逊最伟大的成就之一就是创造出第一个“拟合优度检验“(goodness of fit test)。通过观测值与预测值的比较,皮尔逊构造出一种能对拟合优度进行检验的统计量,并称之为“χ2拟合优度检验”(chisquare goodness of fit test)。之所以用希腊字母χ(读作“kai”),是因为这个检验统计量的分布属于一组偏斜分布,而他称这组偏斜分布为χ家族(chi family)。实际上,这个检验统计量很像χ的平方,因此命名为“χ2”。在费歇尔看来,既然是一个统计量,就会服从一种概率分布。K?皮尔逊证明了无论用哪一种类型的数据,χ2拟合优度检验都服从相同的分布。也就是说,他能列出这个统计量的概率分布表。每一个检验都能用到同样的那套表。χ2拟合优度检验只有一个参数,费歇尔称之为“自由度”。费歇尔在1922年的那篇论文里,首次批评了皮尔逊的研究,指出在比较两种比例时,皮尔逊得出的那个参数值是错误的。
但是,没有任何理由只因为皮尔逊理论上的一个很小的错误,就贬低他的这项伟大成就。皮尔逊的拟合优度检验是现代统计分析中一个重要组成部分的先驱,这个重要组成就是“假设检验”(hypothesis testing)或“显著性检验”(significance testing),它允许分析人员提出用来模拟现实的两种(或多种)不一致的数学模型,然后利用数据来放弃其中的一个。假设检验应用得如此广泛,以至于很多科学家认为这是他们唯一能用的统计方法。在后面的章节中我们会发现,假设检验的应用甚至涉及到一些严肃的哲学问题。

检验女士是否真能品尝出茶的区别
假设我们要检验那位女士能否品尝出两杯茶的不同:是把牛奶倒进了茶水里,还是把茶水倒进牛奶里。我们给她两杯茶,告诉她一杯是茶水倒入牛奶里,另一杯是牛奶倒入茶水中。她尝了尝,正确区别开了这两杯茶。有可能她是凭猜测,猜对的机会是一半对一半。我们再给她同样的这样两杯茶,她又说对了。如果她仅仅靠猜测,那么连续两次都猜对的机会是四分之一。如果我们再给她两杯茶,假如她仍然能正确地分辨出来。若这人结果完全是猜出来的,此时猜对的机率则只有八分之一。我们继续两杯两杯地让她品尝更多杯茶,而她依然每次都能够正确地识别出来。某种意义上,我们就不得不相信她真的能品尝出其中的差别了。假定她说错了一次,假定说错的这一次就发生在第24组,而其他的全对,那么我们能否依然认为她真的有分辨不同奶茶的能力呢?假如她的错误是二十四分之四呢?或是二十四分之五呢?
假设检验(或者说显著性检验)是一种正规的统计方法,是在“待检验的假设为真”的假设前提下,用来计算以往观测到的结果发生的概率。当观测结果发生的概率很低时,我们得出原假设不成立的结论。重要的一点是,假设检验提供了一种拒绝某个假设的工具。上述例子中,待检验的假设是:那位女士只是凭猜测。假设检验的目的不是让我们接受某个假设,即使与那个假设有关的概率非常高也不能接受。
在这个普遍被接受的概念发展的早期,“significant”(显著的)这个词只是用来指“概率低到足以拒绝的程度”,数据如果可以用来拒绝某个分布,则它就是显著的。在19世纪后期的英语里,这个词仅仅是指计算结果意味着或表明了什么意思。进入20世纪之后,英语“significant”这个词在原有含义的基础上又扩展了其他的解释意义,也指某些事情是非常重要的。在某个待检验的假设条件下,统计分析仍沿用“significant”这个词“显著的”含义来表示计算结果发生的概率很低,在这个层面上,“significant”这个词有一个精确的数学涵义。但令人遗憾的是,使用统计分析的人常把显著性检验统计量理解为某种更接近这个词的现代语意的东西。

费歇尔对P值的运用
现在运用的显著性检验方法,其中大部分都是费歇尔构造出来的。他把判定具有显著性的那个概率,称为“P值”(Pvalue)。他对P值的涵义和有效性坚信不疑。在《研究工作者的统计方法》一书中,很多地方都专门介绍了怎么计算P值。正如我在开头的时候谈到的,这是一本专门给想要应用统计方法的非数学专业人士写的书。在这本书中,费歇尔并未解释这些检验是如何推导出来的,也从没有明确指出究竟多大的P值才算是显著的。他只是举出一些计算实例,并说明结果是否显著。在一个例子中,他给出一个小于0。01的P值,并且说明“一百个值当中,只有一个值会偶然超过(计算出来的检验统计量),因此,很显然,计算结果之间的差异具有显著性。”
1929年,费歇尔在《心灵研究学会刊》(Proceedings of the Society for Psychical Research)上发表的一篇论文中,几乎等于定义了一个在任何情况下都将是显著的特殊的P值。“心灵研究”(psychical research)提到试图用科学的方法来证明“超视力”的存在。心理学的研究人员大量运用了统计学的显著性检验来证明,在受实验者完全随意猜测这种假设条件下,其结果是不可能的。费歇尔在他这篇论文中,先是谴责某些作者完全错误地使用了显著性检验,接着他申明说:
运用生物学的方法对生物界进行观察的时候,统计学的显著性检验是必不可少的。其作用就在于防止我们被一些非主要的偶发事件所欺骗。并不是因为我们希望去研究或试图去查明这些偶发事件,而是因为它们与许多我们无法控制的其他境况联系在一起。一个观测的结果,倘若在我们正在寻找的真正原因根本不存在的情况下,几乎从未发生过,可以判断这个观测具有显著性。如果偶然发生的机率低于二十分之一,通常的做法是判断其结果具有显著性。对实际调查者来说,显著性水平的选择是任意的,但便于应用。不过,它并不意味着可以让自己每20次实验中就被骗一次。显著性检验只是告诉他什么是应该忽略掉的,也就是说应该把所有那些无法得到显著性结果的实验忽略掉。当他知道如何设计一个实验,而这个实验几乎一定能给出一个显著性的结果时,他也只能说明,这仅是一种实验上可以验证的现象。所以,对那些孤立的具有显著性的结果,他不知道如何才能让它们再现出来,只能留待以后再做进一步的调查研究了。
注意“……知道如何设计一个实验,而这个实验几乎一定能给出一个显著性的结果……”这句话,正是费歇尔使用显著性检验的核心之所在。对费歇尔而言,显著性检验只有在连续实验的相互联系中才有意义,所有这些实验的目的在于解释特定处理的作用。读过费歇尔的应用性论文之后,你会在他的引导下相信,使用显著性检验是为了得出三种可能的结论之一:如果P值很小(通常小于0。01),他断言某种结果已经显现出来;若P值很大(通常大于0。2),他宣称即便真的存在一个结果,也会因为该结果发生的可能性太小,所以不可能有任何显示出这个结果的大规模的实验;如果P值介于前两者之间,他讨论了应该如何设计下一个实验,才能得到一个更好的结果。除了上述情况,费歇尔从来没有明确说明科学家应该怎么解释P值。对费歇尔而言,看上去是如此显而易见的事,对读者来说可能并不清楚。
我们将在第18章回过头来重新审视费歇尔对显著性检验的态度。费歇尔始终坚持,从来都没有显示过吸烟有害健康,这也正是他的一个较大错误的核心之所在。费歇尔对有关吸烟和健康的证据做了犀利的分析,我们暂且把它放下,以后再谈。现在把话题转到1928年,看看当时35岁的耶日?奈曼。

J?奈曼的数学教育
当第一次世界大战在东欧爆发,奈曼的祖国陷于战火之中的时候,他还是一个在数学系读书的非常有发展前途
返回目录 上一页 下一页 回到顶部 0 0
快捷操作: 按键盘上方向键 ← 或 → 可快速上下翻页 按键盘上的 Enter 键可回到本书目录页 按键盘上方向键 ↑ 可回到本页顶部!
温馨提示: 温看小说的同时发表评论,说出自己的看法和其它小伙伴们分享也不错哦!发表书评还可以获得积分和经验奖励,认真写原创书评 被采纳为精评可以获得大量金币、积分和经验奖励哦!