友情提示:如果本网页打开太慢或显示不完整,请尝试鼠标右键“刷新”本网页!
富士康小说网 返回本书目录 加入书签 我的书架 我的书签 TXT全本下载 『收藏到我的浏览器』

人类的知识-第37部分

快捷操作: 按键盘上方向键 ← 或 → 可快速上下翻页 按键盘上的 Enter 键可回到本书目录页 按键盘上方向键 ↑ 可回到本页顶部! 如果本书没有阅读完,想下次继续接着阅读,可使用上方 "收藏到我的浏览器" 功能 和 "加入书签" 功能!



包含什么无知,这个概念对于全知来说仍然具有和对于我们来说同样的意
义。全知会知道a 是否为一个A,但是全知仍然可以说:凭借a 是一个B 这
个数据,a 是一个A 的概率是A/B。

在把我们的定义应用到特定的实例时,在某些情况下存在着一种可能发
生的意义上的含混。为了弄清楚这一点,我们必须使用性质而不是类的说法。
设A 类由性质φ确定,而B 类由性质ψ确定。接着我们说:

a 在已知它具有性质φ的条件下具有性质ψ的概率被定义为同时具有性
质φ和ψ的事物对于具有性质ψ的事物之比。我们用“φa”来表示“a 具有
性质φ”。但是如果a 在“φa”内出现不止一次,那就会出现一种意义上的
含混。举例说,假定“φa”是“a 自杀了”,即“a 杀死a。这是“x 杀死x”
的一个值,而“x 杀死x”是由自杀组成的类;也是“a 杀死x”的一个值,
而“a 杀死x”是a 杀死的人组成的类;也是“x 杀死a”的一个值,而“x
杀死a”是杀死a 的人组成的类。这样在给φa 的概率下定义时,如果“a”
在“φa”中出现不止一次,我们就必须指出它的哪些次出现可以当作一个变
量的值和它的哪些次出现不可以当作一个变量的值。

我们将发现我们能够按照上面的定义来解释所有的基本定理。

让我们拿拉普拉斯自命的归纳证明为例来看:

有N+1 个口袋,每个口袋中有N 个球。

在这些口袋中,第r+l 个口袋中有r 个白球和N…r 个黑球。我们已经从
一个口袋中拿出n 个球,而这些球全是白球。

那么:

(a)我们已经挑中其中都是白球的口袋的机会是多少?
(b)下一个球是白球的机会是多少?
拉普拉斯说(a)是(n 十1)/(N+1)而(b)是(n+1)/(n+2)。
让我们用一些数字实例来说明。首先:假定一共有8 个球,其中已经取
出4 个球,而这4 个球全是白球。那么(a)我们已经挑中只有白球的口袋的
机会和(b)下一次取出的球是白球的机会各是多少?

设Pr 代表我们已经挑中有r 个白球的口袋这个假设。数据把P0,P1,P2,

P3 排除在外。如果我们有P4,那么我们只有一种方法可以已经拿出4 个白球
来,剩下4 种拿出一个黑球的方法,但却没有一种拿出一个白球的方法。如
果我们有P5,那么我们有5 种方法可以已经拿出4 个白球,并且对于其中每

一种方法来说都有一种拿出另一个白球和三种拿出一个黑球的方法;这样从
P5 我们就得出5 个下一个球是白球和15 个下一个球是黑球的实例。如果我们
有P6,那么就有15 种挑出4 个白球的方法,并且在挑出它们之后还剩下两
种挑出一个白球和两种挑出一个黑球的方法;这样我们从P6,就得出30 个
挑出另一个白球和30 个下一个球是黑球的实例。如果我们有P7,那么就有
35 种拿出4 个白球的方法,并且在拿出它们之后还剩下3 种拿出一个白球和
一种拿出一个黑球的方法;这样我们就有105 种拿出另一个白球和35 种拿出
一个黑球的方法。如果我们有P8,那么就有70 种拿出4 个白球的方法,并
且在拿出它们之后还有4 种拿出另一个白球但却没有一种拿出一个黑球的方

法;这样我们从P8 得到280 个第5 个白球和没有黑球的实例。加在一起,我
们就有5+30+105+280 即420 个第五个球是白球和4+15+30+35 即84
个第五个球是黑球的实例。所以白球所占的优势是420 比84,即5 比1;这

就是说,第五个球是白球的机会是5/6。

我们已经挑中都是白球的口袋的机会,是从这个口袋挑出4 个白球的方
法数除以挑出4 个白球的方法的总数所得的比值。我们已经看到前一个数是
70;后一个数是l+5+15+35+70,即126。所以机会是70/126,即5/9。

这两种结果都和拉普拉斯的公式相符合。

让我们再举一个数字的例:假定有10 个球,已经拿出其中5 个并且发现
都是白球。那么P10即我们挑中只有白球的口袋的机会是多少?下一个球是白
球的机会又是多少?。。

Pr 可能有的方法数; 在pr 的条件下,挑中另一个白
球的方法数,
挑中一个黑球
的方法数
p5 1 ; 在p5 的条件下,0 5
p6 6 ; 在p6 的条件下,1 4
p7 21 ; 在p7 的条件下,2 3
p8 56 ; 在p8 的条件下,3 2
p9 126 ; 在p9 的条件下,4 1
p10 252 ; 在p10 的条件下,5 0

这样
P10 的机会就是252/(l+6+21 +56+ 126+252),即252/462,亦即

6/11。

下一个球是白球的方法有

6+21×2+56×3+126×4+252×5,即1980 个,

而下一个球是黑球的方法有

5+4×6+3×21+2×56+126,即330 个。

所以白球所占的优势是1980 比330 即6 比1,因而挑出另一个白球的机
会是6/7。这又和拉普拉斯的公式相符合。

现在让我们看一看伯诺利的大数定律。我们可以具体说明如下:假定我
们抛掷n 次钱币,每出一次正面写上1,每出一次反面写上2,这样就形成许
多n 位数。我们将假定每个可能的序列只出现一次。这样如果n=2,我们就
有4 个数,11,12,21,22;如果n=3,我们就有8 个数,111,112,121,122,211,212,221,222;如果n=4,我们就有16 个数,1111,1112,1121,1122,1211,1212,1221,1222,2111,2112,2122,2211,2212,2221,。。
2222;以此类推。就上面表中最后一项来看,我们看出四位都是1 的有1 个
数,

三位是1 和一位是2 的有4 个数,

两位是1 和两位是2 的有6 个数,

一位是1 和三位是2 的有4 个数,

四位都是2的有1 个数。
1,4,6,4,1 这些数是(a+b)4中的系数。不难证明,与n 位数相对应的
数是(a+b)n中的系数。伯诺利定理的全部意义在于如果n 大,那么接近中
间的系数的和就几乎等于所有系数的和(后者等于2n)。这样如果我们在大
量抛掷当中把所有可能的正反面系列都算进来,其中绝大多数情况下两者都
几乎相等;另外随着抛掷次数的增加,大多数情况数和接近程度也随着无限
增加。

尽管伯诺利定理比起上面包含对于相等概然性进行抉择的说法更为一般
和确切,就我们现在的“概率”的定义来说,它却可以按照类似上面的方式
来加以解释。这是一件事实,即如果我们写出全部由不是1 就是2 组成的100
位数,那么大约有四分之一包含49 位或50 位或51 位是1 的数,有接近半数
包含48 位或49 位或50 位或51 位或52 位是1 的数,半数以上包含47 到51
位是1 的数,大约四分之三包含46 到54 位是1 的数。随着位数的增加,1
和2 几乎平均出现的数目占压倒优势的实例也就随着增加。

为什么这件纯属逻辑的事实被我们当成适当的理由,使我们在抛掷许多
次钱币时期待着事实上得到的几乎数目相等的正反面,那就是一个不同的问
题,其中除了涉及逻辑定律之外还涉及到自然律。我现在提到它的目的只在
于强调我现在不讨论这个问题。

我想强讽在上面的解释中没有谈到可能性,也没有谈到实际上涉及到无

知的问题。这里只是计算一下B 类的分子数目并确定它们当中同时属于A 类

的比例数。

有时人们认为我们需要一个等概率公理——例如说出正面和反面的概率

相等。如果这指它们事实上出现的频率接近相等,那么这个假定对于数学的

概率论就不是必要的,因为后者本身并不研究实际的事件。

现在让我们看一下有限频率的定义对于那些看来也许出了它的范围的一
些概然性实例的可能的应用。

首先:这个定义在什么条件下可以扩展到无限集合?因为我们已经把概
率定义为一个分数,并且因为分数在分子和分母为无限时无意义,所以只有
在有某种趋近一个极限的方法时才能扩展这个定义的范围。这就要求我们要
对之计算a 为b 的概率的那些a 形成一个系列,事实是一个级数,以便把它
们表示为a1,a2,a3,。。an,。。,这里对于每个有限整数n 来说都有一
个与之对应的an,反过来说也是一样。这时我们就可以用“pn”表示到an为
止所有a 属于b 的比例数。如果在n 增加时,pn趋近一个极限,我们就可以
把这个极限定义为一个a 将成为一个b 的概率①。可是我们还必须把pn。的
值围绕极限摆动的情况与pn只从一方面趋近极限的情况区别开来。如果我们

反复抛掷一块钱币,出正面的次数有时会超过总数的一半,有时又少于总数
的一半;这样pn。就围绕1/2 这个极限来摆动。但是如果我们估计到n 为止

的质数的比例数,这就是只从一方面趋近极限:对于任何有限的n 来说,pn
是一个确定的正分数,这个正分数在n 的值大的情况下接近于1/log n。现
在当n 无限增加时V/log n 趋近于零。这样质数的比例数趋近于零,但是我
们不能说“任何整数都不是质数”;我们可以说一个整数为质数的机会无限
小,但却不是零。显然一个整数为质数的机会比它比方说既是奇数又是偶数
的机会要大,尽管这种机会小于任何不管怎样小的有限分数。我认为当一个
a 为一个b 的机会严格说等于零时,我们就可以推论出“任何a 都不是一个
b”,但是当这种机会无限小时,我们却不能做出这种推论。

我们可以看到除非我们对于自然的进程做出某种假定,我们就不能在处

理一个用经验的方法得到定义的系列时使用趋近极限的方法。例如,如果我

们反复抛掷一块钱币,在进行过程中我们发现出正面的数不断趋近1/2 这个

① 这个极限要依靠a 的顺序,因此它是在把a 当作系列而不是当作类的情况下从属于a 的。

极限,这并不能使我们假定这就是在我们能使我们的系列变为无限系列时的
真正极限。举例说,可能有这种情况:如果n 是抛掷的次数,出正面的比例
数严格说并不接近1/2 而是接近

11 n

+ sin2 ;
24 N
其中N 是一个大数,大大超过我们在具体实验中所能得出的任何数。在这种
情况下,我们的归纳会在我们正在认为它们已经巩固建立起来的时候就开始
被经验界的证据所否定。或者可能发生这样的情况:对于任何经验界的系列
来说,经过一段时间,这个系列就变成毫无规律,在任何意义上说也不再趋
近一个极限。那么,如果上面所说的扩展到无限系列的范围可以用在经验界
的系列身上的话,我们就将要祈求某种归纳的原理。没有这个公理,我们就
没有理由期待这样一个系列的后面部分继续为前面部分所遵守的定律提供例
证。

在通常的经验界的概然性的判断中,例如天气预报中所包含的概然性的
判断,有着结合在一起需要分开的不同因素。最简单的假设——为了举例说
明已经把它过分简单化了——就是观察到某种预兆,而在这种预兆之后就以
前观察过的比方说百分之九十的实例来说都下雨。在这种情况下,如果归纳
论证和演绎论证同样确实可靠,我们就会说“下雨有百分之九十的概率”。
这就是说,现在这个时刻属于某一个类(由所说的出现预兆的时刻组成),
其中百分之九十是下雨以前的时刻。这是我们刚刚研究过的数学意义上的概
率。但是使我们不能确定是否将要下雨的因素并不只是这一点。我们对于这
种推论的正确性也还不能肯定;我们对于将来十次中有九次在出现所说的预
兆之后下雨这一点也感到没有把,握。这种怀疑可能有两种,一种是科学的,
另一种是哲学的。我们可能一方面保留对于一般科学程序的充分信赖,一方
面感到在这种情况下数据太少不能保证进行一次归纳,或者感到没有足够仔
细地消掉其它也可以出现和可能作为更为常见的雨的预兆的一些条件。或者
气象记录也可能不大可靠:记录可能让雨淋坏,或者让一个不久就被鉴定精
神失常的人弄得无法辨认。这类怀疑是在科学程序范围之内的事情,但是也
存在休漠提出的那些怀疑:归纳方法是正确的吗?或者它只是一种使我们感
到舒适的习惯?这些理由当中任何一个或全部都可能使我们对于由于我们的
证据才使得我们相信的百分之九十的下雨机会感到没有把握。

我们在这类实例中遇到了等级不同的概率。第一级是:天大概会下雨。
第二级是:我看到的预兆是大概会下雨的信号。第三级是:大概某些种类的
事件使得某些将来的事件具有概然性。在这三个等级中,第一级是常识所说
的概然性,第二级是科学中的概然性,第三级是哲学上的概然性。

在第一阶段中,我们已经观察到迄今为止十次中有九次B 跟随A 而发生;
所以在过去A 使得B 具有有限频率意义下的概然性。在这个阶段我们不加思
索就假定我们可以预料将来也会发生同样的事情。

在第二阶段中,即使不怀疑从过去推论出将来的一般可能性, 360 我
们也认识到这类推论应该受到某些保障,比方说穆勒的四种方法。我们还认
识到即使按照最好的规则行事,归纳也不是总能证实的。但是我认为我们的
方法仍然可以纳入有限频率说的范围之内。我们在过去已经做过一些归纳,
有些做得比较仔细,有些则较差。在那些按照某种方法做出的归纳当中,到
现在为止已经有一部分p 得到了证实;所以到现在为止这种方法已经对于它

所许可的那些归纳赋予概率p。科学方法大部分是由一些法则组成,通过这
些法则我们可以使p(由过去归纳的过去结果所证明的)更加接近于1。所有
这些仍然未出有限频率的范围,但是现在归纳却是我们估量频率的单独项
目。

这就是说,我们有A 和B 两个类,其中A 由按照某些规则完成的归纳组
成,B 由为迄今为止的经验所证实的归纳组成。如果n 是A 的分子数,m 是A
和B 的共同分子数,那么m/n 就是按照上面的规则进行的一次归纳将具有的
产生迄今所得到的那些在可以证实的情况下为真的结果的机会。

在这样说的时候,我们并没有使用归纳法;我们只是描述自然进程的一
个已经被观察到的特点。可是我们已经发现任何关于科学程序所提出的规则
的优越性(直到现在为止)的标准,并且我们已经发现这个标准就在有限频
率说的范围之内。唯一新鲜的地方就是我们现在所用的单位是归纳,而不是
单独的事件。我们把归纳当作发生的事件,而且只有那些实际发生的事件才
可以当作A 类的分子。

但是一旦我们主张一个迄今已被证实的归纳将要、或者大概将要被证
实,或者主张迄今已经提供大量迄今已被证实的归纳的那些程序法则将来也
很可能提供大量已被证实的归纳,我们就越过了有限频率说的范围,因为我
们是在处理数目未知的类。数学的概率论,和一切纯粹数学一样,尽管给我
们知识,却不能(至少就一种重要的意义来说)给我们任何新的知识;另一
方面,归纳则确能给我们某种新的东西,唯一的怀疑是它所给的东西是否是
知识。

到现在我还不想批判地去考察归纳;我只想说清楚归纳不能纳入有限频
率说的范围,即使通过把一个特殊归纳看成一类归纳中的一个这种办法也做
不到这一点,因为检验过的归纳只能为一个迄今尚未检验过的归纳提供有利
的归纳证据。那么,如果我们说那种归纳正确有效的原理具有“概然性”,
我们所说的“概然性”这个词的意思就不同于有限频率说中所说的“概然性”
的意思;我认为我们所说的“概然性”的意思一定就是我们说过的“可信的
程度”。(奇*书*网。整*理*提*供)

我总认为如果我们假定了归纳,或者任何我们认为可以代替归纳的公
设,那么所有精确的和可以度量的概率就都可以解释为有限频率。举例说,
假如我说“很可能有过佐罗亚斯特这个人”。为了证实这个陈述,我将首先
考虑在他这个事例上大家公认的证据,然后找出已知真实或虚妄的类似的证
据。这种概然性所依靠的类不是存在的或不存在的先知的类,因为把不存在
的先知包括在内就使得这个类变得内容有些含糊不清;这种概然性也不能只
依靠存在的先知这一类,因为有关宏旨的问题乃是佐罗亚斯特是否属于这一
类。我们将要采取的步骤如下:就佐罗亚斯特这个事例来说,有属于某一类
A 的证据;在所有属于这一类并且可以检验的证据当中,我们发现一部分P
是真实的;因此我们通过归纳推论出有一种概然性P 有利于佐罗亚斯特事例
中的相似证据。这样频率加上归纳就包括了概然性的这种用法。

或者假定我们象巴特勒主教那样,说“宇宙大概是造物主精心策划的结
果”。这里我们是从类似錶蕴涵錶匠这一类的次要论证来开始的。中国有一
种大理石,这种大理石有时碰巧能产生类似艺术家绘成的图画;我就曾经见
过最令人感到惊奇的一些实例。但是这种情况太罕见了,所以在我们看见一
张图画的时候我们有理由以很大的概然性(在假定归纳的情况下)推论出一

个艺术家来。那位当主教的逻辑学家所能做的,象他用他的书名来强调的那
样,只是证明这种类椎;我们认为这是可以怀疑的,但却不能纳入数学的概
率论中去。

因此,到现在为止,看来可疑性和数学的概率——后者是就有限频率的
意思来讲的——是自然律和逻辑法则之外唯一需要的概念。可是这个结论只
是暂时性的。在我们还没有考察某些另外提出来的“概然性”的定义之前,
我们是不能说出什么确定的意见的。

第四章米西斯—莱新巴哈的频率说

两个当时住在君士坦丁的德国教授所写的两本重要的书以不同于上章所

用的方式提出了关于概率的频率解释。①。。
莱新巴哈的著作是米西斯著作的发展,在各个方面都是同一理论的更好

的说明。因此我将只讨论莱新巴哈的著作。

莱新巴哈在列举出概率计算的公理之后,他就提出一种看来是由于见到

统计上的相互关连而想出的解释。他假定两个级数(X1,X2,。。xn,。。),。。

(y1,y2,。。yn; 。。),以及O 和P 两个类。有些x 或者所有x 属于O

类;莱新巴哈感到兴趣的问题是:与x 相对应的y 属于P 类的频率是多少?

举例来说,假定你在研究一位丈夫是否因为他的太太吩叨不休而想自杀
的问题。就这个事例来说,X 都是妻子,y 都是丈夫,O 类由吩叨不休的人组
成,P 类由自杀的人组成。然后已知一个妻子属于O 类,我们的问题是:她
的丈夫属于P 类的频率是多少?

让我们看一看两个系列中各自由前n 项组成的部分。假定在前n 个X 当
中,有a 项属于O 类,并且假定这些当中有b 项使得与x 相对应的y 属于P
类。(与x 相对应的y 和x 具有相同的下标。)这样我们说在从x1 到xn 的
整个部分中O 和P 的“相对频率”是b/a。[如果所有X 都属于O 类,那么a=n,而相对频率就是b/n ]我们用“Hn(O,P)”来表示这种相对频率。

我们现在进一步给“P 在已知O 的条件下的概率”下定义,这个概率我

们用“W(O,P)”来表示。这个定义是:W(O,P)是当n 无限增大时Hn(O,

P)的极限。

我们使用一点数理逻辑就可以使这个定义大大简化。首先,两个系列是
不必要的。因为我们假定两个系列都是级数,因而在它们的项目之间存在着
某种构成——对应关系的东西。如果这叫作S,那么说某一个y 属于一个P
类就等于说与它对应的X 属于那个由对于P 的分子当中某一个分子具有S 关
系的项目所组成的类。例如,设S 是妻子对于丈夫的关系;如果y 是一个结
过婚的人,并且X 是他的妻子,那么y 是一个政府官员这句话在并且只有在
X 是一个政府官员的妻子的情况下才为真。

其次,承认不是所有的X 都属于O 类这种情况并没有什么好处。这个定
义只有在无限数目的X 属于O 类的情况下才是适当的;在这种情况下,那些
属于O 类的X 形成一个级数,而我们就可以把其它剩下的部分忘记。这样如
果我们换用下面的说法,我们就把菜新巴哈的定义中最重要的部分保留下
来:

设Q 为一个级数,α是某个类,就α当中重要的实例来说,在Q 这个系

列中存在着比任何已知分子还要靠后的分子。设m 为α的分子在Q 的前n 个

分子当中的数目。那么我们把W(Q,α)定义为当n 无限增大时m/n 的极限。

也许是由于疏忽,从莱新巴哈的说法来看,好象概率的概念只适用于级
数,而完全不适用于
返回目录 上一页 下一页 回到顶部 0 1
快捷操作: 按键盘上方向键 ← 或 → 可快速上下翻页 按键盘上的 Enter 键可回到本书目录页 按键盘上方向键 ↑ 可回到本页顶部!
温馨提示: 温看小说的同时发表评论,说出自己的看法和其它小伙伴们分享也不错哦!发表书评还可以获得积分和经验奖励,认真写原创书评 被采纳为精评可以获得大量金币、积分和经验奖励哦!