友情提示:如果本网页打开太慢或显示不完整,请尝试鼠标右键“刷新”本网页!
思考,快与慢-第10部分
快捷操作: 按键盘上方向键 ← 或 → 可快速上下翻页 按键盘上的 Enter 键可回到本书目录页 按键盘上方向键 ↑ 可回到本页顶部! 如果本书没有阅读完,想下次继续接着阅读,可使用上方 "收藏到我的浏览器" 功能 和 "加入书签" 功能!
“启发”这一术语是指协助寻找各种难题的恰当答案的简单过程,虽然找到的答案常常并不完美。这个词和希腊语eureka(意为“找到了”)是同根词。
我和阿莫斯在共同工作的早期就想到了替代这一概念,它也是启发法和偏见研究法的核心内容。我们自问:人们在对可能性没有任何了解的情况下,是如何成功作出可能性判断的呢?我们得出的结论是,人们一定不知道通过什么方式将不可能完成的任务简单化了,由此,我们开始研究他们是如何做到这一点的。我们的答案是,当人们按照要求对可能性作出判断时,他们实际上是对其他的事情作了判断,并且认为自己已经完成了判断可能性的任务。遇到很难的“目标问题”时,如果脑海中马上出现了一些与之相关联且容易回答的“启发性问题”的答案,系统1通常便会采取这种“替代”的做法,采用替代问题的答案。
用一个问题替代原来的问题是一个解决难题的好策略,乔治·波利亚(George Polya)在他的经典著作《怎样解题》(How to Solve It)中提到了替代问题:“如果你无法解决某个问题,就去解决另外一个简单点的问题好了一去找这个简单的问题吧。”波利亚的启发法是系统2有意实施战略性决策的过程。不过,我在本章讨论的启发法案例并不是精心挑选的,而是思维发散性造成的结果,是我们锁定问题答案控制能力不强的结果。
请看下面的“目标问题”。它们都很难,在给出合理的答案之前,你肯定会先处理些其他难题。幸福的含义是什么?未来6个月会有哪些可能的政治动向?其他金融犯罪的标准量刑是什么?候选人的竞争有多激烈?还有哪些环境因素或者其他原因需要考虑?想要真正解决这些问题根本不可能。但是你不要受制于完全理性的答案,经过认真推理之后,可以找到启发性的替代答案,尽管这种方法有时很好用,而有时却会导致严重的错误。
目标问题启发式问题
你愿意为拯救濒危物种捐多少钱?
你这些天对生活满意吗?
今后6个月里总统受欢迎的程度如何?
欺骗老人的理财顾问应受到何种惩罚?
这位竞选总统的女士能在政治道路上走多远?
启发式问题
想到垂死的海豚时,我的情绪波动有多大?
我现在的心情如何?
总统现在有多受欢迎?
想到金融骗子,我会有多生气?
这位女士看上去像是个政治赢家吗?
思维的发散性可以使懒惰的系统2摆脱很多繁重的工作,快速找到难题的答案。“启发式问题”相对于“目标问题”更容易让人产生联想并作出回答。你对海豚和金融骗子的感觉,你现在的心情,你对自己看好的竞选人政治能力的印象,或者总统现在的立场等,都会立即呈现在你的脑海中。启发式问题给每个有难度的目标问题都准备了一个现成的答案。
上述说法中存在一定的不足:没有指出答案应该与原始问题存在关联。例如,我对垂死海豚的感觉一定要用钱来表示,这一点让人费解。而系统1的另一项能力,即强度匹配,可以解决这个问题。情感和捐款都是按强度分级的。我对海豚的感情可能很强烈,也可能很淡薄,而我捐款的数目会与我对海豚的感情强度相匹配,我脑海中出现的钱数就是匹配量。相似的强度匹配可能适用于所有的问题。例如,不同竞选者的政治表现可以从很糟糕到非常出众。同样,衡量政治成功等级也包括“她在首次竞选就会出局”的最差表现和“她将来会成为美国总统”的最佳表现。
思维发散性的自主过程和强度匹配可以使能映射到目标问题的简单问题有一个或多个答案。有些情况下会有替代答案,系统2会认可这一启发式答案。当然,系统2也可以拒绝这个直觉性答案,或者通过整合其他信息来改变它。但是,一个懒惰的系统2往往会遵循最省力法则,不经检验就认可某个启发式答案。你不会被难倒,也不必非常努力,甚至都没有注意到自己其实答非所问。此外,你也许都注意不到目标问题很难,因为你的头脑中会很迅速地闪出一个直觉性答案。
立体启发法:远处的物体看上去更高大
一些德国学生作过的一项调查堪称替代研究的最佳案例之一。这些年轻人完成的调查包括下面两个问题:
你最近觉得幸福吗?
你上个月有多少次约会?
实验人员对这两个问题的答案的关联度很感兴趣。那些回答自己有很多次约会的学生会比那些约会次数少的人更幸福吗?令人吃惊的是,答案是否定的,两个答案的关联度几乎为零。显然,学生在评价自己的幸福感时,首先想到的并不是约会。
另一组学生也看到了这两个问题,但次序正好相反:
你上个月有多少次约会?
你最近觉得幸福吗?
这一次的结果完全不同。在这种顺序下,约会次数和幸福感之间的相关度能达到心理测试的最高水平。其间发生了什么呢?
原因很明确,这就是替代作用的典型案例。约会显然不是这些学生生活的重心(第一次调查中,幸福和约会并不相关),但当实验者要求他们回想自己的浪漫生活时,他们确实有情感上的回应。有多次约会的学生想起了自己生活中快乐的事,而那些没有约会的学生想起的都是孤独和被拒绝的情节。因此看到第二个问题时,由(第一个)约会问题引起的那些情感就在大家的脑子里徘徊,影响他们对这个问题的回答。
上例中体现的心理活动和图9中的体型错觉带给人的心理体验很相似。评价“最近的幸福感”这种任务并不常见,也不简单,需要仔细思考之后才能给出恰如其分的回答。但是,提到约会情况,这些学生就无须努力思考了,因为他们脑海中早已有了相关问题的答案。这个相关问题就是:他们对自己的恋爱生活满意程度如何。他们将被问及的问题替换成了另一个自己心中已经有了答案的问题。
在这个实验中,我们同样可以采用与错觉研究相同的做法,可以问一问:这些学生感到困惑了吗?他们是否真的认为这两个问题,他们被问及的问题和他们回答的那个问题,是相同的?当然不是。学生不会一下子把浪漫时光和生活混为一谈,如果让他们说说对这两个词的理解,他们肯定会说浪漫时光和生活不是一回事,但其实他们需要回答的问题并不是两个概念是否相同,他们的问题是最近是否感到幸福,于是系统1就用已有的答案来作答了。
约会的案例并非特例,如果这些参与实验的学生先看到的问题是与父母或金钱的关系,而后马上看到那个关于幸福的问题,也会发生同样的情形。在两种情况下,满足感在特殊情况下影响了关于幸福感的表达。任何影响人心情的重要情感问题都会产生同样的效果。眼见即为事实。当人们评估自己的幸福感时,他们思维状态的作用就显得非常突出。
情感启发式:因为喜欢,所以认同
一旦加入情感因素,结论对论证的主导作用便会最大程度地凸显出来。心理学家保罗·斯洛维克(Paul Slovic)提出了“情感启发式”的概念,认为人们的好恶决定了他们的世界观。你的政治倾向决定了你对各类论证的看法,即它们是令人信服的还是难以服众的。如果你对当前的医疗政策还满意,就会相信该政策能给自己带来很多好处,而且你相信在这个政策下,花同样的钱能做更多的事。如果你对其他国家采取鹰的态度,就很可能会觉得其他国家相对弱小,更有可能对自己的国家俯首帖耳。而如果你的态度像只鸽子,就会觉得它们更强,不会轻易受到牵制。你对辐照食品、瘦肉、核能、文身或摩托车等事物的态度会左右你对这些事物的感受,它们是惠及生活还是充满风险。如果你对这些事物通通都不喜欢,很可能会觉得它们对你而言利少弊多,根本不会给你的生活带来什么好处。
结论的至高无上并不意味着你的思维完全停止运转了,也不意味着你可以完全忽略信息和合理解释得出自己的结论。在了解到自己并不喜欢的一项活动的风险其实远比自己想象的小时,你的看法乃至情绪就会发生变化(至少会有那么一点变化)。然而,这种较低风险的信息同样也会改变你对该活动益处的看法(你认为益处会更大),尽管你接收到的信息中没有任何与益处相关的信息。
在此我们又看到了系统2的另一个“特性”。到目前为止,我似乎已经将其描述成一个给系统1留有足够余地的默许监视器。我描述的系统2还具有主动搜寻记忆的功能、复杂计算功能、比较功能、规划功能和决策功能。在球拍和球的问题中以及许多其他的两个系统相互作用的例子中,系统2似乎总是处于最高决策地位,并有能力抵制系统1的建议,它能使事情放缓,开始进行逻辑分析。自我批评是系统2的功能之一。但在态度方面,系统2更像是系统1各种情感的赞许者而非批评者,也可以说是其各种情感的转让者而非实施者。它搜寻的信息和论据多半局限于与已有看法一致的信息,并不着意对其进行调查审核。积极且追求连贯的系统1为要求不高的系统2提供了各种解决方案。
示例:替代和启发法
“还记得我们绞尽脑汁去回答的那个问题吗?我们是不是把它换成了一个简单点的问题呢?”
“别人问我们的问题是这位候选人是否会成功,但我们要回答的问题似乎是她是否能成功应对采访。咱们还是别顾左右而言他了。”
“他喜欢这个项目,因此他认为该项目投入少、回报高。这是情感启发式的一个典型案例。”文人小说下载
“我们将去年的表现作为依据来预测公司未来几年的表现。这个依据能作为有效参照吗?我们还需要其他什么信息才能作出正确预测?”
下面列出了系统1的特点和活动。每个主动句都代替了一个陈述句,虽然表述更精确了,但却更难理解了,因此大脑便开始自主且快速地运行。我希望这个对大脑特性的描述能帮你形成一种对虚拟的系统1各种“特性”的直觉认识。与身边的很多人一样,你对系统1在不同情况下如何运作会有直觉的认识,而且其中大多数直觉都是正确的。
系统1的特点生成印象、感觉和倾向;当系统2支持这些行为时,它们就会成为信仰、态度和意图。自主且快速运行,只需付出较少努力,甚至不用付出努力,没有自主控制的感觉。当发现(搜寻)特殊形式时,能接受系统2编控来调动注意力。在接受了一定的训练后,能够做出熟练的回应,产生直觉。为联想记忆激发出来的各种想法创造连贯形式。将认知放松感和真理错觉、愉快的感觉以及放松的警惕感联系起来。区分常态中令人惊奇之事。推断原因和意图。忽略歧义,按捺住心中的疑问。夸大情感的一致性(光环效应)。将注意力集中在当前的证据上,忽略不存在的证据(眼见即为事实)。作一些基本估测。通过常态和原型来表现集合,但不要将两者看成一个整体。通过测量确定不同程度对应的匹配物(比如音量的大小)。真正去计算,而不是空想(思维的发散性)。有时用简单点的问题替代难题(启发法)。对变化的感知比对形态的感知更敏锐(前景理论)。对可能性作出过高估计。对数量越来越不敏感(心理物理学)。对损失的反应比获得更强烈(损失厌恶)。严密设计决策问题,分别进行讨论。
第二部分 启发法与偏见
第10章 大数法则与小数定律
一项研究对美国3141个县的肾癌发病率进行了调查,调查显示该病的分布模式很值得注意。发病率最低的县差不多都位于中西部、南部和西部人口稀少的乡村,这些区域按照惯例由共和党管辖。对此,你有何看法?
刚刚过去的几秒钟里,你的大脑处于非常活跃的状态,这主要是因为系统2在运行。你谨慎地在记忆中搜寻着并作出假设。在这个过程中你也付出了一定的努力,你的瞳孔会扩张,心跳会适度加快。系统1也没有闲着,因为系统2的运行需要从联想记忆中获取事实和建议。你很可能会否认共和党的政策提供了肾癌防控方法这个想法,却会关注肾癌发病率低的县大多是乡村这个事实。这个例子是我从机智的统计学家霍华德·维纳(Howard Wainer)和哈里斯·泽维林(Harris Zwerling)那儿得到的,他们对这一案例的评论是:“人们很容易作出推断,认为肾癌发病率低主要是由于乡村的生活方式很健康,没有空气污染和水污染,食品没有添加剂,保证新鲜。”这一点完全说得通。
现在,考虑一下肾癌发病率最高的县的情况吧。假设这些易发病的县差不多都位于中西部、南部和西部人口稀少的乡村,这些区域按照惯例由共和党管辖。霍华德·维纳和哈里斯·泽维林半开玩笑地评论道:“人们可以很容易作出推断,导致肾癌高发病率的直接原因是乡村生活的贫困,医疗条件差、高脂肪饮食、酗酒、嗜烟等。”当然这种说法肯定有问题,因为乡村生活方式不可能既是肾癌发病率高的原因又是其发病率低的原因。
问题的关键并不在于这些县处在乡村地区或是由共和党掌管,而在于乡村地区人口少。我们通过这个例子学到的不是流行病学知识,而是我们的大脑和统计数据之间的复杂关系。系统1非常擅长一种思维模式,自动且毫不费力地识别事物之间的因果联系,即使有时这种关系根本就不存在,它也会这样认定。当听到肾癌高发地区的情况时,你立刻会想当然地认为这些县与其他县不同是有原因的,一定有个理由可以解释这种不同。然而,正如我们所见,当系统1面对“纯统计学”的数据时是束手无策的,因为这些数据虽然可以改变结果出现的概率,却不能直接导致结果的发生。
根据定义,一个随机事件是不需要解释的,但一连串的随机事件就有规律可循。想象有一个装有大理石弹球的瓮,其中有一半的弹球是红色的,另一半弹球是白色的。然后,再想象有一个非常有耐心的人(或一个机器人)随意从瓮中取出4个大理石球,记录其中的红球数,再把球放回去,重复这样的做法数次。总结记录结果时,你会发现“2红2白”的结果出现的次数(几乎刚好)是“4个全红”或“4个全白”这种结果的6倍。这一倍数关系是个数学事实。你可以对这种从瓮中反复抽样的结果作出自信的预测,就像你能预测到用锤子砸鸡蛋的结果一样。尽管你无法预见蛋壳破碎的具体细节,但大概结果还是很确定的。两件事的不同之处在于:你想到锤子砸鸡蛋时感受到的那种明确的因果联系,在瓮中取样的设想中是找不到的。
相关的统计学事实与癌症那个例子也有联系。两个耐心的计数者轮流从瓮中取大理石球,杰克每次拿出4个球,吉尔拿出7个。他们都记录了每次拿到相同颜色弹球的次数,要么全白,要么全红。如果他们取球的做法持续的时间足够长,杰克拿到同颜色大理石的次数会是吉尔的8倍(两人的预期概率分别为12。5%和1。56%)。这个结果与锤子无关,也与因果联系无关,这仅仅是一个数学上的事实:一次拿4个弹球与一次拿7个相比,出现极端结果的概率更大。
现在,将美国人口想象成一个巨大的瓮中的弹球。有些球上标有KC(即Kidney Cancer的简称)字样,表示肾癌。你抽取弹球样本,并依次按照所在县摆放,你会发现乡村地区的样本要比其他地区的少。如同杰克和吉尔所做的那个游戏一样,极端的结果(非常高或非常低的癌症发病率)容易出现在人口稀少的县,这个故事告诉我们的就是这些。
我们从一个令人费解的事实说起:肾癌的发病率在各县有所不同,且是有规律的,我用统计学理论对此作了解释:相比于大样本,极端的结果(高发病率和低发病率)更容易出现在小样本中。这样的解释不存在因果联系。某县的人口稀少既不会引发癌症,也不能避免癌症,只会使癌症的发病率比人口稠密地方的发病率更高(或更低)。这就是真相,没什么可解释的。在某个人口稀少的县,癌症发病率并非真的比正常情况更低或更高,只是这个县正好在某个特殊的年份赶上了抽样调查罢了。如果我们在第二年重复这样的分析,也能预测到在小样本中出现极端结果的一般模式,但在前一年癌症发病率高的县,这一年发病率并不一定高。如果是这样的话,则人口稠密或稀少的因素就无法对发病率作出解释了:这些表面因素就是科学家眼中所谓的假象,即观察结果完全依赖于调查方法的某一方面,在这个案例中,则依赖于样本大小。
我刚才说的例子也许会令你惊讶,但这并不是真相初次大白于天下。你早就知道应该更相信大样本,并且即使是对统计学一无所知的人也听说过大数法则。但是“知道”并非是非抉择问题,你可能会发现下列陈述放在自己身上很合适:当你阅读这个关于流行病学的例子时,并没有立刻注意到“人口稀少”这一特点与此次调查有何关联。对于采用4个样本还是7个样本所产生的不同结果,你至少会感到有一点惊讶。即使是现在,想要确定下面两个陈述句所说的完全是一回事,你也要费些脑力:
(1)大样本比小样本更精确。
(2)小样本比大样本产生极端结果的概率大。
第一个表述清晰地陈述了一个事实,但直到感受到第二个表述传达给你的意思,你才意识到自己并没有真正理解第一个表述的意思。
上述内容概括起来就是:没错,你知道大样本的结果更精确,但你现在可能才意识到你并不清楚为什么它们更精确。不仅你一人如此,阿莫斯与我在一起进行的第一个研究表明,即使是经验丰富的研究人员对样本效应也缺乏直觉,要么就是理解不到位。
小样本的出错风险可能高达50%
没有接受过统计学方面训练的人是出色的“直觉性统计学家”。我与阿莫斯在20世纪70年代早期的合作便始于对这个观点的讨论。他对我(在大学)的研究班及我本人讲过,密歇根大学的一些研究人员对直觉性统计抱有乐观态度。我个人对那个观点有种强烈的感觉:那段时间我发现自己并不是一个出色的直觉性统计学家,但是我也不相信别人会比我好多少。
对于一个研究型心理学家来说,样本变差没有什么特别的。它是个烦人且损失又大的麻烦事,会把每项实验都变成一场赌博。试想你希望证明6岁女孩的平均词汇量比同龄男孩的词汇量更丰富的假设。这个假设从整体来说是成立的,女孩的平均词汇量确实要比男孩的丰富一些。然而,尽管男孩与女孩差别很大,但你很可能会抽取到男女相差不太明显的样本,甚至会抽到一个男孩比女孩词汇测试成绩还要好的样本。如果你是那个研究者,这个结果对于你来说代价就太高了,因为它浪费了你的时间和精力,却无法证实一个实际正确的假设。使用一个足够大的样本是降低这种风险的唯一方法。选择小样本的研究者只能看自己是不是能选对合适的样本了。
想要对样本错误的风险作出评估,只需通过一个相当简单的步骤就可以实现。然而按照惯例来看,心理学家并不是通过计算来选定样本大小的。他们听从自己的判断,但这些判断往往是错的。在与阿莫斯发生意见分歧不久之前,我读过一篇文章,文章通过生动的观察结果展示了研究人员所犯的错误(他们现在仍在犯这种错误)。该文作者指出心理学家选择的样本通常都很小,致使他们有50%的风险不能够证实其正确的假设,而任何研究人员都不会在头脑清醒的情况下接受这种风险。对此有一个貌似正确的解释,即心理学家对于样本大小的决定反映了他们普遍存在的一个直觉性错误观念,即对于样本变差范围的错误看法。
这篇文章令我十分震惊,因为我在自己的研究中碰到了一些问题,却在这篇文章中找到了相关解释。与大多数研究型心理学家一样,我也墨守成规地选择了一些过小的样本,因此得到的实验结果毫无意义。现在,我知道了原因:那些奇怪的结果实际上就是我这种研究方法的典型产物。我的错误特别令人尴尬,因为我教过统计学,也知道该怎样计算样本的大小,以便将风险降至可以接受的程度。但是,我从未通过计算来确定样本大小。和我的同事一样,我被传统所禁锢,相信自己设计实验的直觉,也从未认真考虑过样本选择会带来的那些风险。阿莫斯来参加研讨会时,我已经意识到自己的直觉是错误的。在研讨会中,我们很快达成共识,密歇根的那些乐观派是错误的。
我与阿莫斯开始调查一个问题:只有我自己这么愚蠢还是我只是众多愚蠢的人之一,我们通过一项测试来证实这个问题,测试对象为一些数学家,想看看这些人是否也会犯类似的错误。我们设计了一份调查问卷,其中描述了真实的
快捷操作: 按键盘上方向键 ← 或 → 可快速上下翻页 按键盘上的 Enter 键可回到本书目录页 按键盘上方向键 ↑ 可回到本页顶部!
温馨提示: 温看小说的同时发表评论,说出自己的看法和其它小伙伴们分享也不错哦!发表书评还可以获得积分和经验奖励,认真写原创书评 被采纳为精评可以获得大量金币、积分和经验奖励哦!