宠文网 > 策略思维 > 第2章 准备接招

第2章 准备接招

书籍名:《策略思维》    作者:奈尔伯夫
字体大小:超大 | | 中大 | | 中小 | 超小
上一章目录下一章

1 .轮到你了,查理·布朗
连环漫画《花生》里有一个反复出现的主题,说的是露西(Lucy)将一个橄榄球按住,竖在地上,招呼查理·布朗(Charlie Brown)过去踢那个球。不过,每次到了最后一刻,露西总要拿走橄榄球,查理·布朗因为一脚踢空,仰天跌一跤,心怀不轨的露西就会高兴得不得了(如图2-1所示)。
任何人都会劝告查理·布朗不要上露西的当。即便露西去年(以及前年和再前一年)没有在他身上玩过这个花招,他也应该从其他事情了解她的性格,完全有可能预见她会采取什么行动。
就在查理盘算要不要接受露西的邀请跑去踢球的时候,她的行动还没有发生。不过,单凭她的行动还没有发生这一点,并不意味着查理就应该把这个行动看做是不确定性的。他应该知道,在两种可能的结果——让他踢中那个球以及让他仰天跌一跤——当中,露西倾向于后者。因此,他应该预见到,一旦时机到了,她就会拿走橄榄球。从逻辑推理得出的露西会让他踢中那个球的可能性实际上已经毫无影响。对这么一种可能性仍然抱有信心,套用约翰逊(Johnson)博士描述的再婚的特征,是希望压倒经验的胜利。查理不应该那样想,而应预见到接受露西的邀请最终会让自己仰天跌一跤。他应该拒绝露西的邀请。
2 .两种策略互动
策略博弈的精髓在于参与者的决策相互依存。这种相互影响或互动通过两种方式体现出来。第一种方式是相继发生,比如查理·布朗的故事。参与者轮流出招。每个参与者在轮到自己的时候,必须展望一下他的这一步行动将会给其他人以后的行动造成什么影响,反过来又会对自己以后的行动造成什么影响。
第二种互动方式是同时发生,比如第1章囚徒困境故事的情节。参与者同时出招,完全不理会其他人刚刚走了哪一步。不过,每个人必须心中有数,知道这个博弈游戏存在其他参与者,而这些人反过来也非常清楚这一点,如此类推。因此,每个人必须设想一下若是自己处在其他人的位置,会做出什么反应,从而预计自己这一步会带来什么结果。他选择的最佳策略也是这一全盘考虑的一个组成部分。
一旦你发现自己正在玩一个策略博弈,你必须确定其中的互动究竟是相继发生的还是同时发生的。有些博弈,比如橄榄球,同时具备上述两种互动元素。这时候你必须确保自己的策略符合整个环境的要求。在这一章,我们将粗略介绍一些有助于你玩相继发生的互动的博弈的概念和规则;而同时发生的互动的博弈将是 第3章的主题。我们从非常简单、有时候是设计出来的例子开始,比如查理·布朗的故事。我们有意这么做,毕竟,这些故事本身并不十分重要,而正确的策略通常也是通过简单的直觉就能发现的,这么一来,可以更加清晰地凸显其中蕴涵的概念。我们用到的例子会在案例分析以及以后的章节里变得越来越接近现实生活,也越来越复杂。
3 .策略的第一法则
相继出招的博弈有一个总的原则,就是每一个参与者必须预计其他参与者接下来会有什么反应,据此盘算自己的最佳招数。这一点非常重要,值得确立为策略行为的一个基本法则。
法则1:向前展望,倒后推理。
展望你的最初决策最后可能导致什么结果,利用这个信息确定自己的最佳选择。
在查理·布朗的故事里,做到这点对所有人来说应该都是不费吹灰之力的,只有查理·布朗除外。他只有两个选择,其中一个导致露西在两个可能的招数之间选择了一个。大多数策略情况都会涉及一系列更长的决策结果,每个结果都有几种选择,单是口头上进行推理实在是无法表述清楚。要想成功地运用这个向前展望、倒后推理的法则,我们需要一个更好的视觉辅助工具。一个涵盖了博弈当中全部选择的“树状图”就是这么一个工具。现在我们就来演示一下怎么使用这些树。
4 .决策树与博弈树
一系列需要向前展望、倒后推理的决策,甚至有可能出现在一个孤立的决策者面前,而这个人并非置身于一个有其他人参加的策略博弈中。对于走在黄树林里的罗伯特·弗罗斯特(Robert Frost) :
两条路在树林里分岔,而我
我选择人迹罕至的那一条,
从此一切变了样。[1]
我们可以画出这样一幅示意图(如图2-2 所示)。
许多人走的路
黄树林
人迹罕至的路
到此未必就不用再选择了。每一条路后面可能还会有分岔,图2-2 相应也会变得越来越复杂。以下就是我们亲身经历的一个例子。
从普林斯顿到纽约旅行会遇到几次选择。第一个决策点是选择旅行的方式:乘公共汽车、乘火车还是自己开车。选择自己开车的人接下来就要选择走费拉扎诺·奈罗斯桥、荷兰隧道、林肯隧道还是乔治·华盛顿桥。选择搭乘火车者必须决定是在纽瓦克(Newark)换乘PATH列车"还是直达纽约宾夕法尼亚车站。等到进入纽约,搭乘火车或公共汽车的人还必须决定怎样抵达自己的最后目的地,是步行、乘地铁(是本地地铁还是高速地铁)、乘公共汽车还是乘出租车。最佳决策取决于多种因素,包括价格、速度、难以避免的交通堵塞、纽约城里的最终目的地所在以及对泽西收费公路上的空气污染的厌恶程度,等等。
图2-3 描述了你在每一个岔道口面临的选择,看上去就像一棵枝叶繁茂的大树,所以称为“决策树”。如何正确使用这样一张图或这么一棵树呢?绝对不是选择第一个岔道口看上去最好的分枝,然后等到下一个岔道口出现再去思考接下来应该怎么办;相反,你应该预计到以后将面临的选择,利用这些信息倒过头来确定前面几个岔道口你应该怎么决断。举个例子,假设你要去华尔街,乘PATH火车就好于开车,因为这条铁路从纽瓦克直达华尔街。
公共汽车 市内交通
在纽瓦克换乘PATH列车 市内交通

普林斯顿 火车
直达宾夕法尼亚车站 市内交通
费拉扎诺·奈罗斯桥
小汽车 荷兰隧道
林肯隧道
乔治·华盛顿桥
我们可以通过一棵这样的树描述一个策略博弈当中的选择,不过,现在出现了一个新的元素。我们遇到一个有两个人或更多人参与的博弈。沿着这棵树出发,后面许多分枝可能是几个参与者轮流决策。每个参与者在前一个分枝做决策时必须向前展望,而且考察的范围不应仅局限于他自己的决策,还要包括其他参与者的决策。他必须对其他人的下一步决策进行预计,办法就是置身于其他参与者的地位,按照他们的思维方式进行思考。为了强调一下这个做法与前面一个做法的区别,我们把一棵反映一场策略博弈当中的决策次序的树称为“博弈树”,而把“决策树”留做描述只有一个人参加的情形。
虽然查理·布朗的故事简单得简直令人难以置信,不过,你还是可以通过将这个故事放进一棵博弈树,开始熟悉博弈树的概念。这个博弈从露西发出邀请开始,查理·布朗面临的选择是要不要接受邀请。假如查理拒绝邀请,那么这个博弈到此为止。假如他接受,露西就有两个选择,一是让查理踢中那个橄榄球,二是把球拿走。我们可以通过添加一个分枝的方法描绘这个故事。
正如我们在前面说过的那样,露西有两个选择,即图2-4中的上下两个分枝,查理应该预计到她一定会选择上面那个分枝。因此,他应该置身于她的地位,从这棵树上剪掉下面那个分枝。现在,回到他自己的两个选择,也是上下两个分枝,假如他选择上面那个分枝,结果一定是仰天跌一大跤。因此,相比之下,他更好的选择是沿着下面的分枝前进。
把球拿走
露西
接受
查理 让查理踢
拒绝
图2-4
为了进一步了解这个思路,我们不妨设想一个包含同样一棵博弈树的商界中的例子。我们不想惹恼任何一个真实存在的公司,在此先向格雷厄姆·格林(Graham Greene)道歉,我们借用的是他的例子:假设在卡斯特罗执政之前的古巴,吸尘器市场由一家名为“快洁”的公司独占,一家名为“新洁”的新公司正在考虑要不要进军这个市场。假如‘新洁”决定进入,“快洁”将面临两个选择:一是接纳“新洁”,和平共处,满足于一个与以前相比降低了的市场份额,二是打一场价格战。① 假设“快洁”接纳“新洁”;后者就可以赚得10万美元利润,但是,假如“快洁”发动一场价格战,就将给“新洁”造成20万美元的损失。假如“新洁”决定留在市场外而不进入,那么它的利润当然为零。下面我们画出这棵博弈树(如图2-5 所示),标明每一种结果会带来什么样的利润。
① 在格林(Greene)写的《我们在哈瓦那的人》(Our Man in Havana)一书中,为这两家公司当中一家工作的销售员决定打仗,只不过用的是毒药而不是价格。
接纳 新洁得10万美元
快洁
打价格战 新洁亏20万美元
进入
新洁
不进入 新洁得0 美元
图2-5
“新洁”应该怎么办?这是决策分析员需要解决的问题,也是商学院里讲授的问题。他们会画出一幅非常相似的图,却称之为“决策树”。理由是,他们通常把“接纳”和“打价格战”两种选择方案的结果看做偶然现象。因此他们会标出两者的出现概率。比如,假如他们认为接纳与打价格战出现的机会一样大,那么两者的概率同为1/2。接着,他们可以计算出“新洁”进人市场会得到多少利润,方法是将盈利和损失分别乘以相应的概率再相加。他们得到
1/2*$100000-1/2*$200000=-$50000
由于这是一个亏损数字,商业分析员们就会根据这些概率下结论说“新洁”不应该进军古巴市场。
以上的估计数字是从哪里来的呢?博弈论提供了答案:它们来自“新洁”自己对“快洁”在各种情形下的利润情况的估计。要估计“快洁”会怎么做,“新洁”首先应该估计“快洁”在不同情形下会得到多少利润。然后通过向前展望、倒后推理,预计对方会怎么做。进一步分析这个例子:我们假设“快洁”作为一个垄断者,有能力赚取30万美元利润。与“新洁”分享市场则意味着自己的利润降为10万美元。另外,从“快洁”这边估计,发动一场价格战的代价是10万美元。现在我们可以在这棵树上添加这些结果(如图2-6 所示)。
接纳 新洁得10万美元快洁得10万美元
快洁
打价格战 新洁亏20万美元快洁亏10万美元
进入
新洁
不进入 新洁得O美元快洁得30万美元
图2-6
我们利用这棵树包含的信息预计以后的全部招数。由于具体招数可以由这个博弈的结果确定,这棵树完全适合看做一棵博弈树,而不是一棵决策树。比如,要预计“快洁”对“新洁”进入的反应,我们知道,“快洁”接纳“新洁”的话仍会有10万美元利润,发动价格战则会损失10万美元;“新洁”应该预计到“快洁”会选择前者。向这个方向展望,同时倒后推理,“新洁”应该在盘算的时候先把打价格战这个分枝去掉。它应该进入这个市场,因为预计它可以赚到10万美元。
若是换了其他环境,最后的决策可能发生变化。比如,假设“新洁”下一步有可能继续进军“快洁”早已建立市场的其他岛屿,“快洁”大约会觉得有必要在这个新来者面前摆出一副不好对付的样子,宁可在古巴损失10万美元也要发动一场价格战。“新洁”应该看到,这意味着自己注定会损失20万美元,最后决定还是留在外面,不要硬闯的好。
“新洁”可以看出任何一个得失数字都会转化为相应的行动。不过,它自己可能并不知道“快洁”在这棵树的顶端会得到什么样的回报。这种利润的不确定性将会转化为行动的不确定性。比如,“新洁”可能认为,有33.3%的机会“快洁”会在一场价格战中损失10 万美元,有33.3%的机会双方会打个平手(利润为零),最后还有33.3%的机会“快洁”即便打价格战也能赚到12万美元。若遇到这种情况,“向前展望,倒后推理”会认为,有2/3 的概率“快洁”会选择接纳“新洁”——赚到10万美元总比损失10万美元或双方打个平手要好,只比不上赚到12万美元。因此,发动一场价格战的可能性是33.3%。要弄清究竟会发生什么情况,惟一途径就是进军市场。不过,基于上述可能性,“新洁”有2/3 的概率赚到10万美元,1/3 的概率损失20万美元,因此,它的预计利润实际为零,根本没有理由进军市场。
在这个例子里,“新洁”对于“快洁”的得失的不确定性直接转化为对“快洁”会有什么反应的概率估计。不过,我们必须注意应该在哪里加人这种不确定性。正确的地方是在树的末端。现在就来看看,假如我们在考虑的时候企图跳到前面去会犯什么错:平均而言,“快洁”可以在一场价格战当中赚到$6667(即1/3*$120000+1/3*$0-1/3*$100000 )。但这并不意味着“快洁”就一定想打价格战。愿意打价格战的可能性不是100%。而且这种不确定性并不表示我们就应该猜测“快洁”愿意打价格战的可能性是50%。对“新洁”而言,分析这个问题的正确思路是从这个博弈的终点着手,预计“快洁”每一步会怎么做。
5 .更加复杂的树
在现实生活里,你会遇到的博弈远比上述我们用来进行形象描述的例子复杂。不过,即便这些“小树苗”长成“大树”,同样的原理也依然管用。象棋(国际象棋)可能是最好的例子。虽然象棋的规则相对比较简单,却已经形成一种需要进行策略推理的博弈游戏。白棋先行,黑棋回应,双方依次相继移动。因此,象棋当中最“纯粹”的策略推理就包含着向前展望你自己这一步将会导致什么后果,就跟我们在前面看到的一样。其实例可能是这样:“假如我现在走兵,我的对手就会进马,威胁我的车。我在走兵之前必须用我的象护住那四个格子,不让对手的马得逞。”
象棋是一种相继出招的博弈游戏,我们可以用一棵树来表示。白方可以从20种开局方式中任选一种。[2]在图2-7 中,我们用这棵树的第一个决策点(或节点)表示白方拥有的第一个先行机会,标为W1。他可以选择的20种走法变成20个枝条,从这个节点发散出去。每一个枝条代表的行动方式就是这个枝条的标签:兵进K4 (P-K4 或代数标记法里的e4)、兵进Q4 ,等等。我们的目的只是描述普遍情况,因此,为了避免这幅图表变得枝节丛生,我们不会显示或标明所有枝条。每一个枝条都会引出下一个节点,代表黑方的第一次行动,标为B1。黑方同样可以从20种开局方式中任选一种,于是,同样会有20个枝条从每一个标明B1的节点发散出去。双方走完第一步,我们已经看到有400种可能性。从现在开始,枝条的数目就会取决于前面一步。举个例子:假如白方的第一步是P-K4 ,他的第二步就有许多选择,因为他的后以及王旁边的象现在都可以出动。然后你就会发现,建立这棵树所要运用的原理多么简单,而这棵树在实践中又会很快变得多么复杂。
我们可以选择这棵博弈树上每一个决策点(节点)的一个枝条,沿着这个枝条一路走下去。这表示这盘博弈继续下去的一种特定方式。象棋大师早在博弈初期(开局阶段)就盘算过许多这样的路径,考虑过这些路径会有什么结果。比如我们已经标出的路径,白方第一步是P-K4 ,黑方以P-QB4 回敬,就是预兆一场恶战的西西里防御。①
① 继续下去,就是第二步,N-KB3,P-Q3 ;第三步,R-Q4,PxP ;第四步,NxP , N-KB3;第五步,N-QB3 , P-QR3 ;第六步,B-KN5 , P-K3 ;第七步,P-KB4,Q-N3 ;第八步,Q-Q2,QxP 。这种走法称为毒兵变局(Poisoned pawn variation) ,听上去好像来自善于玩弄阴谋诡计的西班牙博尔吉亚家族(the Borgias)的宫廷,或是华尔街。
在许多博弈里,每一条这样的路径都会在有限次的选择之后到达终点。在体育或棋类比赛中,这可能是在一方取胜或双方打平的时候。更常见的情况是,博弈的最终结果可能是以给参与者货币回报、非货币回报或惩罚的形式出现。比如,商业对手之间的一场商界博弈可能给一家公司带来非常可观的利润,却使另一家公司破产。而核军备竞赛的博弈则可能达成一项成功的条约或导致两败俱伤。
假如一个博弈无论选择哪一条路径,都会在有限次的行动之后到达终点,我们在理论上就可以完全解决这个博弈。这意味着能找出谁将取胜以及他将怎样取胜。这是通过沿着这棵树倒后推理得出的。一旦我们走通了整棵树,我们就会发现我们究竟能不能取胜,还有,假如可以取胜,我们应该使用怎样的策略。对于任何一个相继选择并且数目有限的博弈,总是存在某种最佳策略。当然,存在一个最佳策略并不等于说我们总是可以轻而易举地找到这个最佳策略。象棋就是一个很好的例子。临到比赛结束之际,象棋大师在刻画最优策略方面一直做得非常出色。一旦棋盘上只剩下三四个棋子,大师级选手就能预见博弈的结局,(通过倒后推理)确定一方有没有一个万无一失的取胜策略,或另一方是否能迫使双方打平。接着,他们可以通过预计最后阶段的各种不同局势,评估中盘阶段的策略。问题在于,从来没有人可以一直倒后走通整棵树,直到开局的第一步。
一些简单的博弈可以用这样的方法得到完全解决。比如,3 x3 的连城游戏总是可以变成平局。① 这也是只有小孩才玩这个游戏而大人不屑一顾的原因。即便是西洋跳棋,也存在这个问题。大家都相信,第二个参与者总有办法达成平局,虽然这一结论尚未得到证明。为了保持大家对这种游戏的兴趣,西洋跳棋比赛让参与者从中局开始行动,在中局大家还看不出什么取胜或打平的策略。等到象棋也有可能用这种方法完全解决的那一天,象棋的规则大概也得进行修改了。
① 你也许觉得连城游戏是一种简单的博弈,但你还是不要指望能画出这裸博弈树。请注意,没有一局能在第五次行动之前走完,因为直到这时其中一方才第一次有机会在棋盘上放下三颗棋子,而此时枝条的数目已经达到9x8x7x6x5 = 15120 。当然,即便如此,这个博弈还是可以轻易解决,因为大多数枝条从策略上看是一模一样的。举个例子:虽然第一步有9种可能的走法,但这个博弈的对称性使我们不难发现,实际上这里只有3种完全不同的走法,即角、边线或中间。正是这样的小诀窍使这棵博弈树变得易于处理。
而在目前阶段,象棋参与者都做了什么呢?他们做了我们大家将相继移动的策略运用到实践中去的时候都应该做的事情:将向前展望分析与价值判断结合在一起。他们会问:“这条路在四五步之后会使自己争得一个有利局面,抑或陷入一个不利局面?”他们假设现在比赛已经结束,由此判断每一个可能的结果的价值。然后,他们选择那个五步之后可以达到最大价值结果的策略,向前展望,倒后推理。倒后推理是相对容易的部分。难的是怎样确定中盘局面的价值。每一个子的价值都要计算在内,同时要在吃子与取势两方面的优势之间进行权衡取舍。保罗·霍夫曼(Paul Hoffman)在他的《阿基米德的报复》(Archimedes' Revenge)一书中描述了汉斯·伯利纳(Hans Berliner)的电脑象棋程序。伯利纳是以通讯方式进行的象棋比赛的世界冠军,研制了一台专门用于下象棋的电脑,可以在每一步棋限定的3分钟之内检查3000 万种备选方案。伯利纳还确定了一个很好的规则,用于评估中盘局面的价值。能林够击败这个电脑程序的人不超过300名。在十五子棋比赛中,伯利纳也开发了一个程序,该程序已经使世界冠军俯首称臣。
将倒后推理的清晰逻辑与基于实践经验确定的、评估中盘局面价值高低的最佳规则结合起来,是处理远比象棋复杂的博弈的一种有用方法。
6 .讨价还价
无论在商界还是在国际政坛,参与各方经常通过讨价还价或者谈判来决定总收益这个“蛋糕”应该怎样划分。我们将在 第11章更详细地探讨这一现象。现在我们把它当做一个形象的例子,解释倒后推理这一方法怎样使我们得以预见相继行动的博弈的结果。
大多数人基于社会常识,预测一场谈判的结果就是妥协。这样做的好处是能够保证“公平”。我们可以证明,对于许多常见类型的谈判,一个50对50的妥协也是倒后推理的结果。
首先,我们必须认识讨价还价的两个普遍特征。我们必须知道谁向谁提出了一个什么条件,换言之,就是这个博弈的规则是什么;接着,我们还要知道,假如各方不能达成一个协定,将会导致什么后果。
不同的谈判按照不同的规则进行。在大多数零售店里,卖方会标出价钱,买方的惟一选择就是要么接受这个价格,要么到别的店里碰运气。① 这是一个简单的“接受或者放弃”的法则。而在工资谈判的例子中,工会首先提出一个价码,接着公司决定是不是接受。假如公司不接受,可以还一个价码,或者等待工会调整自己要求的价码。有些时候,相继行动的次序是由法律或者习俗决定的,还有些时候这一次序本身就具有策略意义。接下来,我们会探讨一个讨价还价的问题,在这个问题里,双方轮流提出条件。
① 有些顾客似乎可以在任何地方(甚至包括西尔斯百货公司)讨价还价。在这方面,赫伯·科恩(Herbo Coben)的著作《你可以就任何事情讨价还价》(You Can Negotiate Anything)提供了许多有用的小提示。
谈判的一个必不可少的特征在于时间就是金钱。假如谈判越拉越长,蛋糕就会开始缩水。不过,这时各方仍然可能不愿意妥协,暗自希望只要谈成一个对自己更加有利的结果,其好处就将超过谈判的代价。查尔斯·狄更斯(Charles Dickens)的《荒凉山庄》(Bleak House)描述了一个极端的情形:围绕贾恩迪斯(Jarndyce)山庄展开的争执变得没完没了,以至于最后整个山庄不得不卖掉,用于支付律师们的费用。按照同样的思路,假如不能达成工资协定而引发罢工,那么公司就会失去利润,工人就会失去工作。假如各国陷人一轮旷日持久的贸易自由化谈判,它们就会在争吵收益分配的时候丧失贸易自由化带来的好处。这些例子的共同点在于,参与谈判的所有各方都愿意尽快达成协议。

在现实生活中,收益缩水的方式非常复杂,不同情况缩水比例也不同。不过,我们可以用一种非常简单的方法充分阐明这一点:假设每提出一个建议或反建议,蛋糕都会朝零的方向缩小同样大小;设想这是一个冰淇淋蛋糕,孩子们一边争吵怎么分配,蛋糕一边融化。
首先,假设整个过程总共只有一步。桌子上放了一个冰淇淋蛋糕;一个孩子(Ali ,阿里)向另一个孩子(Baba ,巴巴)提议应该如此这般分配。假如巴巴同意,他们就会按照提议分享这个蛋糕;假如巴巴不同意,蛋糕融化,谁也吃不到。
现在,阿里处于一个强有力的地位:她使巴巴面临有所收获和一无所获的选择。即便她提出自己独享整个蛋糕,只让巴巴在她吃完之后舔一舔切蛋糕的餐刀,巴巴的选择也只能是舔一舔,否则他什么也得不到。
当然,巴巴可以因为感到这么分配太不公平而生气,断然拒绝接受这一条件。又或者,他可能希望建立或者保持自己作为一个不好对付的讨价还价者的形象,从而为日后的讨价还价奠定基础,而日后的讨价还价可能是跟阿里进行,也可能是跟其他得知今天自己所作所为的孩子们进行。在实际操作当中,阿里同样需要考虑到这些问题,要向巴巴放出刚好足够的诱饵(比如一小片蛋糕?) ,引诱他上钩。为简化阐述过程,我们将所有这些复杂问题搁在一边,假设阿里可以拿走她所要求的100%的份额。实际上,我们还可以不考虑留给巴巴舔的餐刀,假定阿里有能力提出“接受或者放弃”的条件,她可以得到整个蛋糕。①
① 同样的简化做法还将用在我们对更多回合的建议和反建议的讨论上。读者可以很方便地将我们的分析套用到一个更接近现实、但也更庞大的决策过程中,这个过程可以将我们在这里忽略的复杂情况包含在内。
一旦出现第二轮谈判,局势就会大大偏向巴巴。不妨再设想一下,现在桌子上放了一个冰淇淋蛋糕,但是两轮谈判过后,整个蛋糕就会融化。假如巴巴拒绝接受阿里提出的条件,他可以提出一个反建议,不过,到这时,桌子上只剩下半个蛋糕了。假如阿里拒绝接受巴巴的反建议,剩下的半个蛋糕也会融化,双方都会一无所获。
现在,阿里必须向前展望她最初提出的条件会有什么后果。她知道,巴巴可以拒绝她的条件,从而占据有利地位,反过来就剩下的半个蛋糕提出“接受或者放弃”的分配方案。这实际上意味着巴巴已经将那半个蛋糕掌握在自己手里。因此,他不会接受任何低于阿里第一轮条件的反建议。假如阿里不能阻止这一幕发生,她将一无所获。一旦看清了这一点,她会从一开始就提出与巴巴平分这个蛋糕,这正是刚好足够引诱对方接受而又为自己保有一半收益的条件。于是他们会马上达成一致,平分这个蛋糕。
说到这里,个中原理已经非常清楚,我们的讨论还可以再进一步。分析结果是相同的,要么加速谈判进程,要么延缓蛋糕融化速度。随着谈判各方提出每个建议和反建议,蛋糕也在融化,从一个变成2/3再变成1/3,直到零,什么也剩不下。假如阿里提出最后一个建议,而蛋糕已经缩小到只有1/3,她就可以全部拥有。巴巴知道这一点,所以在轮到自己提条件的时候(这时蛋糕还剩下2/3)许诺分给她1/3。这么一来,巴巴可以得到的最好结果就是1/3 个蛋糕,即剩下的2/3的一半。阿里知道这一点,所以从一开始就许诺分给巴巴1/3 (刚好足够引诱对方接受),自己得到2/3 。
各得一半的分配方案存在什么规律吗?每一次的步骤数目都是偶数,且这一现象反复出现。更重要的是,即便步骤数目是奇数,随着步骤数目增加,双方也会越来越接近一半一半的分配方案。
若是四步,巴巴得以提出最后一个条件,从而得到这个时候桌子上剩下的1/4个蛋糕。因此,阿里必须在倒数第二轮提出分给巴巴1/4 个蛋糕,当时桌子上还剩下半个蛋糕。而在此前的一轮,巴巴可以让阿里接受分给她剩下的3/4个蛋糕中1/4个蛋糕的条件。因此,一路这么向前展望下去,在讨价还价一开始,阿里就应该提出分给巴巴半个蛋糕,自己得到另一半。
若是五步,阿里一开始可以提出分给巴巴2/5个蛋糕,自己得到3/5 。若是六步,那么分配方案又回到各得一半。若是七步,阿里得到4/7,巴巴得到3/7。更为普遍的情况是,假如步骤数目是偶数,各得一半。假如步骤数目n是奇数,阿里得到(n+l)/(2n),而巴巴得到
(n-1)/(2n)。等到步骤数目达到101,阿里可以先行提出条件的优势使她可以得到51/101个蛋糕,而巴巴得到50/101 个。
在这个典型的谈判过程里,蛋糕缓慢缩小,在全部消失之前有足够时间让人们提出许多建议和反建议。这表明,通常情况下,在一个漫长的讨价还价过程里,谁第一个提出条件并不重要。除非谈判长时间陷入僵持状态,胜方几乎什么都得不到了,否则妥协的解决方案看来还是难以避免的。不错,最后一个提出条件的人可以得到剩下的全部成果。不过,真要等到整个谈判过程结束,大概也没剩下什么可以赢取的了。得到了“全部”,但“全部”的意思却是什么也没有,这就是赢得了战役却输掉了战争。
我们必须看到很重要的一点:虽然我们考虑过许多可能的建议和反建议,预期结果却是阿里的第一个条件能够被对方接受。谈判过程的后期阶段不会再发生。不过,假如第一轮不能达成一致,这些步骤将不得不走下去,这一点在阿里盘算怎样提出一个刚好足够引诱对方接受的第一个条件时非常关键。
这个观察结果反过来提示了另一种讨价还价策略。向前展望、倒后推理的原理可能在整个过程开始之前就已经确定了最后结果。策略行动的时间可能提前,在确定谈判规则的时候就已经开始。
同样的观察结果还会引出一个谜。假如讨价还价的过程真像这里阐述的那样,应该不会出现罢工。当然,罢工的可能性会影响最终达成的协议,不过公司会把握 第一个提条件的机会,提出一个刚好足以引诱对方接受的条件,工会也会这样做。罢工变成现实,或者更普遍的情况,即谈判破裂,一定是现实生活更微妙或者更复杂的特征引出的结果,而这些特征早已从上述这个简单的故事中排除出去,未予考虑。我们会在第11章探讨其中一些问题。
7 .战争与和平
倒后推理的另一个实例是怎样通过一系列双边谈判维护和平。我们举一个只有部分假设的例子:苏丹是一个相对弱小的国家,现在面临被其邻国利比亚人侵的危险。假如这两个国家在某种程度上都是与外界隔绝的,那么,要想阻止利比亚人侵并击败苏丹简直毫无可能。
尽管两个敌对邻居可能无法继续和平共处,但第三方的存在也许可以构成必要的制约。在利比亚与苏丹的例子里,这一原理可能会是“我的敌人的敌人就是我的朋友”。假如利比亚真要跟苏丹开战,那么,利比亚将不得不从东部与埃及接壤的边境抽调兵力。埃及当然不愿意贸然入侵一个全副武装的利比亚,不过,假如利比亚跟苏丹打仗而实力大减,埃及人也许会得到一个难以抗拒的大好机会,一举干掉这个麻烦的邻居。利比亚可以(或者至少应该)通过倒后推理,预计到一旦他们进攻苏丹,埃及就会人侵。表面看来,苏丹安全了。不过,在三个国家后面就停止继续思考这个问题,可能会造成一种虚假的安全感。
假如三个敌人可以达成稳定状态,四个又如何?现在加入以色列。假如埃及要打利比亚的主意,很有可能遭到以色列入侵。在萨达特(Sadat)和贝京(Begin)将双方关系正常化以前,这确实是埃及面临的一个严重威胁。在1978年以前,利比亚不必担心埃及入侵,就是因为埃及一想到以色列就战战兢兢,不敢大意。结果,苏丹不可能指望埃及来抑制利比亚的扩张野心。① 随着以色列与埃及关系改善,倒后推理的链条在埃及这里中断,而苏丹也安全了,至少目前是这样。
① 由此我们知道“我的敌人的朋友不是我的朋友”。
这个关于制约因素的例子当然经过了必要的格式化,这样它更加切合我们讨论的主题。从表面看来,这个例子说明,一个国家究竟会不会遭到入侵,将取决于潜在侵略者链条的节点数目是奇数还是偶数。一个更加接近现实生活的情况分析可以把国与国之间的复杂关系考虑在内,从而得到更多细节,用于分析一国入侵别国的企图究竟有多大。不过,还有一个重要的结论:博弈的结果在很大程度上取决于参与者的人数。参与的人越多越好,参与的人越少越糟,即便在同一个博弈里也是如此。但是,两个敌对国家难以和平共处、三个敌对国家就能恢复稳定局面的结论并不意味着若有四个敌对国家就更好;在这个例子里,四个的结果跟两个是一样的。②
② 实际上,假如这个链条存在的国家数目是奇数,那么,A是安全的。假如这个链条的节点数目是偶数,那么B就会人侵A;B发动入侵之后,链条上的节点数目就会减为奇数,B就安全了。
为了进一步阐述这个制约因素的观点,我们请读者研究本书最后一章“案例分析”的“三方对决”一节。三个敌对者,实力各不相同,现在必须决定自己应该袭击哪一个。你可能会发现答案令人大吃一惊。
8 .英国人玩的博弈
本章我们讨论了有序行动或者有序移动的博弈。实际上,现实生活当中没有几个博弈存在清晰界定而参与者又必须遵守的行动规则。参与者自己制定自己的规则。那么,他们怎么才能向前展望、倒后推理呢?他们又怎么才能知道这个博弈究竟有没有行动次序呢?
我们借用1987年英国大选的情形说明这一点。玛格丽特·撒切尔(Margaret Thatcher)领导的执政保守党面对以尼尔·金诺克(Neil Kinnock)为首的工党的挑战。大选期间,双方都要选择是走平坦大道,即以就事论事为原则进行竞选,还是走崎岖小径,即进行人身攻击。选民当中很大一部分人对撒切尔夫人的政绩深表满意,因此,假如双方按照相仿的规矩拉票,将出现整个竞选一面倒的局面,撒切尔夫人就会取胜。
金诺克先生的惟一希望,在于他可以通过风格完全不同的拉票活动,建立一个足以超越对手的好印象。现在我们假设,撒切尔夫人选择平坦大道,而他选择崎岖小径,或者两者调换选择,他的成功概率都是一样的。假设他们私下里都愿意选择平坦大道,但这一想法必须让位给取胜这一目标。
哪一条才是“人迹罕至”的路呢?答案取决于双方做决定的次序。我们现在就来考察一些可能出现的情况。
假设撒切尔夫人首先选择竞选风格,这是因为,比如说,就传统而言都是执政党在反对党之前公布自己的竞选纲领。这样,她可以画出下面的博弈树(如图2-8 所示)。
通过向前展望和倒后推理,撒切尔夫人可以预计,假如她选择平坦大道,金诺克先生一定会选择崎岖小径,反之亦然。① 既然两个方案赋予她的取胜概率相同,她愿意选择平坦大道。
① 苏格兰民歌《罗梦湖》(Loch Lomond)唱道:“噢,你走你的平坦大道,我走我的崎岖小径,我会比你早到苏格兰。”因此,我们必须指出,工党在苏格兰赢得了多数议席,虽然保守党以大比分赢得了整个英国大选。
撒切尔夫人先行会使她陷于不利,因为这么一来,金诺克先生就可以选择与其完全不同的道路。不过,她先行本身不会造成这个问题。现在我们在这个对局上做一个小小的修改。假设撒切尔夫人已经跟她的保守党顾问以及竞选宣传经理们开过会,确定了她的策略。但是这一决定“没有公开。金诺克先生也在开同样一个会议。他应该怎么做?他应不应该假设撒切尔夫人在先行的时候,是按照我们刚刚描述的方法进行推理的呢?那将意味着她已经选择了平坦大道,因此金诺克先生应该选择走崎岖小径。不过,假如撒切尔夫人想到金诺克先生也会这么想,她就会为自己选择崎岖小径的策略。金诺克先生并不确实知道她的选择,他若是忽略这么一种“第二层次”的思考,他就是一个大傻瓜。那么、他应不应该选择平坦大道呢?不一定,因为撒切尔夫人可以想到“第三层次”,如此类推。一个普遍的观点是若要运用向前展望、倒后推理的原理,不可缺少的前提是后行者可以观察到先行者的行动。
即便撒切尔夫人先行,而她的选择也是外人可以看到的,但如果她在竞选期间改变策略,又会发生什么情况呢?假设只有选民得到的最后印象才算数,而撒切尔夫人在第一次发表声明的时候说了什么无关紧要。金诺克先生绝不能信以为真,并据以制定自己的策略。反过来,撒切尔夫人在考虑自己应该怎么迈出第一步的时候,也不能指望金诺克先生只有一种反应方式。这样,我们就得到向前展望、倒后推理原理的另一个适用条件:策略必须是不可逆转的。
假如这两个条件有一个不符合,又会怎么样?即便两党是在不同时间做出各自的决定,就策略思维而言,这些决定就跟同时做出没有两样。从相继做出决定到同时做出决定的转变,可能对两党中的一方有利,也可能对双方都有利。实际上,在1987年的英国大选中,双方至少都改变了一次自己的策略。 第3章将提出同时进行的博弈的行动规则。
关于相继行动与同时行动的博弈的区别,体育比赛提供了另一个例子。百码短跑是同时行动的博弈,因为根本没时间排出相继行动的次序。而在蝶泳比赛中,运动员也许有时间进行思考,却会发现看清对手的位置是非常困难的。马拉松比赛具有相继行动的博弈的组成成分:运动员们可以看到其他人的位置(以一点为基准),策略也是不可逆转的,因为不可能回头重新比赛早先跑过的路程。
结束这一章的时候,我们回到查理·布朗要不要踢那个橄榄球的问题。在橄榄球教练汤姆·奥斯本(Tom Osborne)指挥冠军争夺战的最后几分钟,这个问题真的出现了。我们同样认为他做了错误的选择。倒后推理可以揭示错误的原因。
9 .案例分析之二:汤姆·奥斯本与1984年橙碗球场决赛的故事
在1984年的橙碗球场决赛上,战无不胜的内布拉斯加打谷者队( Nebraska Cornhuskers)与曾有一次败绩的迈阿密旋风队(Miami Hurricanes)狭路相逢。因为内布拉斯加队晋身决赛的战绩高出一筹,只要打平,它就能以第一的排名结束整个赛季。
不过,在第四节,内布拉斯加打谷者队以17:31 落后。接着,他们发动了一次反击,成功触底得分,将比分追至23:31。这时,内布拉斯加队的教练汤姆·奥斯本面临一个重大的策略抉择。
在大学橄榄球比赛中,触底得分一方可以从距离入球得分线只有2 1/2码的标记处开球。该队可以选择带球突破或将球传到底线区,再得2分;或者采用一种不那么冒险的策略,将球直接踢过球门柱之间,再得1分。
奥斯本选择了安全至上,内布拉斯加队成功射门得分,比分改写为24:31 。该队继续全力反击。在比赛最后阶段,他们最后一次触底得分,比分变成30:31 。只要再得1 分,该队就能战平对手,取得冠军头衔。不过,这样取胜总不大过瘾。为了漂亮地拿下冠军争夺战,奥斯本认为他应该在本场比赛取胜。
内布拉斯加队决定要用得2分的策略取胜。欧文·弗赖尔(Irving Fryer)接到球,却没能得分。迈阿密队与内布拉斯加队以同样的胜负战绩结束全年比赛。由于迈阿密队击败内布拉斯加队,最终获得冠军的是迈阿密队。
假设你自己处于奥斯本教练的位置。你能不能做得比他更好?
案例讨论
星期一出版的许多橄榄球评论文章纷纷指责奥斯本不应该贸然求胜,没有稳妥求和。不过,这不是我们争论的核心问题。核心问题在于,在奥斯本甘愿冒更大的风险一心求胜的前提下,他选错了策略。他本来应该先尝试得2分的策略,然后,假如成功了,再尝试得1 分的策略,假如不成功,再尝试得2分的策略。
让我们更仔细地研究这个案例。在落后14分的时候,奥斯本知道他至少还要得到两个触底得分外加3分。他决定先尝试得1分的策略,再尝试得2分的策略。假如两个尝试都成功了,那么使用两个策略的先后次序则无关紧要。假如得1分的策略失败,而得2分的策略成功,先后次序则仍然无关紧要,比赛还是以平局告终,内布拉斯加队赢得冠军。先后次序影响战局的惟一可能性在于内布拉斯加队尝试得2分的策略没有成功。假如实施奥斯本的计划,这将导致输掉决赛以及冠军锦标。相反,假如他们先尝试得2分的策略,那么,即便尝试失败,他们仍然未必输掉这场比赛。他们仍然以23:31落后。等到他们下一次触底得分,比分就会改为29:31 。这时候,只要他们尝试得2分的策略得手,比赛就能打成平局,他们就能赢得冠军头衔!①
① 而且,这将是尝试取胜的努力失败之后导致的平局,因此没有人会批评奥斯本,说他一心想打成平局。
我们曾经听到有人反驳说,假如奥斯本先尝试得2分的策略,那么,如果没有成功,他的队将只能为打平对手而努力。但这么做不是那么鼓舞人心,并且他们很有可能不能第二次触底得分了。更重要的是,等到最后才来尝试这个已经变得生死攸关的得2分的策略,他的队将陷入成败取决于运气的局面。这种看法是错的,有几个理由。假如内布拉斯加队等到第二次触底得分才尝试得2分的策略,一旦失败,他们就会输掉这场比赛。假如他们第一次尝试得2分的策略失败,他们仍然有机会打平。即使这个机会可能非常渺茫,但有还是比没有强。激励效应的论点也站不住脚。这是因为,虽然内布拉斯加队的进攻可能在冠军决赛这样重大的场合突然加强,但迈阿密队的防守也会加强。这场比赛对双方是同样重要的。相反,假如奥斯本第一次触底得分之后就尝试得2分的策略,在一定程度上确实存在激励效应,提高第二次触底得分的概率。这也使他可以通过两个三分球打平。
从这个故事中可总结的教训之一在于,假如你不得不冒一点风险,通常都是越早冒险越好。这一点在网球选手看来再明显不过了:人人都知道应该在第一发球的时候冒风险,第二发球则必须谨慎。这么一来,就算你一发失误,比赛也不会就此结束。你仍然有时间考虑选择其他策略,并借此站稳脚跟,甚至一举领先。

上一章目录下一章
本站所有书籍来自会员自由发布,本站只负责整理,均不承担任何法律责任,如有侵权或违规等行为请联系我们。