宠文网 > 策略思维 > 第3章看穿对手的策略

第3章看穿对手的策略

书籍名:《策略思维》作者：奈尔伯夫

每个星期，《时代》和《新闻周刊》都会暗自较劲，非要做出最引人注目的封面故事不可。一个富有戏剧性或者饶有趣味的封面，可以吸引站在报摊前的潜在买主的目光。因此，每个星期，《时代》的编辑们一定会举行闭门会议，选择下一个封面故事。他们这么做的时候，很清楚在某个什么地方，《新闻周刊》的编辑们也在关起门来开会，选择下一个封面故事。反过来，《新闻周刊》的编辑们也知道《时代》的编辑们正在做同样的事情，而《时代》的编辑们也知道《新闻周刊》的编辑们知道这一点……
这两家新闻杂志投入了一场策略博弈，不过，这个博弈从本质上看跟我们已经讨论过的博弈存在很大差别。第2章讨论的博弈是由一系列相继进行的行动组成的。查理·布朗在选择要不要踢那个橄榄球时，心里明白露西现在还没有决定要不要拿走那个球；在象棋里，白方与黑方交替行动。相反，《时代》与《新闻周刊》的行动却是同时进行的。双方不得不在毫不知晓对手的决定的情况下采取行动。等到彼此发现对方做了什么，再想做什么改变就太迟了。当然，这个星期的输家下个星期很可能竭力反扑，不过，等到那时，在这个日新月异的世界上说不定已经出现了一个完全不同的新的故事模式，开始了一场完全不同的博弈。
这两种博弈所要用到的策略思维和行动在本质上存在天壤之别。对于第2章讨论的相继行动的博弈，每个参与者不得不向前展望，估计对手的反应，从而倒后推理，决定自己这一轮应该怎么走。这是一条线性的推理链：“假如我这么做，另一个参与者会那么做——若是那样，我会这么反击”，依此类推。
而在同时行动的博弈里，没有一个参与者可以在自己行动之前得知另一个参与者的整个计划。在这种情况下，互动推理不是通过观察对方的策略进行，而是必须通过看穿对手的策略才能展开。要想做到这一点，单单假设自己处于对手的位置会怎么做还不够。即便你那样做了，你又能发现什么？你只会发现，你的对手也在做同样的事情，即他也在假设自己处于你的位置会怎么做。因此，每一个人不得不同时担任两个角色，一个是自己，一个是对手，从而找出双方的最佳行动方式。与一条线性的推理链不同，这是一个循环——“假如我认为他认为我认为……”。诀窍在于怎样破解这个循环。
夏洛克·福尔摩斯（Sherlock Holmes）和他的死对头、罪恶魔头莫里亚蒂（M噢riarty）教授擅长这类推理，对此我们一点都不觉得惊讶。正如福尔摩斯在《最后的问题》里告诉华生（Watson）的：
“我要说的其实已经在你的脑海闪过。”他说。
“那么我的答案大概也已经在你的脑海闪过。”我答道。
你就和华生医生一样，大概也在揣摩福尔摩斯怎么未卜先知。听完我们的解释，我们希望你会同意这其实相当简单。
你怎样才能看穿所有那些错综复杂而又看不见的策略呢？首先，你不要把其他参与者的未知行动视做天气那样，具有与个人无关的不确定性。上班之前，《时代》的编辑可能收听天气预报，知道今天下雨的概率是40%，他大概会利用这个信息去决定要不要带一把雨伞去上班。但《新闻

周刊》将会采用哪个特定主题作为封面故事的概率则完全是另外一回事。
区别在于，《时代》的编辑对《新闻周刊》有一个非常中肯的了解——另一个杂志的编辑与天气不同，他们是策略的博弈参与者，就跟《时代》的编辑自己一样。① 即便一个编辑不可能真的观察到另一个杂志的决定，他也可以通过另一个杂志的视角思考这个问题，尝试确定它现在一定在做什么。
① 有些人相信，自然界也是一个策略博弈的参与者，而且心肠狠毒，整天想着怎样破坏我们早已定下的计划，以从中取乐。比如，当你听说下雨的概率是40%，这意味着，有六成概率是你带了雨伞上班而老天爷又没有下雨，另有四成机会则是你忘带雨伞而老天爷偏偏下起雨来。
在第2章，我们可以提供一个单一的、统一的原理，为相继行动的博弈确定最佳策略。这就是我们的法则1：向前展望，倒后推理。在这一章，事情不会那么简单。不过，关于同时行动必不可少的思维方式的思考可以总结为指导行动的三个简单法则。反过来，这些法则又基于两个简单概念：优势策略与均衡。与第2章一样，我们也会通过简单的例子解释这些概念和法则。
1 ．优势策略
在棒球比赛里，假如一方已经有两个人出局，而又打出三个坏球和两个好球，那么，任何一名进攻上垒的球员都必须在下一次投球的时候跑向下一垒。这可以通过琢磨各种可能的情形得出来。在大多数情况下，攻垒球员怎么做无关紧要。假如击球手碰不到球，要么出现第四个坏球而攻垒球员成功上垒，要么出现第三个好球而这一局结束。假如投球手投出界外球，攻垒球员只消退回原先所在的垒。假如这是一个擦棒球而又被接住，那么这一局就结束了。不过，有一种情况跑动攻垒占有优势，即假如击球手将投球击到界外，那么攻垒球员就有很好的机会上垒或者得分。
我们认为，在这种局面下，跑动攻垒就是优势策略，即某些时候它胜于其他策略，且任何时候都不会比其他策略差。一般而言，假如一个球员有某一做法，无论其他球员怎么做，这个做法都会高出一筹，那么这个球员就有一个优势策略。假如一个球员拥有这么一个策略，他的决策就会变得非常简单；他可以选择这个优势策略，完全不必担心其他对手怎样行事。因此，寻找优势策略是每一个人的首要任务。
一旦你知道自己在找什么，你就会发现这个东西无所遁形，我们身边其实到处都是优势策略的有趣例子。比如印第安纳·琼斯（Indiana Jones）在电影《印第安纳·琼斯与最后的十字军东征》（Indiana Jones and the Last Crusade）的最紧张局势时所处的地位。印第安纳·琼斯、他的父亲以及纳粹分子全都聚集在安放圣杯的地方。眼看纳粹分子只差一步就要得到圣杯，琼斯父子却无论如何不愿意助封为虐。于是，纳粹分子打了琼斯父亲一枪。只有具备起死回生力量的圣杯才能救老琼斯博士的命。在这种情况下，琼斯只好引他们走向圣杯。不过，前面还有一个最后的挑战：琼斯必须在十几个杯子当中做出选择，选出耶稣基督用过的圣杯。圣杯可以使人永生不死，其他杯子却会致人于死地。纳粹头子迫不及待地拿起一个华丽的黄金杯，喝下里面的圣水，却突然倒地而死，因为他选错了，那不是圣杯。琼斯选了一个木头杯，那是一个木匠用的杯子。他一边大叫“只有一个办法可以证实”，一边将杯里的水倒出一点在圣水器上，自己先喝了下去，希望自己选中的就是生命之杯。当琼斯发现自己没搞错，立即把杯子送到他父亲那里，圣水果然治愈了致命的枪伤。
虽然这一幕增添了紧张气氛，但在一定程度上却让我们感到难堪，因为一个像印第安纳·琼斯博士那样了不起的教授，居然会看不到他的优势策略。他本来应该先把杯子递给他父亲，没有必要自己亲身尝试。假如琼斯确实选对了杯子，那他父亲就会得救。假如他选错了杯子，那他父亲就会丧命，却至少可以保全琼斯。在将杯子递给他父亲之前自己测试一下其实毫无用处，这是因为，假如琼斯选错了杯子，那就再也没有第二次机会了——琼斯将死于致命之水，而他父亲也会死于致命枪伤。①
① 这个例子同时指出博弈论的弱点：人们单凭行为导致的结果给行为打分，行为本身则变得无足轻重。比如，即便印第安纳·琼斯的父亲已经受了致命枪伤，琼斯可能还是不愿意为导致父亲死亡的行为承担责任，一定要亲身试饮那杯水。
相比之下，寻找优势策略会比寻找圣杯容易一些。不妨想想英国桂冠诗人艾尔弗雷德·丁尼生爵士（Alfred,Lord Tennyson）那令人耳熟能详的名句：“爱过之后失去总比从来没有爱过好。”[1]换言之，爱是一种优势策略。
2 ．封面之战
回到《时代》与《新闻周刊》的竞争上来。假设有一个星期出了两桩大新闻：一是众议院和参议院就预算问题吵得不可开交；二是发布了一种据说对艾滋病有特效的新药。编辑们选择封面故事的时候，首要考虑的是哪一条新闻更能吸引报摊前的买主（订户则无论采用哪一条新闻做封面故事都会买这本杂志）。在报摊前的买主当中，假设30％的人对预算问题感兴趣，70％的人对艾滋病新药感兴趣。这些人只会在自己感兴趣的新闻变成封面故事的时候掏钱买杂志；假如两本杂志用了同一条新闻做封面故事，那么感兴趣的买主就会平分两组，一组买《时代》，另一组买《新闻周刊》。
现在，《时代》的编辑可以进行如下推理：“假如《新闻周刊》采用艾滋病新药做封面故事，那么，假如我采用预算问题，我就会得到整个‘预算问题市场’（即全体读者的30% ) ，假如我采用艾滋病新药，我们两家就会平分‘艾滋病新药市场’（即我得到全体读者的35%) ，因此，艾滋病新药为我带来的收入就会超过预算问题。假如《新闻周刊》采用预算问题，那么，假如我采用同样的故事，我会得到15％的读者，假如我采用艾滋病新药，就会得到70％的读者；这一次，第二方案同样会为我带来更大的收入。因此，我有一个优势策略，就是采用艾滋病新药做封面。无论我的对手选择采用上述两个新闻当中的哪一个，这一策略都会比我的其他策略更胜一筹。”
我们可以借助一个简单的表格，更加迅速而清晰地看出这番推理的逻辑性。我们用图3-1 中的两列表示《新闻周刊》的对应选择，用两行表示《时代》的对应选择。这时我们得到四个格子，每一个格子对应一组策略。格子里的数字代表《时代》的销量，用购买《时代》的读者数占全体潜在读者数的百分比显示。第一行显示的是假如《时代》选择艾滋病新药，它在《新闻周刊》选择艾滋病新药或者预算问题的两种情况下的销量。第二行显示的是假如《时代》选择预算问题，它在《新闻周刊》选择艾滋病新药或者预算问题的两种情况下的销量。比如说，在左下角或者西南方向的格子，《时代》选择预算问题，《新闻周刊》选择艾滋病新药，结果《时代》得到30％的市场。
这个优势策略很容易看出来。第一行的两个格子无一例外都比第二朋行对应的格子占优，因为第一行的两个数字都比排在同一列下面的数字大。这是优势地位的特征。通过这个表格，你可以很快就看出这个特征是不是符合。你可以想像自己用第一行覆盖在第二行上面，然后会发现，盖住第二行的是更大的两个数字。相比之下，这个表格在阐述前面一段话的时候具有压倒语言推理的直观优势，而这种优势随着博弈的复杂程度加大而越发明显。在复杂的博弈当中，各方都有好几个策略。
《新闻周刊》的选择艾滋病新药预算问题
图3-1《时代》的销售
同理，在这个博弈里，双方都有一个优势策略。为了解释这一点，我们为《新闻周刊》的销量也画了一个表格（如图3-2 所示）。第一列数字显示的是假如《新闻周刊》采用艾滋病新药，它在《时代》采用艾滋病新药或者预算问题的两种情况下各有多大销量。这一列的两个数字无一例外都比第二列对应的数字占优，你可以再次想像自己拿起第一列覆盖在第二列上时会发现什么。因此，艾滋病新药对《新闻周刊》来说也是优势策略。
《新闻周刊》的选择艾滋病新药预算问题
图3-2 《新闻周刊》的销售
以策略观点来看，各方均有一个优势策略的博弈是最简单的一种博弈。虽然其中存在策略互动，却有一个可以预见的结局：全体参与者都会选择自己的优势策略，完全不必理会其他人会怎么做。但这一点并不会降低参与或者思考这种博弈的趣味性。比如，在百码短跑中，优势策略是能跑多快就跑多快，但许多人还是很喜欢参加或者观看这种比赛。在第1章提到的捷尔任斯基广场牢房出现的囚徒困境中，两个参与者都有一个优势策略，只不过这股压倒一切的力量最终将他们引向了一起倒霉的结局。这就提出了一个很有意思的间题：参与者怎样合作才能取得一个更好的结果？我们会在下一章进行更详细的探讨。
有时候，某参与者有一个优势策略，其他参与者则没有。我们只要略微修改一下《时代》与《新闻周刊》的封面故事大战的例子，就可以描述这种情形。假设全体读者略偏向于选择《时代》。假如两个杂志选择同样的新闻做封面故事，喜欢这个新闻的潜在买主当中有60％的人选择《时代》，40％的人选择《新闻周刊》。现在，我们画出《时代》的销量表格（如图3-3 所示）。
图3-3《时代》的销售
对于《时代》，艾滋病新药仍然是优势策略，但对于《新闻周刊》，销量表格则变成下面这样（如图3-4 所示）。
假如你拿起第一列，覆盖在第二列上，你会发现，30被一个较小的数字（28）覆盖，而12却被一个较大的数字（70 覆盖。没有一个策略占有压倒优势。换言之，《新闻周刊》的最佳选择不再与《时代》的策略无关。假如《时代》选择艾滋病新药，《新闻周刊》选择预算问题就能得到更好的销量，反之亦然。对于《新闻周刊》，得到整个预算问题市场总比得到一个较小份额的艾滋病新药市场要好，虽然整个艾滋病新药市场比预算问题市场要大。
图3-4《新闻周刊》的销售
《新闻周刊》的编辑们不会知道《时代的编辑们将会选择什么，不过他们可以分析出来。因为《时代》有一个优势策略，那一定就是他们的选择。因此，《新闻周刊的编辑们可以很有把握地假定《时代》已经选了艾滋病新药，并据此选择自己的最佳策略，即预算问题。由此可见，只有一方拥有优势策略的博弈其实也非常简单。拥有优势策略的一方将采用其优势策略，另一方则针对这个策略采用自己的最佳策略。
现在，既然我们已经介绍了优势策略的概念，就有必要强调两点特征，这两点特征可用来确定什么不是优势策略。人们很容易就会弄糊涂，不知道优势策略的优势究竟是对什么而言的。
1981年，伦纳德·西尔克（L俄onard Silk）在撰写有关国会对《经济复苏税法》争论的新闻时这样概括：“里根先生（Mr.Reagan）早已料到共和党人拥有博弈论中称为‘优势策略’的东西，一个使参与者领先其对手的策略，无论这些对手采用什么策略，结局都是一样。”[2] 我们将在第5章更加仔细地介绍这个博弈，在这里想指出的是，西尔克对优势策略的定义并不正确。“优势策略”的优势是指你的这个策略对你的其他策略占有优势，而不是对你的对手的策略占有优势。无论对手采用什么策略，某个参与者如果采用优势策略，就能使自己获得比采用任何其他策略更好的结果。回顾封面大战的例子，《时代》和《新闻周刊》都有一个优势策略，但双方都不可能得到比对方更高的销量。
另一个常见的误解在于，一个优势策略必须满足一个条件，即采用优势策略得到的最坏结果也要比采用另外一个策略得到的最佳结果略胜一筹。在前面讲到的例子里，所有优势策略凑巧都满足这个条件。按照最初设定的条件，《时代》假如采用艾滋病新药做封面故事，最坏的结果是得到35％的市场份额；他们若采用预算问题做封面故事，可能得到的最佳结果是30％的市场份额。但这并非优势策略的一个普遍特征。
现在让我们想像一下《时代》和《新闻周刊》之间爆发了一场价格战。假设每本杂志的制作成本是1美元，且售价只有两个可能的价位选择，分别是3美元（意味着每本利润为2美元）和2美元（意味着每本利润为1美元）。假设顾客永远倾向于选择价格较低的杂志，且在杂志价格相同的时候两种杂志各得一半读者。杂志定价3美元的时候，读者总数是500万；杂志价格降到2美元，读者总数将升到800 万。这时，你可以轻易算出《时代》在4种可能出现的价格组合里将会获得多少利润，并由此得出图3-5 。
图3-5《时代》的利润
《时代》的优势策略是定价2美元（《新闻周刊》亦如此）。《时代》采用这个优势策略可能得到的最坏结果是赢利400万美元。但是，采用另外一个策略可能得到的最佳结果将超过这一数字，达到500万美元。问题是比较这两个数字毫无意义。500万美元的数字是在两本杂志同时定价3美元的时候出现的；不过，假如这时《时代》把价格降到2美元，利润还会更高，达到800 美元。
我们可以把这些例子归纳为一个指导同时行动的博弈的法则。
法则2：假如你有一个优势策略，请照办。
不要担心你的对手会怎么做。假如你没有一个优势策略，但你的对手有，那么就当他会采用这个优势策略，相应选择你自己最好的做法。提醒一句：我们已经确立了同时行动的博弈的优势策略的概念。若是换了相继行动的博弈，采用优势策略的时候就要格外留神。因为策略互动的本质已经改变，优势策略的概念也会完全不同。假设我们说你有一个优势策略，无论你的对手选择怎么做，你按照这个策略做都比采用其他策略更好。若是相继行动，而你的对手先行，你就应该一直选择自己的优势策略。正如我们已经说过的那样，这是你对你的对手每一个行动的最佳对策，因此也是对现在他选择的这个特定行动的最佳对策。但是，假如你先行，你就不会知道你的对手将会采取什么行动。他会观察你的选择，同时做出自己的决定，因此你有机会影响他的行动。某些情况下，若是采用优势策略以外的策略，你可能更有效地施加这种影响。我们将在第6章讨论承诺的时候全面分析这个问题。
3 ．劣势策略
不是所有博弈都有优势策略，哪怕这个博弈只有一个参与者。实际上，优势与其说是一种规律，不如说是一种例外。虽然出现一个优势策略可以大大简化行动的规则，但这些规则却并不适用于大多数现实生活中的博弈。这时候我们必须用到其他原理。
一个优势策略优于其他任何策略，同样，一个劣势策略则劣于其他任何策略。假如你有一个优势策略，你可以选择采用，并且知道你的对手若是有一个优势策略他也会照办；同样，假如你有一个劣势策略，你应该避免采用，并且知道你的对手若是有一个劣势策略他也会规避。
假如你只有两个策略可以选择，其中一个是劣势，那么另一个一定是优势策略。因此，与选择优势策略做法完全不同的规避劣势策略做法，必须建立在至少一方拥有至少三个策略的博弈的基础之上。现在就让我们看一个这种类型的简单例子。
设想一场橄榄球比赛的一次对抗。攻方一门心思竭尽全力向前推进，能跑几码算几码，而守方则全力以赴阻挡对方向前移动，寸步不让。举个例子：当比赛只剩下很少时间，攻方可能希望尽力推进，使自己更容易得到一个射门得分的机会。
假如攻方只有两个策略，即带球跑动或者传球，而守方则有三个策略——拦截带球跑动，拦截传球以及闪击四分卫（blitz the quarterback）。我们可以计算出全部六种策略组合分别能使攻方向前推进多少码的距离。以守方选择闪击四分卫而攻方打算传球为例。假设四分卫被撞得倒退10码的概率是10% ，迅速传球传出10码的概率是70% ，而传球传出更远达到20码的概率是20％。那么，平均值就是
0.1l*(-10)+0.7*10+0.2*20 ＝-1+7+4 =10
显而易见，这些数字本应该以两队拥有或者缺少的特殊技能为基础；我们只不过为了描述方便而选择了一些非常独特的技巧。①
① 在这个例子里，攻方善于传球，不善于带球跑动。因此，即便是在对方集中防御传球的时候，选择传球还是会比带球跑动更好。带球之所以比闪击四分卫更好，是因为防守后卫不在他们的位置上。
我们用图3-6 显示所有六种策略组合将会得出怎样的计算结果。
图3-6攻方期望得到的码数
如图3-6所示，攻方竭力要得到最大数目，守方则尽量压低这个数目，因此，我们没有必要分开列表确定他们的行动。①
① 所有零和博弈都会出现这样的情况，而零和博弈是指一方所得等于另一方所失。
双方都没有一个优势策略：没有一行的数字完全高于另一行，也没有一列的数字完全低于另一列。不过，守方倒是有一个劣势策略，就是闪击四分卫。闪击四分卫的结果是无论如何都会拱手让出较大的码数，因此，这一策略对于守方而言会比它采用其他可能的策略都更糟糕。因此，守方不应该闪击四分卫，攻方也可以非常自信地认定对手不会那么做。
至此，这场推导尚未结束。闪击策略可能从守方教练的笔记本中删除了，整个比赛可以被视为双方各有两个策略。在这场经过简化的比赛中，攻方有一个优势策略，就是传球。其数字分别是9和8，都大于带球跑动策略的数字，分别是3和。传球之所以不是原来的比赛的优势策略，原因在于，带球跑动的结果在守方采取闪击策略的时候会有一个比较理想的结果（因为带球者可能趁守方闪击四分卫而分身无术时，顺利突人开阔地带），而现在闪击策略已经不予考虑。因此，攻方将会选择传球。反过来，守方也会想到这一点，选择自己的最佳策略，即防守传球。
这里涉及的普遍适用的概念可以归纳为一个指导相继移动的博弈的行动法则。
法则3 ：剔除所有劣势策略，不予考虑，如此一步一步做下去。
假如在这么做的过程当中，在较小的博弈里出现了优势策略，应该一步一步挑选出来。假如这个过程以一个独一无二的结果告终，那就意味着你找到了参与者的行动指南以及这个博弈的结果。即便这个过程不会以一个独一无二的结果告终，它也会缩刁整个博弈的规模，降低博弈的复杂程度。
我们以一个虚构的波斯湾海军对峙局势具体描述逐步剔除劣势策略的做法。② 图3-7 所示的格栅代表战斗舰艇的方位以及可能的选择。I点的一艘伊拉克舰艇准备发射一枚导弹，企图击毁A点的一艘美国舰艇。这枚导弹的路径已经由电脑程序在发射的时候确定，可以直线前进，也可以每隔20秒大幅转动一个直角。假如这枚伊拉克导弹笔直从I点飞向A点，美国导弹防御系统可以非常轻易地进行拦截。因此，伊拉克一定会尝试带点拐弯的路径。所有能从I点通向A点的路径已经由下面的格栅显示出来。每条边的长度，比如IF的长度，等于这枚导
②这个故事是J.D.威廉斯（J.D.Williams）在《完全策略大师》（The Compleat Strategyst）一书中描绘的猫捉老鼠游戏的一个更新版本。猫可能指的就是波斯人。弹20 秒之内可以走过的距离。
那艘美国舰艇的雷达会监测到伊拉克舰艇发射的这枚导弹，因此电脑会马上发射一枚反导弹。反导弹的速度和伊拉克导弹相同，也可以做同样的90度拐弯。于是，这枚反导弹的路径也可以用同样的格栅表示，只不过这次是由A点出发。但是，为了填装足够撞毁一枚导弹的爆炸物，反导弹不得不少装燃料，装的燃料只够它飞行1分钟，因此，它只能走过三个节点（比如，从A 到B点，B点到C点，然后再从C点到F点，这一路径我们用ABCF表示）。
图3-7
假如在这1分钟开始之前或者结束之际，我们的反导弹将与来犯的导弹相遇，那么，反导弹就会爆炸，消除伊拉克导弹的威胁，否则伊拉克导弹就会击中我们的舰艇。问题是，应该怎样选择两枚导弹的路径？在这个博弈里，值得关注的只有第1分钟的路径。各方必须事先想好三个20秒时间段应该怎么走。将每个时间段的可能选择加起来，双方各有8条可能的路径，共有64种组合方式。我们现在就来考察全部64种组合方式，计算哪些方式下反导弹和导弹会迎头相撞，哪些方式下不会相撞。
举个例子：假设伊拉克选择IFCB，即头两个时间段直线从I点经F点到C点，然后转90度到B。对照美国的ABCF策略，可见，反导弹和导弹将在两个时间段（即40秒）之后在C点相遇，因此这一组合的结果是相撞。假如伊拉克还是采取IFCB策略，而美国却选择ABEF迎击，反导弹和导弹就不会相撞。表面上看来，上述弹道都经过B点和F点，但反导弹和导弹是在不同时间达到这些点；比如美国反导弹20秒后到达B点，而伊拉克导弹则要在60秒后到达。
图3-8显示了所有这样的组合。伊拉克的8个策略分别标为I1到I8，同时标出具体路径，比如I1表示IFCB。同样地，美国的策略用A1到A8表示。相撞的结果记做H，不会相撞的结果记做O。
图3-8 击中与错过图
图3-8看起来好像很复杂，但只要借助消除劣势策略的法则，就能将其大大简化。美国反导弹的目标在于得到相撞的结果，因此在美国人看来，H强于O。不难看出，对于美国人，A2策略与A4策略相比处于劣势：假如你将A4行举起，盖在A2行上面，你会发现，只要是A2 得到H的地方，A4也会得到H，而且A4还多一个H，即对应伊拉克巧策略的地方。对全部可能性进行这样的分析，可以知道A2、A3、A6和A7策略与A4和A8策略相比处于劣势，A1不及A8, A8又不及A4。因此，伊拉克人可以确信美国人只会采取A4或者A8策略。伊拉克人把注意力集中在这两行，一心想避免反导弹和导弹相撞，因此在他们看来，I2、I3、I4、I6、I7和I8策略与I1或者I5策略相比处于劣势。划掉劣势策略所在的行和列之后，整个博弈就简化为图3-10 。*
*简化过程详见图3-9。——译者注
我们的两个法则不可能将图3-10进一步简化了，因为这里已经没有任何优势策略或者劣势策略可言。不过，我们已经做得很不错了。看一看表格里剩下的策略，我们发现，伊拉克导弹应该沿着格栅外围前进，而美国反导弹则应该小步曲折前进。这样，我们很快就能看到双方应该怎样从各自拥有的两个方案中进行抉择了。
图3-9，击中与错过图
图3-10，简化的击中与错过图
4 ．均衡策略
利用优势策略方法与劣势策略方法进行简化之后，整个博弈的复杂程度已经降到最低限度，不能继续简化，而我们也不得不面对循环推理的问题。你的最佳策略要以对手的最佳策略为基础，反过来从你的对手的角度分析也是一样。接下来我们将会介绍解开这个循环的技巧，最终走出这个循环。
为了说明这一点，我们首先回到《时代》与《新闻周刊》的价格战，不过这次不会假设备选价格只有2美元和3美元两种，而是一系列价格。现在，《时代》的管理层必须针对《新闻周刊》可能选择的每一个价格确定最佳对策。假设每种杂志都有一群忠实读者，也有一群可能受到价格竞争影响的流动读者。如果出于某种原因，《新闻周刊》的管理层把价格定在1美元的水平，也就是制作成本的水平，那么，《时代》的管理层一定不会跟随这个毫无盈利的价格策略，而会定出一个较高的价格，杂志仍然可以卖给忠实读者而获得一定利润。如果《新闻周刊》提价，那么《时代》也会提价，只不过幅度较小，从而为自己赢得一定的竞争优势。假定《新闻周刊》每提价1美元，《时代》的最佳对策是提价50美分，于是，我们可以用图3-11表示《时代》针对《新闻周刊》可能选择的每一个定价而确定的最佳对策。
我们假定两本杂志的成本一样，具有同等大小的忠实读者群以及同样的吸引流动读者群的能力。那么，《新闻周刊》针对《时代》可能选择的每一个定价而确定的最佳对策将与图3-11完全一致。
现在我们可以想像两种杂志的经理正各自埋头琢磨。《时代》的经理说：“如果他卖1美元，我就卖2美元。不过，他因为知道我这么想，所以不会真的卖1美元，而是执行他在我卖2美元时的最佳对策，即2.50 美元。那样的话我就不能卖2美元，而是采用我在他卖2.50 美元时的最佳对策，卖2.75 美元。不过，他因为知道我这么想…… ”这样一层一层分析下去，究竟有完没完呢？
有的，结局是3美元。假如这位《时代》经理认为《新闻周刊》会卖3美元，那么他自己的最佳对策就是也卖3美元，反过来，从《新闻周刊》的角度分析也是一样。整个循环推理最后将聚成一点。
我们可以用图3-12 来显示这个结果，该图同时反映了两者的对策。可以看到，两条线在两家都卖3美元的一点相交。
图3-ll
图3-12
我们已经找到了一个策略组合，其中，各方的行动就是针对对方行动而确定的最佳对策。一旦知道对方在做什么，就没人愿意改变自己的做法。博弈论学者把这么一个结果称为“均衡”。这个概念是由普林斯顿大学数学家约翰·纳什（John Nash）提出的。纳什的想法成为我们指导同时行动博弈的最后一个法则的基础。这个法则如下。
法则4：走完寻找优势策略和剔除劣势策略的捷径之后，下一步就是寻找这个博弈的均衡。
这一定就是夏洛克·福尔摩斯和莫里亚蒂教授曾经用来看穿对方心思的秘诀。
我们还要解释一下这个法则。为什么一个博弈的参与者非得达到这么一个结局呢？我们可以说出好几个理由。没有一个理由本身就有足够的说服力，不过，只要把几个理由结合起来，就能形成一个有力的答案。
首先，存在避免循环推理的必要，因为循环推理帮不上忙。均衡在没完没了的“我知道他知道我知道…… ”的循环里是稳定不变的，这使参与者对其他人的行动的估计能保持连贯性。各方正确预计别人的行动，并且确定自己的最佳对策。
均衡策略的第二个好处出现在零和博弈中。在这种博弈里，参与者的利益严格相悖。你的对手不能通过引诱你采取一个均衡策略而得到任何好处。你已经充分考虑到他们对你正在做的事情会有什么样的最佳对策。
第三个理由是，均衡方法注重实效。要想证明一个东西是布丁，就要吃一吃。综观全书，我们将会利用均衡方法讨论许多博弈。我们希望读者来检验它对博弈结果的预测以及这种思维方式产生的行为指导方针。我们相信，这么做会使我们提供的案例更有意思，比抽象地讨论均衡方法的优点更有意义。[3]
最后，可能存在一个对均衡概念的误解，我们希望各位可以避免。当我们说博弈的结果是均衡，并不自动意味着这就是对博弈的全体参与者最有利的结果，更不意味着是对整个社会作为一个整体而言最有利的结果。有利或者不利的评价永远属于另外一个问题，答案视各个案例的具体情况而各有不同。在第4章和第9章，我们会谈到这两种例子。
5 ．盛宴还是饥荒
盛宴
均衡的概念是不是同时行动的博弈中循环推理问题的一个完全解？老天爷，不是的。有些博弈存在好几个均衡，有些博弈却一个均衡也没有，而在另外一些博弈里，均衡的概念还会由于接纳新型策略而变得更加微妙。我们现在就来描述和解释这几点。
开车的时候你应该走哪一边？这个问题不能通过运用优势策略或者劣势策略理论予以回答。不过，即便如此，答案却显得很简单。假如别人都靠右行驶，你也会留在右边。套用“假如我认为他认为”的框架进行分析，假如每个人都认为其他人认为每个人都会靠右行驶，那么每个人都会靠右行驶，而他们的预计也全都确切无误。靠右行驶将成为一个均衡。
不过，靠左行驶也是一个均衡，正如在英国、澳大利亚和日本出现的情况。这个博弈有两个均衡。均衡的概念没有告诉我们哪一个更好或者哪一个应该更好。假如一个博弈具有多个均衡，所有参与者必须就应该选择哪一个达成共识，否则就会导致困惑。
在开车行驶的例子里，一条早已制定的规则给了你答案。不过，若是遇到彼得和波拉打电话打到一半突然断了的事，你该怎么办？假如彼得马上再给波拉打电话，那么波拉应该留在电话旁（且不要给彼得打电话），好把自家电话的线路空出来。另一方面，假如波拉等待彼得给她打电话，而彼得也在等待，那么他们的聊天就永远没有机会继续下去。一方的最佳策略取决于另一方会采取什么行动。这里又有两个均衡，一个是彼得打电话而波拉等在一边，另一个则是恰好相反。
这两个人需要进行一次谈话，以帮助他们确定彼此一致的策略，也就是就应该选择哪一个均衡达成共识。一个解决方案是，原来打电话的一方再次负责打电话，而原来接电话的一方则继续等待电话铃响。这么做的好处是原来打电话的一方知道另一方的电话号码，反过来却未必是这样。另一种可能性是，假如一方可以免费打电话，而另一方不可以（比如彼得是在办公室而波拉用的是收费电话），那么，解决方案是拥有免费电话的一方应该负责第二次打电话。
为了检验读者协调达成一个均衡的能力，请思考下面的问题：明天某个时候你要在纽约市会见某人。他已被告知要与你会面。不过，双方都没有更多信息，不知道究竟何时或者在哪里会面。那么，你应该于何时去何地？
托马斯·谢林（Thomas Schelling）在他的《冲突策略》一书里使这个问题家喻户晓。这个问题只有通常最常见的答案，除此之外没有任何预先确定的正确答案。在我们的学生当中，正午时分在中央车站一直是最常见的答案。即便是普林斯顿的学生，虽然他们乘坐的到纽约的火车是在宾州车站而非中央车站停，他们的答案也是一样。①
① 也许最具创意的另一个答案来自加州大学圣迭戈分校教授塔妮亚·鲁尔曼（Tanya Luhrmann）。她的回答是：“纽约公立图书馆阅览室。”我们告诉她，这假如不是空前绝后的答案，也是相当少见的答案。她立即为她的选择进行了辩解。她说，这是因为，虽然她的成功机会可能很低，可她还是更有兴趣跟愿意选择纽约公立图书馆阅览室而非选择纽约中央车站的人见面！
饥荒
另一个复杂因素在于，并非所有博弈都有我们前面描述的那种均衡，哪怕是一个，在导弹截击的故事里，余下4个结果没有一个是均衡。举个例子，我们看看伊拉克I1策略遇到美国A4策略的情况。这一策略组合的结果是反导弹没能拦截导弹，假如美国转向A8策略，情况就会大不一样。不过，那样的话伊拉克就该转向I5策略，而美国反过来也要转向A4 策略，伊拉克则相应转向I1策略，如此类推。关键在于，如果一方坚守某种确定行为，另一方就会因此大占便宜。双方惟一明智的做法在于随机选择自己这一步怎么走。实际上，导弹截击问题具有很强的对称性，以至于正确的策略组合简直是显而易见的：美国的策略应该随机地“一分为二”，一半时间选择A4策略，另一半时间选择A8策略，伊拉克则以同样的概率选择I1和I5策略。
这种“混合策略”即便在双方打算合作的时候也会出现。在前面提到的打电话的例子中，设想双方都投硬币决定自己是不是应该给对方打电话，根据前面给出的条件，两人这种随机行动的组合成为第三个均衡：假如我打算给你打电话，我有一半机会可以打通（因为这时你恰巧在等我打电话），还有一半机会发现电话占线；假如我等你打电话，那么，我同样会有一半机会接到你的电话，因为你有一半机会主动给我打电话。每一个回合双方完全不知道对方将会采取什么行动，他们的做法实际上对彼此都最理想。因为我们只有一半机会重新开始被打断的电话聊天，我们知道我们（平均来说）要尝试两次才能成功接通。
而在其他博弈中，各方应该按照什么概率采取不同策略的答案却没有这么明显。在第7章我们会建立一套法则来确定什么时候需要采取混合策略，还会介绍一个找出正确的几率组合的方法。
我们现在简要回顾一下。在同时行动的博弈中，我们有三个行动法则：一是寻找和运用优势策略；二是寻找和避免劣势策略，与此同时假设你的对手也在这么做；三是寻找和运用均衡。本章结束之际，我们来看一个案例，这个案例向各位展示了这些指导法则是怎样转化为实际行动的。
6 ．案例分析之三：莽汉软招
罗伯特·坎普（Robert Campeau）在第一次投标收购联盟商店（及其掌上明珠布鲁明代尔百货商店）的时候，运用了一个称为两阶段出价法的竞购方案。这个案例分析将会研究这种出价方案作为一个策略行动的效能。这一行动会不会让收购者占了便宜，从而违反公平原则了呢？
典型的两阶段出价法给先出让股份的股东支付的价格高，给后出让股份的股东支付的价格低。为避免复杂的计算，我们假设出价收购前的股价是每股100美元。收购者在第一阶段提出一个较高价格，即每股105美元，向先出让股份的股东支付，直到全部股份的一半出让为止。另一半待出让股份则进入第二阶段，收购者愿意支付的股价只有90美元。出于公平原则，股份不是按照股东出让的时间次序分属不同阶段。相反，每个人都会得到一个混合的价格：所有出让股份会按照一定比例均等划入两个阶段（假如招标成功，那些未出让自己股份的人就会发现他们的股份落入第二阶段）。① 我们可以用一个简单的代数表达式说明这些股份的平均支付价格。假如愿意出让的股份不超过50% ，每个人都会得到105美元的股价；假如这家公司的全部股份当中有X％愿意出让，且X%〉=50% ，那么，每股平均价格就是
$105*50/X+$90*(X-50/X)=90+15*50/X
① 拥有这家公司控制权的收购者有权将公司收为私有，然后悉数收购余下股份。按照法律，他必须向这些股东提供一个“公平市场”价格，以收购他们的股份。一般而言，在两阶段出价的竞购过程中，较低阶段的出价应该仍在可被接纳为公平市场价值的范围内。
值得注意的一点是，两阶段出价的竞购方案是无条件进行的；即便收购者没能得到公司的控制权，仍然应该按照第一阶段的价格收购全部愿意拍卖的股票。第二个特点在于，两阶段出价法的性质决定了假如所有人都愿意出让自己的股票，那么每股的平均价格只有97. 50美元。这个价格不仅低于收购者提出收购前的股价，也低于股东们在收购失败后可能得到的股价，这是因为，假如收购者被击败，股东们将会看到股价回到原来100美元的水平。因此，股东们希望要么收购者被击败，要么再出现一个收购者。
实际上，当时真的出现了另一个收购者，那就是梅西百货公司。现在就让我们假设梅西提出一个有条件的收购计划：它愿意用每股102 美元的价钱收购股份，前提是它能得到该公司大部分股份，那么，你将向哪一家出让你的股份，而你又觉得哪一家的计划会成功呢？
案例讨论
以两阶段出价的竞购方案来出让股份，是一种优势策略。为了证明这一点，我们会考察全部可能的情形。总共存在3种可能性，分别是：
两阶段出价的竞购方案吸引到的股份不足50% ，因而收购失败。
两阶段出价的竞购方案吸引到超过50％的股份，因而收购成功。
两阶段出价的竞购方案刚好吸引到50％的股份；假如这时你同意出让你的股份，收购就能成功，否则的话收购只能失败。
在第一种情形下，两阶段出价的竞购方案遭到失败，因此，股价要么回到100美元水平，要么达到102美元，后者是在竞争对手成功收购的条件下。不过，假如你出让自己的股份，你就能得到105美元的股价，比前面提到的两个结果都要好。在第二种情形下，假如你不出让你的股份，你能得到的股价只有90美元，而出让股份则至少能让你得到97.50 美元。因此，出让股份仍然是一个更好的选择。在第三种情形下，假如收购成功，别人得到的价格都不如以前，但你自己的结果却变好了。理由是，由于出让的股份刚好达到50% ，你将得到105美元的股价。这个价格值得出让。因此你愿意促成这桩收购。
因为出让是一种优势策略，我们可以预计人人都愿意出让自己的股份。一旦人人都出让股份，每股的平均混合价格可能低于收购前的价格，甚至可能低于预期收购失败后的价格。因此，两阶段出价的竞购方案可以使收购者以低于公司价值的价格收购成功。由此可见，股东们拥
有一个优势策略的事实并不意味着他们就能占先。收购者利用第二阶段的低价不公平地占到了便宜。通常，第二阶段的狡猾本质不会像在我们这里给出的例子那样赤裸裸地暴露出来，因为这一胁迫手段多多少少会被收购后红利的诱惑隐蔽起来。假如一家公司在收购之后的实际价值是每股110美元，收购者仍然可以通过一个低于110美元而又高于100美元的第二阶段出价占到便宜。律师们认为两阶段出价法具有胁迫性质，并且成功地利用这一点作为一个依据，在法庭上跟收购者打官司。在争夺布鲁明代尔的战役中，罗伯特·坎普取得最后胜利，但他却是通过一个修改了的出价达到目的的，其中并不包含任何阶段性的结构。
我们还会发现，一个有条件的竞购方案对于一个无条件的两阶段出价竞购方案不是一个有力的抵御策略。在我们给出的例子中，假如梅西许诺无条件支付每股102美元的话，那么它的竞购方案就会更难对付。梅西的无条件竞购将会破坏两阶段出价竞购方案取胜而达到的均衡。理由在于，假如人们认为两阶段出价竞购方案笃定取胜，他们将会得到的只是97.50 美元的平均混合价格，而这个数字显然低于他们把股份出让给梅西将会得到的股价。因此，不可能出现股东们希望两阶段出价竞购方案成功且又愿意向梅西出让股份的情况。①
①不幸的是，同样不可能出现一个梅西竞购成功的均衡点，因为若是这样，意味着两阶段出价的竞购方案吸引到不足50％的股份，那么股价仍将高于梅西愿意支付的价格。唉，这就是一个没有均衡点的例子。要想找出解决方案就必须用到随机策略，这一点我们将在第7章进行讨论。
1989 年年底，坎普由于负债累累而陷人经营困境。联盟商店按照《破产法》第十一条申请重组。当我们说坎普的策略很成功时，我们只想表明他的策略成功地达到了赢得竞购战的目的。成功经营一家公司完全是另外一场不同的博弈。
第1部分结语
我们在前三章借助商界、体育、政治等领域的例子作为辅助工具，介绍了许多概念和方法。在后面的章节，我们会实际运用这些概念和技巧。这里我们对这些概念和技巧进行回顾和总结，供读者参考。
博弈是一种策略的相互依存状况：你的选择（即策略）将会得到什么结果，取决于另一个或者另一群有目的的行动者的选择。处于一个博弈中的决策者称为参与者，而他们的选择称为行动。一个博弈当中的参与者的利益可能严格对立，一人所得永远等于另一人所失。这样的博弈称为零和博弈。不过，更常见的情况是，既有共同利益，也有利益冲突，从而可能出现导致共同受益或者共同受害的策略组合。但是，我们通常还是会把这个博弈当中的其他参与者称为一方的对手。
一个博弈的行动可能是相继进行，也可能是同时进行。在相继行动的博弈里，存在一条线性思维链：假如我这么做，我的对手可以那么做，反过来我应该这样应对…… 这种博弈通过描绘博弈树进行研究。只要遵循法则1：向前展望，倒后推理，就能找出最佳行动方式。
而在同时行动的博弈中，存在一个逻辑循环的推理过程：我认为他认为我认为…… 这个循环必须解开，一方必须看穿对手的行动，哪怕他在行动的时候并不知道这是怎么一回事。要想解开这么一种博弈，可以建立一张图，这张图能显示所有可能想像得到的策略组合将会相应产生什么结果。然后按照下列步骤进行分析。
首先看参与各方有没有优势策略，优势策略意味着，无论对手采取什么策略，这一策略都将胜过其他任何策略。这就引出法则2：假如你有一个优势策略，请照办。假如你没有优势策略，但你的对手有，那么，尽管认定他一定会照办吧，然后相应选择你自己的最佳策略。
接着，假如没有一方拥有优势策略，那就看看有没有人拥有一个劣势策略，劣势策略意味着无论对手采取什么策略，这一策略都将逊于其他任何策略。如果有，请遵循法则3：剔除劣势策略，不予考虑。如此一步一步做下去。假如在这么做的过程当中，在简化之后的博弈里出现了一个优势策略，应该采用这个优势策略。假如这个过程以一个独一无二的结果告终，那就意味着你找到了参与者的行动法则以及这个博弈的结果。即便这个过程可能不会导出一个独一无二的结果，这么做也可以缩小整个博弈的规模，使其变得更加容易控制。最后，假如既没有优势策略，又没有劣势策略，又或者这个博弈已经经过第二步进行了最大限度的简化，那么，请遵循法则4：寻找这个博弈的均衡，即一对策略，按照这对策略做，各个参与者的行动都是对对方行动的最佳回应。假如存在一个这样的独一无二的均衡，我们就有许多很好的证据证明为什么所有参与者都应该选择这个均衡。假如存在许多这样的均衡，你就需要用一个普遍认同的法则或者惯例做出取舍。假如并不存在这样的均衡，这通常意味着一切有规则可循的行为都有可能被对方加以利用，这时候你需要将你的策略混合运用。
在实践当中，博弈可能包含一些相继行动过程，也可能包含一些同时行动过程，因此须将上述技巧综合起来，灵活运用，思考和决定自己的最佳行动应该是什么。

第2部分