第4章走出囚徒困境

书籍名:《策略思维》作者：奈尔伯夫

20世纪70年代，石油输出国组织（欧佩克）一直合谋提高原油价格，从1973年的每桶不足3美元提高到1980年的每桶超过30美元。每逢欧佩克召集定价会议，整个世界都会焦急不安地等待消息。20世纪70年代后期，一些能源专家已经预测，这么下去，等到20世纪末，石油价格将会涨到每桶超过100美元。不料，突然之间，这个卡特尔组织似乎就要崩溃了。石油价格开始下滑，1986年年初一度下跌至每桶10美元，1987年才逐步回升到每桶18美元。① 就在我们撰写本书的时候，伊拉克人侵科威特，油价又迅速上升到每桶35美元。专家们对欧佩克的前途莫衷一是。
① 当然，我们必须同时记住一件事，即在1981-1985 年，美元对其他货币强劲升值。因此，不管是油价在20世纪80年代上半叶下跌，或者是之后收复失地，油价的变化用美元以外的其他货币结算，都不如用美元结算时看起来那么富有戏剧性。
究竟是什么因素主宰了这样一个卡特尔的成败？而在多数情况下，又是什么因素左右了从商界、政界乃至其他社会机构的合作与竞争之间的平衡？借助我们在第1章提到的发生在克格勃牢房的囚徒困境，这个问题至少可以部分得到解决。
欧佩克的故事就是这么一个博弈。当然，我们讲述的时候采用了戏剧化的叙事方式，强调了个中困境，抛开了许多历史细节。现在，我们从考察仅仅两个成员的产量决策开始，假设这两个国家是伊朗和伊拉克。为以后讲解方便，我们只允许每个国家各有两个产量水平可以选择，分别是每天200万桶原油或者400万桶原油。根据这两个国家的不同决策，输出到全球市场的总量将是每天400万桶、600万桶或者800万桶原油。与这组数字对应，假设价格分别是每桶25美元、15美元和10美元。在伊朗，原油提炼成本是每桶2美元，而在伊拉克则是每桶4美元。于是，我们可以用“百万美元/天”为单位，在图4-1上显示两个竞争对手的利润。每个格子的右上方是伊拉克每天可得的利润，左下方是伊朗的利润。①
图4-l 伊朗和伊拉克的利润图
① 这种用同一个矩阵表示两个参与者的得失的做法来自托马斯·谢林。他用过分谦逊的笔触写道：“假如真有人问我有没有对博弈论做出一点贡献，我会回答有的。若问是什么，我会说我发明了用一个矩阵反映双方得失的做法…… 我不认为这个发明可以申请专利，所以我免费奉送，不过，除了我的学生，几乎没有人愿意利用这个便利。现在，我愿提供给各位免费使用。”
每个国家都有一个优势策略，即选择较高的产量水平进行生产。比如说，伊朗第四行对应产量的利润数字分别是52和32，全都高于第二行对应的数字46和26。假如两国全都选择各自的优势策略，它们的利润将分别达到每天3200万美元和2400万美元。这当然不是一个小数目，不过，假如它们合作，本来可以分别得到4600 万美元和4200 万美元。
这种情况称为“囚徒困境”。其显著特征在于，双方选择各自的优势策略，以使其收益达到最大，不过，与双方选择将其收益最小化的策略相比，最终的收益却更糟。那样的话，双方为什么不选择最小化的策略呢？回到伊朗和伊拉克的例子上来。即使伊朗愿意选择最小化的策略，每天生产200万桶，但伊拉克仍然有生产400万桶的动机，这么一来，结果就是对伊拉克最有利，而对伊朗最不利。假如伊朗不想合作，坚持生产400万桶，这时，伊拉克若是只生产200万桶，伊拉克就是傻瓜，白白牺牲自己的利润。这个卡特尔的问题在于，怎样才能在双方都面临诱惑、很想欺骗对方、从对方所失中获利的前提下，找到一个方法，维持一个低产量、高价格的策略，而这一策略能为双方都带来最高收益。
伊朗和伊拉克的情况与前面提到的克格勃的两个囚犯情况相仿。两个人都知道坦白才是优势策略：假如一方不坦白，另一方就会由于坦白而得到好处；假如一方坦白，另一方若不坦白就是傻瓜了。因此，无论一方怎么做，另一方还是想坦白。这一点对双方都适用。但一旦双方都坦白，各人都会遭到严厉的惩罚。我们再一次看到，谋求个人利益的私心最终导致了一个糟糕的结果。实际上，假如双方都不坦白，双方的结局都会更好一些。问题是，在双方暗自较劲希望为自己谋求一个更好的结果的时候，怎样才能达成这样的合作。
一个产业的几个竞争企业之间也会出现同样的问题。这个间题不仅让商人们苦恼不堪，也同样折磨着商学院的学生们。得克萨斯州A&M大学一位教授让自己班上的27名学生进行一个博弈，而这个博弈会把他们引人囚徒困境。[1]假设每一个学生都拥有一家企业，现在他必须决定自己应该生产1来帮助维持较高价格，还是生产2来通过别人所失换取自己所得。根据愿意选择1的学生总数，将收入按照表4-1 的方式分配给每个学生。
换用图4-2 ，我们可以看得更加清楚，效果也更加明显。
这是一个“事先设计好”的博弈，目的是确保每个选择2的学生总”比选择1的学生多得50美分，不过，选择2的人越多，他们的总收益
就会越少。假设全体27 名学生一开始都打算选择1，那么他们各得1.08 美元。假设有一个人打算偷偷改变决定，选择2，那么，选择1的学生就有26名，各得1.04 美元（比原来少了4美分），但那个改变主意的学生就能得到1.54 美元（比原来多了46美分）。实际上，不管最初选择1的学生总数是多少，结果都是一样，选择2是一个优势策略。每一个改选2的学生都会多得46美分，同时会使他的26个同学分别少得4美分，结果全班收人会少得58美分。等到全体学生一致选择自私的策略，尽可能使自己的收益达到最大，他们将各得50美分。反过来，假如他们联合起来，协同行动，不惜将个人的收益减到最小，他们将各得1.08 美元。你会怎么抉择？
表4-1
图4-2
演练这个博弈的时候，起初不允许集体讨论，后来允许一点讨论，以便达成“合谋”，结果愿意合作而选择1 的学生总数从3到14不等。在最后的一次带有协议的博弈里，选择1的学生总数是4，全体学生的总收益是15.82 美元，比全体学生成功合作可以得到的收益少了13.34 美元。“我这辈子再也不会相信任何人了。”领导合谋的学生这样嘟囔。那么，他自己又是怎么选择的呢？“噢，我选了2。”他答道。
这个情景使我们回想起尤塞里安（Yossarian在约瑟夫·海勒( Joseph Heller）的小说《第22 条军规》（Catch-22）当中的境遇。第二次世界大战胜利在望，尤塞里安不想成为胜利前夕最后一批牺牲者。他的上级军官问：“可是，假如我方士兵都这么想呢？”尤塞里安答道：“那我若是有别的想法岂不就成了一个大傻瓜？"
政治家们也会变成同样的困境中的囚徒。1984年，大多数人都很明白，美国联邦预算赤字实在太高了。裁减必要的巨额开支在政治上并不可行，因此，大幅增税应该是不可避免的。不过，谁愿意担当政治领导角色，带头主张这么做呢？民主党总统候选人沃尔特·蒙代尔( Walter Mondale）想要在自己的竞选活动当中为这么一个政策转变制造声势，却被罗纳德·里根（Ronald Reagan）打得落花流水，因为里根许诺绝不加税。1985年，这个议题陷人僵局，无论你怎么划分政治派别，民主党对共和党，众议院对参议院，还是政府对国会，各方都希望把提出加税的主动权推给对方。
从各方的角度看，最好的结果在于，对方有人提出加税和削减开支，并因此不得不付出政治代价。反过来，假如自己提出这样的政策，而对方坚守被动局面，并不附和，自己就会落得最糟糕的下场。双方都知道，联合起来共同倡议加税和削减开支，共同分享荣誉，分担谴责，与同时坚守被动，眼看巨额赤字上升而无所作为相比，显然会对整个国家更有利，即便对他们自己的政治生涯，从长期而言也会有好处。
我们可以画出一张常见的图（如图4-3所示），标明策略和结果，将这个情况变成一个博弈。双方分别是民主党和共和党。为了表示谁更加倾向于怎么做，我们把每个结果按照各方的眼光给出从1到4的排序，数字越低对自己越好。每个格子左下角是共和党给出的排序，右上角是民主党给出的排序。
显而易见，对每一方而言，保持被动是一个优势策略。而这正是真实发生的情况；第99届国会根本没有做出任何加税决定。此届国会确实通过了《格拉姆-拉德曼-霍林斯法》（Gralmm-Rudman-Hollings Act），这一法案规定以后必须实行削减赤字政策。不过，这只是一种伪装，好像采取了行动，实际却推迟了作出艰巨抉择的时间。这一目的与其说是通过限制财政支出的做法达成的，不如说是通过玩弄会计上的小把戏而实现的。
图4-3 共和党和民主党的排序
1 ．如何达成合作
一旦陷入囚徒困境，人们就会想方设法逃脱，寻求大家一致愿意看到的合作的结果。圈外人则大约更愿意看到他们困在中间无法脱身。举个例子：某个产业的企业由于陷入囚徒困境而不能合谋抬高价格，买方得以从较低价格中受益。在这个例子中，社会希望阻挠这个产业合谋，不让其破解囚徒困境，反垄断法就是其中一道路障。但是，不管我们愿意寻求合谋或者是阻挠合谋，我们都必须了解有什么途径可以破解囚徒困境。只有这样，我们才能找出合适的对策，要么沿着这条路走下去，要么在上面设置路障。
一个根本的难题在于在任何协定下参与者都有作弊的动机。因此，中心问题是，怎样才能觉察这么一种作弊行为？什么样的惩罚才能阻止这种行为？现在我们逐一分析。
2 ．觉察作弊
卡特尔作为一种企业联合组织，必须找出有效的办法，了解是不是出现了作弊行为，以及若是有作弊行为的话，确定是谁作弊。在我们已经讲过的例子中，觉察有人作弊通常都不是什么难事。比如在伊朗和伊拉克石油生产的例子中，石油价格只有在两国合作，每天生产200万桶原油的时候才会达到25美元一桶；只要价格低于每桶25美元，肯定有人作弊。在现实生活当中，情况更加复杂。价格下降可能有两个原因，一是需求下降，二是生产者之一作弊。除非一个卡特尔有本事区分这两种影响，确定价格下降的真实原因，不然的话，它就会在根本没人作弊的时候误以为有人作弊，并且采取惩罚措施，或者是反过来，有人作弊却没觉察。① 这些做法会降低准确性，使有关防范措施的效果大打折扣。一个妥协的解决方案是设置一个关键价格，或者称为“触发”（trigger）价格，一旦价格落到这个价格之下，卡特尔就可认定有人作弊，随即采取惩罚措施。
① 统计文献将错误的肯定称为一类错误，而将错误的否定称为二类错误。最常见的错误却是三类错误：记不起来确切的是哪个。
不过，在现实生活当中还有一个复杂因素。这类博弈通常都有很多不同层面的抉择，觉察作弊的可能性在不同层面也有所不同。比如，企业之间会在价格、产品质量、售后服务以及其他许多方面进行竞争。价格相对而言算是比较容易观察的，虽然可能存在的秘而不宣的折扣或者定价策略的灵活性会使问题复杂化。而在产品质量方面，质量具有许多不同层面，很不好把握。因此，旨在合谋维持较高价格的卡特尔经常发现，企业不断地将竞争引向新的层面。这样的事情就发生在民航产业。在受到政府监管的时期，机票价格是固定的，新竞争者进入的通道实际上被堵死了。这就相当于航空公司在民航管理局的推动下结成卡特尔。但在卡特尔内部，航空公司之间却开始竞争，或者说是作弊。它们虽然不能降低机票价格，却可以提供更加超值的服务，比如可口的飞机餐和美丽的空中小姐。假如劳工法要求航空公司也要聘用男性乘务员，而且不能因为空中小姐超过30岁就解雇，竞争则可以转向其他层面，比如提供更多直飞航线、加大座位宽度以及增加座位前面伸展腿脚的空间。
这种发展趋势还有一个例子，出现在国际贸易政策领域。关税是最容易看出来的、用于限制贸易的工具，关贸总协定（GATT）通过连续多个回合的谈判，最终促使所有发达国家一起大幅下调关税。不过，各国仍然面临国内强大的特殊利益集团的政治压力，它们要求限制进口。因此，各国渐渐转向利用其他一些不那么容易看出来的手段，比如自愿限制协定、海关估价手续、标准、行政手段以及复杂的配额制度。①
① 比如，按照复合纤维协议确定的配额，其征税标准极其复杂，不同织物在不同国家就有不同做法。这套标准使人难以看出配额制度对提高任何一种特定商品的价格究竟有什么影响。尽管如此，有些经济学家仍然估算出了这种影响，而且发现价格可能提高100％的幅度——若是关税高到这个程度，恐怕就要引发广大消费者的强烈抗议了。
这些例子说明了一个共同主题，即合谋集中在比较透明的抉择层面，竟争则转向不那么容易看出来的层面，我们把这个现象称为“提高不透明度定律”。也许读者未必看得出来，但合谋仍然可能损害你的利益。比如，1981年开始实施日本汽车进口配额制度后，不仅包括日本车和美国车在内的全部汽车涨价了，而且大众化的日本车型也从市场上消失了。不透明的竞争后果更甚：不仅导致价格上升，产品组合的平衡也被扭曲了。
确认作弊者可能比觉察作弊更为艰巨。假如只有两个参与者，诚实的一方当然知道谁在作弊。即便如此，能不能让他承认错误可能又是一个未知数。假如出现不止两个参与者，我们可能知道有人作弊，却没人知道究竟是谁，只有作弊者自己心知肚明。遇到这种情况，用于惩罚作弊的手段必然显得莽撞生硬，它会同时影响到无辜者和作弊者。
最后一点，作弊行为可能表现为维持被动，拒绝出头，因此也就更难区分出来。我们前面讲过的不肯带头倡议加税的例子就属于这个情况。遇到这种情况，想要推测或者断定有没有作弊更是难上加难。一方面，积极的行动人人都看得见，另一方面，不作为的借口也有很多，比如还有更加亟须处理的事情，需要时间动员全部力量，诸如此类。
3 ．对作弊者的惩罚
在每一个鼓励合作的良好计划里，通常都会包含某种惩罚作弊者的机制。一个坦白且供出合作伙伴的囚徒可能遭到这些人的朋友的报复。若是知道外面会有什么报应等着自己，尽快逃脱牢狱之灾的前景大概也就不会显得那么诱人了。人人都知道，警察会威胁毒品贩子说要释放他们以让其坦白。这种威胁的作用在于，一旦他们被释放，卖毒品给他们的人就会认定他们一定是招供了。
而在得克萨斯州A&M 大学教室进行的实验里，假如学生们觉察到究竟是谁拒绝按照合谋选择1，他们可能就会整个学期不再理会这个家伙。估计没有哪个学生愿意为了50美分而冒被抵制的风险。至于欧佩克的例子，由于20世纪70年代阿拉伯国家存在社会与政治合作，任何一个打算作弊的国家都担心有可能遭到抵制，因而最终放弃了作弊的想法。这些例子反映了在最初博弈之上增加惩罚机制的做法，其目的就是为了减少作弊的动机。
在博弈的结构里还存在其他类型的惩罚。一般而言，这种情况发生的原因在于这个博弈反复进行，这一回合作弊所得将导致其他回合所失。我们还是用伊朗和伊拉克之间的原油例子进行分析。
由于两个国家天天都在进行这个博弈，惩罚的可能性也就出现了。假设他们从相互信任的基础起步，各国每天生产200万桶，携手维持较高的价格。然而各国都会不断受到诱惑，很想偷偷作弊一把。回到每天的利润图上来。假如这天伊朗作弊且取得成功，伊拉克保持诚实，那么伊朗这天的利润将从原来的4600 万美元上升到5200 万美元，净增600万美元（如图4-4 所示）。
图4-4伊朗和伊拉克的利润图
问题在于，假如伊拉克发现出了事又会怎么样。一个似是而非的情景是，彼此之间的信任瓦解，双方从此进人高产量、低价格的结局。与彼此信任的时候相比，这使伊朗每天少得1400万美元（从4600万美元减少到3200万美元）。可见，作弊带来的短期好处根本无法弥补之后带来的损失：假设伊拉克需要1个月的时间才能觉察伊朗作弊，并且断然决定解除合作，那么，伊朗由于作弊一个月而多得的1.8亿美元，在两国合作破裂13天之后就会被损失抵消。当然，时间就是金钱，今天增加的利润会比明天失去的同样数目的利润更值钱，不过，上述计算看起来仍然很不利。对伊拉克来说，卡特尔破裂将会带来更糟糕的下场：假如它作弊而未被觉察，也没有受到惩罚，那么每天可以多得利润200万美元；假如合作破裂，则每天损失将达1800万美元。显然，在这个例子中，哪怕只有一点点担心两国的相互信任会破裂，也足以约束两个竞争者乖乖遵守协定。
信任破裂有很多原因。比如，若是伊朗和伊拉克开战，欧佩克就很难强迫这两个国家遵守产量配额。有能力对违反协定者进行惩罚是维持卡特尔配额的信任的基础。不过，对于两个已经在用炸弹和“人浪”攻势相互惩罚的国家，你还有什么样的惩罚手段可用呢？一旦战争停止，由于出现了受到惩罚的可能性，合作的可能性也会再度浮现。
归纳起来，在一个一次性的博弈当中没有办法达成互惠合作。只有在一种持续的关系中才能够体现惩罚的力度，并因此成为督促合作的木棒。合作破裂自然就会付出代价，这一代价会以日后利润损失的形式出现。假如这个代价足够大，作弊就会受阻，合作就会继续。上述基本原则包含一些警示。第一个警示出现在合作关系存在某种自然而然的终点的时候，比如一个当选政府的任期到期就会结束。这种情况下，博弈反复进行的次数是一定的。运用向前展望、倒后推理的原则，我们可以看到，一旦再也没有时间可以进行惩罚，合作就会告终。但是，谁也不愿意落在后面，在别人作弊的时候继续合作。假如真的有人仍然保持合作，最后他就会脱不了身。既然没人想当傻瓜，合作也就无从开始。实际上，无论一个博弈将会持续多长时间，只要大家知道终点在哪里，结果就一定是这样。
现在我们进一步考察这个论点。从一开始，两位参与者就应该向前展望，预计最后一步会是什么。在这最后一步，再也没有什么“以后”需要考虑，优势策略就是作弊。这最后一步的结果是一个不可避免的结论。既然没有办法影响这个博弈的最后一步，那么，在考虑对策的时候，倒数第二步实际上就会成为最后一步。
而在这一步，作弊再次成为优势策略。理由是，位于倒数第二的这一步对最后阶段的策略选择毫无影响。因此，倒数第二步可以视为孤立阶段，单独进行考虑。对于任何孤立阶段，作弊都是一种优势策略。
现在，最后两个阶段的情形已经确定。早期进行合作根本无济于事，因为两个参与者已经决心在最后两个阶段作弊。这么一来，在考虑对策的时候，倒数第三步实际上就会成为最后一步。遵循同样的推理，作弊仍是一种优势策略。这一论证一路倒推回去，不难发现，从一开始就不存在什么合作了。
这一论证的逻辑无懈可击，不过，在现实世界里我们仍然可以找到阶段性的成功合作。有几个方法可以解释这一现象。一是，不错，这个类型的所有真实博弈只会反复进行有限次，但具体数目却没人知道。既然不存在一个确定的结束时间，那么这种合作关系就永远有机会继续下去。同时，参与者会有某种动机维持这种合作，为的是万一将来遇到不测，需要别人帮忙；假如这个动机足够强烈，合作就可以维持下去。
二是，这个世界存在一些“善良的”人，不管作弊可能带来什么样的物质利益，他们仍然愿意合作。现在让我们假设你没有那么善良，看看会出现什么情况。假如你按照自己的私心行事，那么在一个反复进行有限次的囚徒困境博弈里，你会从一开始就作弊。而这会使其他参与者看清楚你的本质。于是，为了掩盖真相，或者是至少掩盖一会儿真相，你不得不装出善良的样子。为什么你会那么做呢？假设你一开始就按照善良人的方式行事，其他参与者就会认为你大约属于周围少有的几个善良人之一。合作一段时间将会带来实实在在的好处，而且其他参与者也会打算仿效你的善良人的做法，换取这些好处。这对你也有好处。当然，你和其他参与者一样，仍然打算在博弈接近尾声的时候偷偷作弊。但你们仍然会在最初一个阶段进行互利互惠的合作。因此，在各人假装善良等待占别人便宜的时机的当口，大家都会从这种共同欺骗中得到好处。
三是，能在一个反复进行的囚徒困境中使信任出现的条件是，作弊所得早于合作破裂产生的代价之前出现。这么一来，两者相比哪一个更重要，就取决于现在与将来相比哪一个更重要。在商界，比较现在与将来的利润的时候，会用一个合适的利率对将来的利润打折扣。而在政界，现在与将来的重要性比较更加带有主观色彩，不过，一般而言，下

一次竞选之后的时间看起来无关大局。这使合作变得难以达成。即便是在商界，若是遇到不景气的年份，整个产业处于崩溃边缘，管理层觉得已经走到山穷水尽，没有明天了，那么，竞争就有可能变得比正常年份更加激烈。同样地，由于战争迫在眉睫，伊朗和伊拉克会认为现在的利润会比将来的利润更重要，由此加深了欧佩克面临的困境。
4 ．惩罚的保证
最巧妙的方式在于通过一个保证加以惩罚的承诺推行一个价格联盟，而且是以竞争的名义进行。现在我们将要看到的是纽约市及其立体声音响商店大战。疯狂埃迪（Crazy Eddie）已经打出了自己的口号：“我们不能积压产品。我们不会积压产品。我们的价格是最低的——保证如此！我们的价格是疯狂的。”它的主要竞争对手纽瓦克与刘易斯(Newark&Lewis) ，口号却没叫得那么野心勃勃。然而每次购物，你都会得到这个商店的“终生低价保证”。按照这一承诺，假如你在别的地方看到更低的价格，商店会按差价的双倍赔偿给你。
如果您在购物之后发现，在您购买产品的正常使用年限里，本地同一销售区域的其他商店同样型号的商品打出的价格或者实际销售的价格更低（必须附有打印的凭据），我们纽瓦克与刘易斯将很乐意向您（以支票方式）支付100％的差价，外加25％的差价，或者，假如您愿意，我们将赠送面值相当于差价200％的礼品券（包含100％的差价外加相当于100％的差价的礼品券）。
——摘自纽瓦克与刘易斯的“终生低价保证”
不过，尽管这一家的政策听上去很有竞争力，这个非要击败对手不可的承诺却有可能加强一个操纵价格的卡特尔的内部约束。为什么会发生这样的事情呢？
假设一台录像机的批发价是150美元，现在疯狂埃迪和纽瓦克与刘易斯都卖300美元。疯狂埃迪偷偷作弊，减价为275美元。假如没有那个击败对手的承诺，疯狂埃迪完全有可能将一些原本打算在对手那边购物的顾客吸引过来，而这些顾客之所以要去纽瓦克与刘易斯那边购物，原因很多，可能是因为路途较短或者以前曾在那里买过东西。不幸的是，对疯狂埃迪而言，这回减价起了完全相反的效果。因为纽瓦克与刘易斯有那么一条价格保证，人们就想赚便宜，纷纷进来买一台录像机，然后要求赔偿50美元。这么一来，相当于纽瓦克与刘易斯的录像机自动减价为250美元，比疯狂埃迪减得还厉害。不过，当然了，纽瓦克与刘易斯一定不愿意就这么付出50美元。因此，它的对策就是降价至275美元。无论如何，疯狂埃迪的结果都不如原来。那又何必搞鬼作弊呢？价格还是保持在300美元好了。
虽然卡特尔在美国是非法的，疯狂埃迪与纽瓦克与刘易斯却还是结成了这么一个组织。读者可以看到，它们两家结成的这个心照不宣的卡特尔是怎样按照我们前面提过的卡特尔内部强制条件运行的：觉察作弊，并且惩罚作弊者。纽瓦克与刘易斯可以轻易觉察疯狂埃迪作弊。那些跑来说疯狂埃迪打出更低价格而要求赔偿的顾客，其实在毫不知情的情况下，扮演了这个卡特尔的执法侦探。惩罚的形式是价格协定破裂，结果导致利润下降。那则“击败竞争对手”的广告实际上自动而迅速地实施了惩罚。
联邦贸易委员会接过一个著名的反垄断案子，其中就涉及一种类似机制的利用，这种机制看上去会加剧竞争程度，其实却是一个卡特尔的约束机制。E.I．杜邦公司、乙烷基公司（Ethyl）和其他生产抗震汽油添加剂的公司被指控利用了一个“最优惠客户”条款。这个条款规定，这些最优惠客户将享受这些公司向所有客户提供的价格当中的最优惠价格。从表面上看，这些公司是在寻找它们的最优惠客户。不过，让我们深入考察一下。这个条款意味着这些公司不能展开竞争，不能通过提供一个带有选择性的折扣价格，将它的对手的顾客吸引过来，同时只能向它的熟客提供原来的较高价格。它们必须一起降价，而这么做的成本会大很多，因为它们卖出的所有产品的利润都下降了。读者可以看出这个条款对一个卡特尔有什么好处：作弊所得比作弊所失要小，因此卡特尔也更容易维持。
在评估这个“最优惠客户”条款的时候，联邦贸易委员会裁定其存在反竞争效果，禁止这些公司在它们与客户签订的合同里使用这么一个条款。① 假如现在的被告是疯狂埃迪和纽瓦克与刘易斯，你又会怎么判决呢？判断竞争激烈程度的一个标准是涨价幅度。许多所谓“廉价”立体声音响商店在定价的时候，差不多要在各个元件批发价之和的基础上再加100％。虽然很难看出哪一部分涨价是由库存和广告成本导致的，我们却可以发现一个表面上看来证据确凿的案例，说明疯狂埃迪究竟有多疯狂。
① 这一裁决并非没有争议。委员会主席詹姆斯·米勒（James Miller）就不同意。他写道，这个条款“可以证明能够减少买方的搜索成本，使它们能够在众多买家里找到具有最佳价格价值比的顾客”。希望进一步了解这个案例的读者，请参阅“In the matter of Et hyl Corporation et al.” FTC Docket 9128，FTC Decisions, pp.425-686。

5 ．惩罚方式的选择
如果存在几个不同的惩罚手段，可以阻止作弊和维持合作，我们应该怎样抉择呢？有几个标准可供参考。
惩罚手段最重要的特征也许在于简单明确，这样的话，任何一个打算作弊的参与者都能很方便也很精确地算出作弊的后果。举个例子：假如判断是不是有人作弊的方法是，在过去18个月的折扣利润低于同期产业资本平均真实回报率10个百分点，而这个方法对于绝大多数企业而言实在太复杂了，根本算不过来，那么，这就不是一个良好的阻止作弊的约束方式。
接下来应该考虑的是确定性。参与者应该有信心，相信作弊者将受到惩罚，合作将会得到回报。这在欧洲国家寻求推动关贸总协定的时候成了一个主要问题。如果遇到一个国家投诉说另一个国家在贸易协定上作弊，关贸总协定就会启动一个行政程序，且一搞就是几个月，甚至好几年。而在判决过程中，几乎没人会听案件本身的事实陈述，判决通常更受国际政治和外交政策的影响。这样的约束机制显然不可能发挥什么作用。
然后我们会问，惩罚应该有多严厉。大多数人的直觉反应是，惩罚应该“与罪行相抵”。不过，这也许并不足以阻止作弊。阻止作弊最可靠的方式在于使惩罚变得尽可能严厉。既然以惩罚进行威胁可以成功地维持合作，那么，惩罚本身有多严厉就无关紧要了。恐惧使大家不敢作弊，这么一来，实际上就不会出现违规行为，违规将要付出什么代价当然也就无关紧要了。
这一思路的问题在于，它忽略了出错的风险。侦察过程可能出错，如报告说卡特尔内部有人作弊，而真正导致价格下跌的罪魁却是一个完全不受控制的因素，比如需求下跌。假如惩罚尽可能严厉，那么这个错误的代价就会非常高昂。要想减小出错付出的代价，惩罚必须尽可能轻微，刚刚能阻止作弊就够了。最低限度的惩罚可以达到阻止作弊的目的，又不会在不可避免的差错出现时招致任何额外代价。

6 ．以牙还牙
这里列出的一个惩罚机制应该具备的理想条件显得相当高不可攀。不过，密歇根大学的政治学学者罗伯特·阿克塞尔罗德（Robert A xelrod）指出，以牙还牙法则恰好符合这些条件。[2]以牙还牙其实是古老的“以眼还眼”行为法则的一种变形：人家对你怎么做，你也对他们怎么做。① 说得更精确一些，这个策略在开始阶段双方是合作的，以后则模仿对手在前一阶段的行动。
① 在《旧约·出埃及记》（Exodus, 21:22 ）中，我们看见，“人若彼此争斗，伤害有孕的妇人，甚至坠胎，随后却无伤害，那伤害她的总要按妇人的丈夫所要的，照审判官所断的受罚。若有别害，就要以命偿命，以眼还眼，以牙还牙，以手还手，以脚还脚，以烙还烙，以伤还伤，以打还打。”《新约》则提倡更具合作精神的行为。在《新约·马太福音）（Matthew, 5:38）中，我们读到，“你们听见有话说：‘以眼还眼，以牙还牙。’只是我告诉你们，不要与恶人作对。有人打你的右脸，连左脸也转过来由他打。”我们从“以其人之道还治其人之身”转为“你们愿意人怎样待你们，你们也要怎样待人”（《新约·路加福音》，Luke, 6:31）的金科玉律。假如人们当真遵循这一金科玉律，也就不会存在什么囚徒困境了。此外，只要我们看得更深远一些，不难发现，虽然合作可能在某一个特定博弈中降低你的收益，但是以后可能带来的回报却甚至足以使一个自私的人相信，合作应该算是一个理性策略。
阿克塞尔罗德认为，以牙还牙法则体现了任何一个行之有效的策略应该符合的四个原则：清晰、善意、刺激性和宽容性。再也没有什么字眼会比“以牙还牙”更加清晰、更加简单。这一法则不会引发作弊，所以是善意的。它也不会让作弊者逍遥法外，所以能够产生刺激。它还是宽容的，因为它不会长时间怀恨在心，而愿意恢复合作。
阿克塞尔罗德并未仅仅纸上谈兵，而是通过实验证明了以牙还牙法则的威力。他设计了一个二人囚徒困境博弈锦标赛。世界各地的博弈论学者以电脑程序的形式提交他们的策略。这些程序两两结对，反复进行150次囚徒困境博弈。参赛者按照最后总得分排定名次。
冠军是多伦多大学的数学教授阿纳托·拉波波特（Anatol Rapoport）。他的取胜策略就是以牙还牙。阿克塞尔罗德对此感到很惊讶。他又进行了一次锦标赛，这次有更多学者参赛。拉波波特再次提交了以牙还牙策略，并再次夺标。
以牙还牙策略一个非常引人注目的特征在于，它在整个比赛中取得了突出的成绩，虽然它实际上并没有（也不能）在一场正面较量中击败对手。其最好的结果是跟对手打成平局。因此，假如当初阿克塞尔罗德是按照“赢者通吃”的原则打分，以牙还牙策略的得分怎么也不会超过500 ，也不可能取得最后的胜利。
不过，阿克塞尔罗德并没有按照“赢者通吃”的原则给结对比赛的选手打分，只有比赛结束才算数。以牙还牙策略的一大优点在于它总是可以将比赛引向结束。其最坏的结果是遭到一次背叛，也就是说，让对方占了一次便宜，此后双方打成平局。以牙还牙策略之所以能赢得这次锦标赛，是因为它通常都会竭尽全力促成合作，同时避免相互背叛。其他参赛者则要么太轻信别人，一点也不会防范背叛，要么太咄咄逼人，一心要把对方踢出局。
不过，尽管如此，我们仍然认为以牙还牙策略是一个有缺陷的策略。只要有一丁点儿发生误解的可能性，以牙还牙策略的胜利就会土崩瓦解。这个缺陷在人工设计的电脑锦标赛中并不明显，因为此种情况下根本不会出现误解。但是，一旦将以牙还牙策略用于解决现实世界的问题，误解就难以避免，结局就可能是灾难性的。
举个例子：1987年，美国就苏联侦察和窃听美国驻莫斯科大使馆一事做出回应，宣布减少在美国工作的苏联外交官人数。苏联的回应是调走苏联在美国驻莫斯科大使馆的后勤人员，同时对美国外交使团的规模作出更加严格的限制。结果是双方都难以开展各自的外交工作。另一个引发一系列以牙还牙行动的例子出现在1988年，当时加拿大发现前来访问的苏联外交官从事侦察活动，当即宣布缩小苏联外交使团的规模，而苏联则以缩小加拿大在苏联的外交使团的规模作为回报。到了最后，两国关系恶化，此后的外交合作更是难上加难。
以牙还牙策略的问题在于，任何一个错误都会反复出现，犹如回声。一方对另一方的背叛行为进行惩罚，从而引发连锁反应。对手受到惩罚之后，不甘示弱，进行反击。这一反击又招致第二次惩罚。无论什么时候，这一策略都不会只接受惩罚而不作任何反击。以色列由于巴勒斯坦发动袭击而进行惩罚，巴勒斯坦拒绝忍气吞声，而采取报复行动。由此形成一个循环，惩罚与报复就这样自动而永久地持续下去。
哈特菲尔德家族（Hatfields）与麦科伊家族（McCoys)*的长期争斗，又或者是马克· 吐温（Mark Twain）笔下的格兰杰福特家族（Grangerfobrds) 与谢泼德森家族（Shepherdsons）的世代仇恨，给我们提供了另外两个例子，说明以牙还牙的行动是怎样导致两败俱伤的。不和各方一定不愿意停止争斗，除非他们觉得两家已经打平了。但是，就在这样持续不断的寻求打平的过程中，他们实际上是出手越来越重。最后他们甚至会为此送了命。几乎没有可能回到起点，重新谋求解决双方的不和了，因为，争斗一旦开始，就不会按照人们的意志发展。比如，当赫克·芬恩(Huck Finn）试图了解格兰杰福特家族与谢泼德森家族世仇的源头究竟是什么时，他却遇到了鸡生蛋还是蛋生鸡的难题。
“这究竟是为什么呢，巴克？——为了土地么？”
“我估计是的——我不知道。”
“那么，究竟是谁开的枪呢？是格兰杰福特家的人还是谢泼德森家的人？”
“天哪，我怎么会知道呢？那是多久以前的事啊。”
“有没有人知道呢？”
“噢，有的，老爸知道，我估计，还有其他一些老头子，不过现在他们也不晓得当初究竟发生了什么事。”
*哈特菲尔德家族与麦科伊家族是19世纪80年代美国肯塔基州的两大帮派，长期不和，以在肯塔基与西弗吉尼亚交界的山区地带持枪对射而闻名。当局虽然也会出动镇压，还逮捕滋事分子，无奈两大帮派根深蒂固，称霸一方，入狱者总是很快获得释放。如此僵持不下，直到1890年，两家争斗才渐渐平息下来。此事大大破坏了南北战争之后肯塔基州的形象。——译者注

以牙还牙策略缺少的是一个宣布“到此为止”的方法。因此，若将这一策略用于必然包含误解的情形，就会变得很危险。以牙还牙策略实在太容昌被激发起来。当某一作弊行为看上去像是一个错误而非常态举止的时候，你应该保持宽容之心。即便这一作弊是故意的，经过一个漫长的惩罚循环之后，也许到了该叫停并尝试重建合作的时候了。与此同时，你当然也不想太轻易地宽恕对方而被对方占了便宜。那么，你应该怎么取舍呢？
一个常见的评估策略的方法是衡量它有多大本事对付它自己。如果我们从发展的、演进的角度思考，就会发现“最符合情况的策略”是人们的优势策略。结果是，这些策略会经常相互较量。除非一个策略能够压倒自己，否则，任何最初阶段的成功都将转变为自我毁灭。
乍看上去，以牙还牙策略在对付自己的时候做得相当不错。两个以牙还牙者会从合作开始，然后，由于各方反应一致，合作似乎注定可以永久地持续下去。这种策略配对似乎可以彻底避免囚徒困境问题。
不过，若是有可能出现一方误解另一方行动的情况，又会怎么样呢？为了找出答案，我们仍然利用哈特菲尔德家族与麦科伊家族的例
子，因为他们就是用以牙还牙策略处理邻里关系的。起初他们和平相处（记作P) ，如图4-5所示。
图4-5
假设在第四轮，一个哈特菲尔德族人对一个麦科伊族人产生了误会。结果，虽然麦科伊家族真心维护和平，哈特菲尔德家族还是认为他们出现了侵略的举动（记作A) ，如图4-6所示。
图4-6
这么一个小小的误会犹如回声一般反复进行下去。在第五轮，哈特菲尔德家族以为麦科伊家族出现了侵略的举动而以侵略行动回敬，侵略从原来的想像变成现实。现在，两个以牙还牙的家族陷人了交替为前一次遭到报复而报复对方的情况。在第六轮，麦科伊家族为哈特菲尔德家族在第五轮的侵略而进行报复，导致对方在第七轮再次进行报复。如此类推。企图通过扳回一局而打成平手的做法根本行不通。
这一情况持续下去，直到出现第二个误会。此时有两种可能的发展方向。哈特菲尔德家族可能将和平误会为侵略，又或是将侵略误会为和平。① 假如侵略被误会为和平，整个争斗就会停止（至少可以维持到出现下一个误会之前）。
① 同样地，这些误会也可能出现在麦科伊家族一边，其后果也是一样。
假如第二个误会是将和平当做侵略，双方还会继续相互报复。图4-7显示了第九轮的情况。图中惟一一条表示和平的线段被误会为侵略。结果，哈特菲尔德家族在第十一轮以报复予以回应。双方将继续为对方前一次惩罚自己而进行报复，直到下一个误会出现。虽然以牙还牙者可以出手报复，却不能忍受别人的报复。
图4-7
关于以牙还牙策略的运作，我们可以得出什么结论呢？只要有可能出现误会，长期而言，以牙还牙策略会有一半时间合作，一半时间背扳。理由是，一旦出现误会，双方将问题复杂化与澄清误会的可能性一样大。这么一来，以牙还牙策略其实就跟扔硬币决定合作还是背叛的策略差不多，因为后者选择合作和背叛的几率也是相同的。
在这一节的讨论中，我们似乎一直忽略了一个重要因素：出现误会的可能性。但实际上，我们的结论并不取决于这一可能性！不管出现误会的几率怎样微乎其微（即便是小到万亿分之一），长期而言，以牙还牙策略还是会有一半时间合作，一半时间背叛，就跟一个随机策略一样。如果出现误会的几率很小，那么出现麻烦的时间就会推迟。不过，反过来，一旦出现误会，就要花更长时间才能澄清。
存在出现误会的可能性意味着你必须有更宽宏的雅量，但只可记住，而不是简单地采取以牙还牙的报复行动。这在大家认为出现误会的几率很小，比如5％的时候是正确的。不过，假如处于一个有50％的几率出现误会的囚徒困境中，你又该怎么做呢？你该有多大的宽宏雅量呢？
一旦出现误会的几率达到50% ，再也没有可能在囚徒困境中达成合作。你应该永远背叛对方。为什么呢？设想两种极端情况。假设你永远选择合作，而你的对手有一半时间会误会你的行动，结果是他会认为你一半时间背叛，一半时间合作。假如你永远背叛又会怎样？这种情况下你仍然会有一半时间被误会，只不过这一次对你是有利的，因为对手认为你有一半时间是合作的。
不管你选择什么策略，你都不可能影响你的同伴的看法。这就好比你的同伴是靠扔硬币来决定自己认为你做了什么一样。一旦出现误会的可能性达到50% ，看法与现实将再也没有什么联系。既然你根本没有可能影响你的同伴接下来将要作出的抉择，你大约还是选择背叛的好。你会在每一个阶段得到较高的回报，将来也不会遭到什么损失。
关键在于，保持宽宏雅量直到某一阶段是值得的。假如出现误会的可能性变得太高，那么在囚徒困境里保持合作的可能性就会消失殆尽。合作实在是太容易破裂，以至于不可能加以利用。较高的出现误会的可能性使你根本没有办法通过自己的行动传达清晰的信息。由于缺乏通过行动沟通的能力，合作的希望也就不复存在。
出现误会的可能性达到50％是可能出现的最糟糕的情况。假如大家都知道误会一定会出现，就会把每一个信息理解成相反的意思，那么误会也就不会出现了。一个百发不中的股市预言者其实跟一个百发百中的股市预言者同样出色。只不过你要知道应该怎样解读这些预言罢了。
记住这一点。接下来我们会找一个办法，破解这个其中可能出现误会而出现误会的可能性又不是太高的困境。

7 ．以牙还牙策略的一个替代选择
清晰、善意、刺激性和宽容性等基本性质看起来很可能恰好符合任何能将自己解脱出囚徒困境的行为准则的要求。不过，以牙还牙策略在惩罚一个有过合作历史的人时显得过于急躁了一些。我们必须找出一个更能区别对待的策略：这一策略应在背叛只是偶尔为之时显得宽容一些，而在背叛成为一种惯常行为时又能果断地实施惩罚。
读者可以考虑遵循以下指导原则，作为迈向这一方向的一步。（1) 开始合作。（2）继续合作。（3）计算在你合作的情况下对方看上去背叛了多少次。（4）假如这个百分比变得令人难以接受，转向以牙还牙策略。注意，与以前不同，此时的以牙还牙策略不是作为对良好行为的奖赏，相反，却是对企图占你便宜的另一方的惩罚。
要想确定令人难以接受的背叛的百分比是多少，你必须了解对方行为的短期、中期和长期历史。仅看长期历史是不够的。一个人合作了很本长时间并不意味着他不会在声誉开始下降的时候企图占你的便宜。你还要知道“最近你都对我做过什么”。
这里有这一策略的一个例子，更具善意，更宽容，又没有那么大的刺激性，比以牙还牙策略复杂一点。从合作开始，如此继续下去，直到情况符合下面4个检验中的1个。
·第1印象：第一轮就背叛绝对不可接受。转向以牙还牙策略。
·短期：任何3轮当中出现2次背叛也是不可接受的。转向以牙还牙策略。
·中期：过去20轮当中出现3次背叛也是不可接受的，转向以牙还牙策略。
·长期：过去100轮当中出现5次背叛也是不可接受的，转向以牙还牙策略。
用以牙还牙策略惩罚不必永远持续下去。记录对方符合上述4个测试的频率。出现第一次背叛之后，进行20轮如回声一般的以牙还牙的相互报复，然后改为合作。同时将对方置于观察期，严密监视。另将中期和长期测试当中可能允许出现的背叛次数减1。假如对方在观察期内的背叛次数没有达到这一数字的50% ，就可以将他的背叛记录清为零，重新开始计算。假如对方在观察期内犯规，那就采取以牙还牙策略，永不改变。
对于第一印象以及短期、中期和长期印象，其确切规则取决于错误或误会发生的几率、你对未来获益和目前损失的重要性的看法，等等。不过，在并不完美的现实世界里，这种策略很可能胜过以牙还牙策略。
必须记住的一个重要原则是，假如有可能出现误会，你不要对你看见的每一次背叛都进行惩罚。你必须猜测一下是不是出现了误会，不管这个误会来自你还是你的对手。这种额外的宽容固然可使别人对你稍加作弊，不过，假如他们真的作弊，他们的善意也就不会再有人相信了。最终误会出现时，你再也不会听之任之。所以，如果你的对手有投机倾向，他终将自食其果。

8 ．案例分析之四：国会对联邦储备局
美国国会和联邦储备局经常在经济政策上发生冲突。为了解释这一争端是如何引发以及将会导致什么结果，我们在这里介绍一下普林斯顿大学经济学家艾伦·布林德（Alan Blinder）对这一争端所做的博弈论分析。[3]这两个机构各自拥有相当独立的制定经济政策的权力。制定财政政策（税收和政府支出）是国会的工作，而制定货币政策（货币供给和利率）则属联邦储备局负责。各方可以选择用扩张或紧缩的模式实施自己的政策。扩张的财政政策意味着高支出和低税收，这会降低失业率，却有引发通货膨胀的风险。扩张的货币政策意味着低利率及由此形成的更宽松的借贷条件，这同样有可能引发通货膨胀。
对于经济结果，这两个机构也有各自的好恶标准。选民喜欢政府支出给他们带来的好处，比如降低按揭，却不愿意交税。有鉴于此，国会倾向于采取扩张性的政策，除非通货膨胀已经迫在眉睫，而且非常严重。相反，联邦储备局看得更长远，认为通货膨胀才是更关键的问题，因此倾向于采取紧缩性的货币政策，即紧缩银根。
1981-1982年，国会一度不再把通货膨胀当做一个多么了不起的风险。他们觉得整个经济有能力承受一个扩张性的财政政策，想要联邦储备局加以配合，同时采取一个扩张性的货币政策。不过，保罗·沃尔克（Paul Volcker）领导的联邦储备局担心这么做只会重新引发通货膨胀。在联邦储备局看来，第一选择是财政政策和货币政策同时紧缩。换言之，国会认为最理想的政策在联邦储备局看来糟糕透顶，反之亦然。
国会与联邦储备局的利益却并非完全对立。为了达成妥协，双方就一个采取扩张政策，另一个采取紧缩政策的相对优点进行了辩论。不管谁采取扩张政策，谁采取紧缩政策，这一混合策略对一般就业和通货膨胀的影响都相差不大，区别在于其他重要方面。扩张的财政政策和紧缩的货币政策会产生庞大的预算赤字，同时会拉高利率，因为只有这样做才能募集必要的资金，以在货币政策紧缩的前提下支持这个赤字的财政政策的运行。高利率还会对一些重要的行业，比如汽车和建筑业，造成非常严重的伤害。而外国资本由于受到美国高利率的吸引，也会蜂拥而入。美元将会升值，美国的国际竞争力将因此受到削弱。
财政紧缩政策和货币扩张政策会导致相反的结果：利率降低，美元贬值，对我们的汽车和建筑行业大有好处，也使我们销售的产品更具竞争力。国会和联邦储备局在这两种选择面前一致倾向于采取后面这个混合政策。
这种情况下，你预计可能出现什么结果？你会怎样判断这个结果？而你又会觉得整个政策制定过程应当进行什么改革呢？
案例讨论
这是一个囚徒困境。不然的话，这个案例也不会出现在这一章了，不是吗？）让国会和联邦储备局对4种可能的政策混合模式排列名次，1表示最佳，4表示最差。于是我们可以得到图4-8。
图4-8 联储和国会对结果的排序
对于国会，高支出是一个优势策略；对于联邦储备局，优势策略是收紧银根。一旦双方这么想，而且各自选择自己倾向的策略，结果将是财政赤字和银根紧缩。这正是20世纪80年代初发生的事情。不过，其实还存在一个对双方都更加有利的结果，即预算盈余和银根放松。
究竟是什么使它们没能达成一个对彼此都更加有利的选择呢？答案又是决策的相互依存性。只有在双方一致选择单独看来不那么好的策略的时候，才会取得对于双方都更好的结果。国会必须限制支出，从而达到一个平衡的预算。不过，假如国会这样做了，谁能保证联邦储备局就不会报以一个收紧银根的政策呢？若是联邦储备局当真那么做，就会出现在国会看来最糟糕透顶的结果。国会不相信联邦储备局有能力抵御这样的诱惑。它们没有办法彼此许下值得信赖的承诺，正是这一事实堵死了通向双方都更愿意看到的结果的道路。
我们能不能提出一个走出这一困境的办法呢？双方有着一种持续的关系，合作可能出现在反复进行的博弈当中。不过，合作只有在双方都足够重视未来收益的时候才会出现。国会议员每隔两年就要谋求竞选连任，要他们以如此长远的目光行事，实在困难。
我们不妨从另一个角度审视这个间题。其实，联邦储备局本身就是国会的一项发明。在大多数其他国家，政府（财政部）对中央银行的控制权要大得多。假如美国也是这样，那么，国会完全可以强迫联邦储备局采取一个扩张的货币政策，从而达成国会最想看到的结果。当然，那些赞同联邦储备局的看法，认为通货膨胀才是重要问题的人，会觉得这实在令人感到遗憾。
看上去这是一个没有胜方的情况：协调财政和货币政策等同于国会短视的政治目标取得成功，可惜，由一个独立的联邦储备局开出的支票和结余却引出了一个囚徒困境。也许，一个解决的方案是让联邦储备局决定支出和税收，而让国会确定货币供给？

第5章策略行动
我们必须组织一场毫不留情的战斗。绝不能让敌人拿到一片面包或一升汽油。合作农场的农民必须将牲口赶到别处，将粮食转移到其他地方。无法转移的东西一律就地毁灭。桥梁和道路必须埋设地雷。森林和仓库都要烧毁。留给敌人的只能是难以忍受的局面。
——斯大林在宣布苏联对抗纳粹的“焦土”防御政策时的讲话，1941年7月3日。
今天，在企业控制的战场上，仍然可以看见斯大林的战略。西太平洋（Western Pacific）打算吞并霍顿·米夫林（Houghton Mimin）出版公司，后者威胁说要清空自己的作者群。约翰·肯尼思·加尔布雷思（John Kenneth Galbraith）、阿奇博尔德·麦克利什（Archibald MacLeish）、小阿瑟·施莱辛格（Arthur Schiesinger ,Jr.）以及许多盈利可观的教科书的作者一致威胁说，假如霍顿· 米夫林被兼并，他们就会另投别处。“当西太平洋主席霍华德·（米基）·纽曼（Howard (Mickey) Newman）接到头几封作者寄来的抗议信的时候，他还觉得这是一个笑话，称之为‘捏造’。不过，当他接到更多这样的信件时，他开始意识到，‘我可能买下这个公司后却一无所获。’”[1]结果，西太平洋收回收购计划，霍顿·米夫林得以继续独立经营。
不过，这一策略并非总是管用。比如，当鲁拍特·默多克（Rupert Mudoch）有意收购《纽约》杂志时，该杂志社肩负重任的管理层决心将他打回去。许多著名的作者威胁说，假如默多克夺得控制权，他们就即要离开《纽约》杂志。但这并未吓倒默多克。他还是收购了《纽约》杂志。作者们确实离开了，但是，广告客户并没有走。默多克得到了他想要的东西。作者们走错了方向。要想使焦土政策起作用，你就必须毁灭入侵者想要的一切，而这些东西未必是现在的主人最重视的。
我们倒不是有意暗示说，这么一个策略无论成功或失败，其本身或结果都是可取的。我们不难想像社会希望避免这么一种意味着巨大浪费的破坏行动的出现。我们的目的在于解释这些策略的本质，这样你就可以更好地运用它们，或者避免使用它们。
焦土防御只不过是被博弈论者称为策略行动的做法的一个例子。[2[ 一个策略行动的设计意图在于改变对方的看法和行动，使之变得对自己有利。其突出特征是刻意限制你的行动自由。这一点可以通过一种无条件的方式实现，比如一个总统候选人发誓说“不会提高税收，就是这样”。又或者，由于策略行动确定了一个怎样应付不同情况的规则，自由因此受到限制。比如，美国许多州都有强制性的制裁持枪犯罪的法律，这些规则实际上有意限制了司法裁判的自由。
你大约已经觉得，保留选择余地总归是有好处的。不过，在博弈论的王国里，这一点却不成立。你虽然少了自由，却在策略上得了益，因为这么做改变了其他参与者对你以后可能采取什么反应的预期，而你可以充分利用这一点，为自己谋利。其他人知道，只要你有行动的自由，你就有让步的自由。引用奥斯卡·王尔德（Oscar Wilde）的名言，就是：“我就是没法拒绝诱惑。”[3]

1 ．无条件行动
设想美国和日本争先恐后发展高清晰度电视。虽然美国拥有技术方面的优势，却由于财政赤字越积越高，可以动用的资源实在非常有限。日本抓住美国这个短处，再次击败了它。不过，一个乍看上去可能进一步束缚美国的策略行动其实可以扭转整个局面。
在缺少无条件行动的前提下，华盛顿和东京同时开始选择各自的策略。每个国家都必须决定对研究开发的投入是高还是低；投入高，会大大缩短开发时间，当然产生的成本也更高。我们把这个情况看做一个博弈，画出它的得失图表（如图5-1所示）。每一方都有两个策略，因此会出现4个可能的结果。
我们假设双方都认为，投入高是一个最糟糕的结果，因为：在日本看来，美国很可能赢得一场全力以赴的比赛，自己的投入只会变成损失；而在美国看来，这么做的成本太高。把这个结果称为各方的1 。各方第二糟糕的结果（2）是自己的投人水平低，而对方却选择了高水平：这等于在毫无成功希望的前提下花钱。
图5-1 美日高清晰度电视竞赛的得益
日本最愿意看到的结果（4）是，自己选择高水平，美国却选择低水平；那样的话，它取胜的机会很大，而且资源成本问题在它看来也没那么严重。在美国看来，最理想的结果是双方同时选择低水平，那样的话，美国很有机会以较低成本打赢这一仗。
低水平是美国的优势策略。美国的问题在于，日本会早已料到这一点。日本的最佳对策是转向高水平。这个博弈的均衡点出现在右上方的格子里，在那里，美国得到的是自己第二糟糕的结果。要想改善这一局面，必须采取一个策略行动。
假设美国占了先机。日本还没来得及做出决定，美国已经抢先宣布自己无条件支持这一开发项目。这就使原本同时出招的博弈变成相继出招的博弈，而且还是美国先行。于是，上图5-1 也相应变成一棵树（如图5-2 所示）。①
① 要想把一棵树变成一张桌子（表格），非得借助一个聪明的木匠不可；一个聪明的策略家，知道怎样把一张表格变成一棵树。（在英语中，“表格”和“桌子”是同一个单词，作者在这里是用这个多义词开玩笑。——译者注）
图5-2 相继行动的博弈树及其得益（括号内第一个数字为美国的得益，第二个数字为日本的得益）
这个博弈可以通过向前展望、倒后推理解出。假如美国选择低水平，日本就会报以高水平，那么美国的结果就是2。假如美国选择高水平，日本报以低水平，那么美国的结果就是3。因此，美国应该宣布选择高水平，同时希望日本报以低水平。这就是这个相继出招的博弈的均衡点。这么做，美国可以得到3，胜于它在原来那个同时出招的博弈里得到的2。
这个使美国占得有利形势的策略行动，在于单方面、无条件地宣布自己的选择。这个选择不是美国在同时出招博弈里会做出的选择。引入策略思维的精彩之处，正在于此。美国若是宣布选择低水平，不会得到任何好处；在其没有作出任何声明的情况下，日本反正也是这么预期的。
要想策略地行动，你必须保证自己不要采取在同时出招博弈里的均衡策略。美国的这个策略行动改变了日本的预期，进而改变了它的行动。一旦相信美国会不惜一切代价选择高水平，日本就会选择低水平。当然了，等到日本拿定了主意，美国最好还是改变主意，同样回到低水平的道路上去。
这就提出了几个问题：为什么日本应该相信美国的声明？它难道就不会预计到美国会改变主意么？假如它料到美国会有这么一个改变，它还会选择高水平么？
换言之，美国走出的无条件行动的第一步的可信度值得怀疑。假如美国并不可信，那么这一招将毫无作用。大多数策略行动都会遇到这个可信度的问题。回顾本章开始提到的几个例子，虽然政治家们发誓不会加税，这是无条件的，却并非不可收回。一旦当选，他们常常可以找到借口加税。即便是有条件的规则，在特定的时候也会出现例外情况，比如一个精神科医生用一枝非法的手枪自卫，抵抗一名神经错乱的病人的袭击，那么强制判刑的条例就失去了效力。
为了使一个策略行动可信，你必须采取其他附加行动，使扭转这一行动变得代价高昂乃至完全没有可能。可信度要求对这个策略行动作出一个承诺。当斯大林威胁说要饿死他的敌人，烧毁田野的行动就使他的威胁变得非常可信。而在其他情况下，可信度是一个程度间题。（大多数时候）法律体系中的先例使强制判刑条例显得可信；至于政治家的承诺，例外情况反而更加常见。在高清晰度电视的竞赛里，美国可以划拨专项资金，专供有意参与开发计划的公司申请支取，从而使自己投人高水平研发力量的选择显得更加可信。
因此，策略行动包含两个要素：计划好的行动路线以及使这一路线显得可信的承诺。本章我们集中考察行动。我们将策略行动划分为不同类型，逐一进行解释，而暂时把怎样使这些行动变得可信的问题放在一边。打个比方，若说这是一个烹调过程，下一章我们会提供一个承诺的详细“食谱”，现在让我们继续研究行动的主“菜单”。
2 ．威胁与许诺
一个无条件的行动可以使这个参与者获得策略上的优势，抢占先机，率先出招。即便你并未真的先行，仍然可以通过对一个回应规则作出一个承诺，获得相仿的策略优势。回应规则把你的行为视为对其他人行动的一种回应。虽然你是跟在别人后面行动，但这个回应规则必须在别人开始行动之前就实施。父母对孩子说，“除非你吃掉菠菜，否则没有甜品”，实际上就是在确立一个回应规则。毫无疑问，这个规则必须在这个孩子把自己那份菠菜喂了小狗之前就开始实施，并且明确宣布出来。
回应规则分为两大类：威胁与许诺。威胁是对不肯与你合作的人进行惩罚的一种回应规则。既有强迫性的威胁，比如恐怖分子劫持一架飞机，其确立的回应规则是假如他的要求不能得到满足，全体乘客都将死于非命；也有阻吓性的威胁，比如美国威胁说，假如苏联出兵攻击任何一个北约国家，它就会以核武器回敬。强迫性的威胁的用意在于促使某人采取行动，而阻吓性的威胁的目的在于阻止某人采取某种行动。两种威胁面临同样的结局：假如不得不实施威胁，双方都要大吃苦头。
第二大类的回应规则是许诺。这是对愿意与你合作的人提供回报的方式。为寻找证人，检察官会向一个被告许诺说，只要他愿意成为公诉方的证人，检举同案中的其他被告，他就会得到宽大处理。许诺同样可以分为强迫性的和阻吓性的两种。强迫性许诺的用意是促使某人采取对你有利的行动，比如让被告摇身一变成为公诉方的证人；阻吓性许诺的目的在于阻止某人采取对你不利的行动，比如黑帮分子许诺好好照顾证人，只要他答应保守秘密。相仿地，两种许诺也面临同样的结局：一旦采取（或者不采取）行动，总会出现说话不算数的动机。
有时候，威胁与许诺的界限非常模糊。一个朋友在纽约市被抢了钱，却得到下面这个许诺：只要你“借给”我20美元，我许诺一定不会伤害你。相比之下更加性命攸关的还是这个歹徒没有明说的威胁：假如我们这个朋友不肯“借给”他20美元，他就一定会受到伤害。
正如这个故事暗示的那样，威胁与许诺的界限只取决于你怎样称呼当前的情形。老派的歹徒会威胁说，假如你不给他一点银子，他就要伤害你。假如你没有给，他就会动手“修理”你，从而造成一种新的情形，而在这种新的形势下，他又会许诺说只要你给他一点银子，他马上就会住手。随着形势转变，一个强迫性的威胁会变得和一个阻吓性的许诺差不多；同样，一个阻吓性的威胁与一个强迫性的许诺的区别也只在于当时的情况。
3 ．警告与保证
一切威胁与许诺的共同点在于：回应规则使你不会在没有回应规则的前提下采取行动。假如这个规则只是泛泛地指出，无论什么时候你都会采取最佳行动，那就跟没有规则差不多。由于别人对你以后的行动的预期毫无变化，这个规则也就产生不了任何影响。不过，说明什么事情会在没有规则的情况下发生，仍然具有一种公告天下的作用，这些说明称为警告与保证。
如果实践一个“威胁”对你有利，我们称之为警告。比如，假设总统警告说他会否决一个他不喜欢的法案，这只不过是表明了他自己的意图。假设他本来很愿意签署这个法案，但是为了促使国会提出更好的方案，他决定策略地指出要行使否决权，这就是一种威胁。
警告的用意在于告知其他人，他们的行动将会产生什么影响。父母警告孩子说炉子顶部很热，这只是一个事实陈述，不是策略。
如果实践一个“许诺”对你有利，我们称之为保证。孩子不理会关于炉子顶部很热的警告，结果烫伤了，这使父母得到某种保证，知道孩子以后再也不会这么干了。
我们强调这两对概念的区别是有理由的。威胁与许诺是真正的策略行动，而警告与保证更多的是起一个告知的作用。警告或者保证不会改变你为影响对方而设立的回应规则。实际上，你只不过告知他们，针对他们的行动，你打算采取怎样的措施作为回应。与此截然相反，威胁或者许诺一旦时机来临，就会改变你的回应规则，使之不再成为最佳选择。这么做不是为了告知，而是为了操纵。由于威胁和许诺表明你可能选择与自身利益冲突的行动，这就出现了一个可信度的问题。等到别人出招之后，你就有动机打破自己的威胁或者许诺。为确保可信度必须做出一个承诺。
我们用图5-3总结策略行动可能的选择。无条件的行动是你先行且行动一成不变的回应规则。威胁与许诺则在你第二个出招时出现。两者都是有条件的行动，因为这个回应是由取决于对方怎样做的规则所确定的。
一种策略行动总是抢占先机的行动。回应规则必须在对方行动之前实施。这意味着无论策略行动是什么，整个博弈都必须当做相继出招的博弈进行分析。如果你永不妥协，那么其他人就会针对你的无条件的行

动做出回应。借助威胁与许诺，你首先设立了一个回应规则，然后，其他人出招，而你按照自己的回应规则采取相应的行动。
策略行动
无条件的有条件的
起初的威胁许诺
强迫性的阻吓性的强迫性的阻吓性的
图5-3
结果是，对行动或者回应规则作出的承诺使原本同时出招的博弈变成相继出招的博弈。虽然得失情况不会改变，同一个博弈若是按照同时出招或者相继出招方式进行，有可能产生完全不同的结果。结果的差异来源于不同的博弈规则。我们通过美日争霸故事的一个无条件的行动说明了这一影响；现在，让我们来看一看美苏对峙以及民主党与共和党较量当中出现的威胁与许诺。
4 ．核阻吓
曾经有超过40年的时间，北大西洋公约组织（简称北约）一直在努力寻求一种管用的阻吓手段，遏制苏联人侵西欧。北约军队的常规防御不大可能奏效。北约的阻吓手段的一个基本要素在于美国的核力量。不过，动用核武器进行回应意味着给整个世界带来毁灭性的打击。这可怎么办？
我们用一棵树表示这个博弈（如图5-4所示）。苏联拥有先行之便。假如它不发动攻击，结果是保持现状，双方各得0分。假如它进攻北约，而北约以常规防御回应，那么，苏联得1分，美国得-1分。假如动用核武器进行回应，那么双方各得-100分。
在这个博弈中，苏联向前展望，预计自己的进攻不会促使对方动用核力量反击。这样做的结果对美国不利。因此，进攻意味着它能得到1分，不进攻则什么也得不到，是0分。结果是它一定会进攻。
常规防御(l，-l)
北约
进攻核武器(-100，-100)
苏联
保持现状(0,0)
图5-4 相继出招的博弈树及其得益（括号内第一个数字为苏联的得益，第二个数字为美国的得益）
假如你认为这种情况不可能出现，但北约在欧洲的成员国却一致觉得美国很有可能按照上述思路在它们需要援助的时候丢弃不管。它们希望美国作出一个可信的承诺，表明自己将在盟国遭到攻击的时候动用核武器。
我们暂时放下可信度的问题，首先考察这么一个威胁产生作用的机制。现在，美国拥有先行之便，也就是说它率先提出自己的回应规则。这个相关规则就是如下威胁：“假如苏联进攻西欧，我们的回应就是动用核武器。”假如美国不做这个威胁，这个博弈就会按照前面提到的方式进行。一旦实施威胁，进行常规防御的选择也就不复存在。完整的博弈树将如图5-5所示。
北约
进攻核武器（-100，-100)
苏联
保持现状(0,0)
图5-5 存在威胁时相继出招博弈的得益（括号内第一个数字为苏联的得益，第二个数字为美国的得益）
一旦美国实施威胁，苏联向前展望，意识到进攻将会引发对方动用核武器，苏联的结局将是-100分。它宁可保持现状，也不会发动攻击。现在，拥有先行之便的美国向前一直展望到底，就会发现自己若是实施这个威胁，得分是0，若不实施这个威胁，得分是-1。可见，正是美国自身的利益，决定它要不要实施威胁。
再次提醒各位注意，美国的回应规则要求采取某种行动，而这一行动在从事之后判断显然不是最佳选择。其中的策略意图在于，以令人信服的方式改变苏联对美国事后采取什么回应的认识，可以使美国改变“这件事”——确切地说就是苏联要不要进攻西欧的决定。
这个规则必须在对方采取你打算加以影响的行动之前生效。一旦被人占了先机，不管是无条件的行动，抑或威胁与许诺，都将无济于事。
第一招一定要让对手观察得到或者推断得到，否则你就不能达到预期的策略效果。在影片《奇爱博士》（Dr.Strangelove ）中，苏联在星期五就安装好了它的万无一失的阻吓装置——“末日毁灭机”，却非推迟到下星期一才告诉美国。偏偏就在这个周末，美国空军将领杰克·D·里泊（]ack D.Ripper）下令他的飞行中队发动了一场核攻击。就这样，苏联的阻吓装置由于对方毫不知晓而未起到任何作用。
能够观察到这一点并不像表面看来那么直截了当。假如一个行动本身可从结果推断出来，我们就不一定要观察到对方的这个行动。举个例子，假如我对有壳的水产品过敏，我不必真的看到你在厨房，照样可以觉察到你正在煮一盆虾。①
① 秘密投票的目的就是让投票者免受这样的影响。不过，我们再次发现，阻吓不必真要对方看到才起作用。我能看到你出招是不足够的，我还要有能力看懂你使的究竟是什么招数。虽然我的投票一定是秘密投入票箱的，最后的投票结果却不是秘密的。假如一个候选人贿赂了100个人，最后却只得到47票，他一定知道某些人（确切地说是53个人）欺骗了他。假如他决定惩罚他贿赂过的全部100个人，他这么做的时候一定可以找到他应该惩罚的人。这一方式虽然有点莽撞，却可以在每个选区只有少数投票者的情况下破解票箱的保密措施。
你的无条件行动若是打算用来影响对方，就一定要让对方看到，同样，假如你打算通过威胁或许诺影响他的行动，那么他的行动也应该可以让你看到。否则你不可能知道他是不是选择顺从，而他也明白这一点。
现在，既然你已经知道可信的无条件行动和威胁是怎样起作用的，你不必借助一棵非常具体细致的博弈树也可以分析这一类型的最简单情况。通常只要口头阐述就足够了。假如这真的不够，而你又怀疑单凭文字能不能正确讨论全部案例，那么你总是可以通过画博弈树检查自己的推理过程。

5 ．时报的策略
1981年，罗纳德·里根初登总统宝座，广受欢迎。不过，他能不能实现自己的使命，让国会通过税收改革法案呢？在他提出第一份预算案的时候，战线就已经划分出来。民主党希望里根妥协，牺牲一部分税收改革法案，以换取一个较小的赤字。共和党则要求全面实行供方经济*。最后的结果取决于两党怎么进行这场博弈。
*促成有利于产品与服务生产者的条件的经济。——译者注
在参议院，民主党人附和里根的预算案，希望以此促成一些共和党人的妥协，使其支持自己的主张，从而达成两党合作。但共和党人并不领情，坚守原来的方案。现在，这一情形转移到众议院。民主党人有没有更好的策略呢？
《纽约时报》上两篇由伦纳德·西尔克撰写的专栏文章非常漂亮地说明了当时的策略可能性。[4]他在描述这些谈判的时候指出，两党各有两个选择，因此可能出现四种结果。以下我们再现了西尔克的博弈图表（如图5-6所示）。
图5-6民主党和共和党的结果排序
民主党人认为最佳结果是他们攻击里根的方案，而共和党人妥协，因为这样民主党人可以宣称自己已对预算尽心尽力，与此同时还能实施符合他们理想的预算案。而在共和党人这边，最佳结果出现在左上角，这种情况下，里根的预算案得到两党支持。假如民主党人发起进攻，而共和党人坚守原定方案，结果就会出现僵局，两党同时遭到失败。假如共和党人愿意妥协，那么民主党人也愿意缓和自己的进攻力度；两党都会得到各自的次佳结果。
民主党人的主要问题是：共和党人拥有一个优势策略——全力支持里根。假如民主党人大体支持里根，那么共和党人就应该全力支持里根，从而达成己方的最佳结果。假如民主党人攻击里根，共和党人就应该全力支持里根，以避免出现己方的最坏结果。不管民主党人怎么做，共和党人全力支持里根总能得到较好的结果。①
因此，共和党人的策略变得易于预测。民主党人应该料到共和党人会全力支持里根，而这时民主党人的最佳策略就是照办，即大体支持里根。而这正是参议院发生的事情。
到目前为止，结果仍然对共和党人有利。民主党人为了改善自身处境，必须实施某种策略行动。他们必须将整个局面转为相继出招的博弈，以抢占先机，让共和党人针对他们的策略做出回应。② 于是，我们就要考虑什么样的威胁、许诺或者其他行动可以扭转局面，使其有利于民主党人。
看上去没有一个基本策略帮得了民主党人的忙。无条件的行动、许诺乃至威胁统统不管用。只有同时实施威胁和许诺才能促使共和党人妥协。
① 此外，西尔克还指出，不管民主党人选择什么策略，全力支持里根的做法都会使共和党人处于一个比民主党人更有利的地位。在左上角的方格，共和党人的第一位置比民主党人的第三位置更有利，而在左下角的方格，共和党人的第三位置又比民主党人的第四位置更有利。因此共和党人总是压倒对方，处于上风。不过，正如我们在第2章讨论过的那样，博弈的每一个参与者应该尽可能使自己的地位达到最佳水平，不应理会最后谁将处于上风。对于优势策路的正确理解在于，一个策略比其他策略对你更有利，而不是这一策略会使你得到比对手更好的结果。博弈的参与者在考虑各自的相对地位时，这些问题应该永远包含在内，成为这个表格里列出的排名或者得失的一部分。
② 由于共和党人已经得到他们最理想的结果，他们也就没有什么办法可以继续加以改善自己的地位。他们的目标只不过是维持现状。阻止民主党人，不让他们实施任何可能改变这个博弈的结果的策略行动，这是符合共和党人利益的做法。
无条件行动的问题在于，它不能影响共和党人的地位。现在大家都认为民主党人应该支持里根。民主党人立下契约这么做并不能改变共和党人的预计，因此也只能得到同样的结果。惟一的策略可能性是民主党人无条件地攻击里根。若是这样，他们可以向前展望，推理得知共和党人的回应仍然是全力支持里根。（共和党人总是倾向于全力支持里根，这是他们的优势策略。）不过，假如民主党人发起攻击，共和党人全力支持里根，那么，民主党人得到的结果还比不上两党同时支持里根的结果。
民主党人想诱使共和党人从全力支持里根转向妥协。因此，他们也许可以许诺说假如共和党人妥协，他们就会支持里根。① 不过，这个许诺也帮不了他们。共和党人知道，假如他们完全不理会妥协这一选择，而是全力支持里根，那么民主党人的最佳回应就是支持里根。民主党人的许诺反而会换来他们最后无条件支持里根的结果。共和党人当然喜欢这个前景，并下定决心全力支持里根，力求得到他们的最佳结果。民主党人的许诺毫无意义。共和党人大可不必放在心上。
① 假如共和党人同意做这笔交易，民主党人就会有一个反悔的动机。因此，要想使这个许诺产生作用，其本身必须是不可逆转的。
民主党人只有一个威胁可以用来阻止共和党人支持里根。他们可以威胁说假如共和党人全力支持里根，他们就要攻击他。但这个威胁是不够的。这个威胁的效果是民主党人有了一个无条件的契约，就是攻击里根。假如共和党人支持里根，民主党人就会实践他们的威胁，攻击里根；假如共和党人妥协，从最有利于民主党人的角度来看，他们还是应该攻击里根。既然无论共和党人采取什么行动，民主党人还是要攻击里根，那么共和党人就应该支持里根，以取得两种可能性当中的最佳结果。
许诺最后变成民主党人无条件支持里根，而威胁则变成民主党人无条件攻击里根。两者都不能有效改变共和党人的行动。
假如民主党人同时运用许诺和威胁，他们就可以为自己赢得较好的结果。他们应该许诺说，假如共和党人妥协，他们就会支持里根；同时威胁说，假如共和党人全力支持里根，他们就会攻击他。这一策略可以达成民主党人的目标。一旦实施这一组威胁和许诺，共和党人必须选择是妥协，从而赢得民主党人大体支持里根，还是全力支持里根，结果激起民主党人攻击他。在这两个选择当中，他们更愿意妥协。
真实的情况是，共和党人在参议院和众议院都是全力支持里根。民主党参议员跟随共和党参议员而与其达成一致。在众议院，民主党人最初的抵抗很快让位给一个第三策略：他们在减税的博弈中比里根还要里根。结果达成了一个两党都同意的“圣诞树”大优惠式的减税法案。眼看这一经济法案就要到期，摆脱这一难题的谈判正在演变成为新的策略博弈。
6 ．更多的策略行动
除了前面提到的三种基本的策略行动，还有更多更加复杂的选择。你不一定直接建立一个回应规则，相反，你可以故意让别人利用这些策略当中的一个。这些选择包括：
·你可以任由别人在你做出回应之前采取一个无条件行动。
·你可以等待别人发出一个威胁，然后再采取行动。
·你可以等待别人提出一个许诺，然后再采取行动。
有些时候，本来可以先行的一方放弃这一便利，让对方做出一个无条件的行动，反而能取得更好的结果，这样的例子我们已经探讨过了。若是在跟随比带头更好的关头，这么做当然是明智选择，比如我们前面讲过的美洲杯帆船赛以及剑桥学生舞会的故事。不过，虽然放弃先行之便可能更加有利，但这么做却并非一个基本规则。有时候你的目的可能是阻止你的对手作出一个无条件的承诺。中国古代战略家孙子曾经给过这样的提示：“围师遗阙” [5]。只要留下出口，敌人就会认定还有逃生机会。假如敌人看不到任何逃跑的出口，就会迸发破釜沉舟般的勇气，顽抗到底。孙子的目的就是不给敌人对自己作出一个拼死战斗的非常可信的承诺的机会。
让别人有机会对你发出一个威胁永远不是好事。你大可以选择按照对方的希望行动，却没有必要等到听见一个威胁。不错，你若不听话，别人就不会给你好果子吃，但这一事实并不能作为你坐等对方发出一个威胁的借口。注意，这句格言只限于允许对方发出威胁而已。假如对方同时作出威胁和许诺，那么双方都会得到更好的结果。
7 ．杀鸡焉用牛刀？
显而易见，在你作出一个许诺的时候，你不应让自己的许诺超过必要的范围。假如这个许诺成功地影响了对方的行为，你就要准备实践自己的诺言。这件事做起来应该是代价越小越好，因此也意味着许诺的时候只要达到必要的最低限度就行了。
不那么容易看到的是，适度原则其实同样适用于威胁。你不应让自己的威胁超过必要的范围。这么做的理由相当微妙。
为什么美国不会威胁日本说，假如日本不同意进口更多的美国大米、牛肉和柑橘，美国就要动武呢？① 虽然动武的想法有可能博得美国一些农场主和政治家的欢心，但同时却存在几个很好的理由，说明不能这么做。
① 实际上，这么一个威胁曾在1853年使用过。美国海军上将马修·C·佩里（Matthew C.Perry）的黑漆漆的庞大战舰编队成功地说服了日本幕府时代的将军，使后者同意向美国商界开放日本市场。今天，日本把美国由于要求开放日本市场而施加的过分压力称为“黑色舰队再次到访”。
(1）没有人会相信这么一个威胁，因此这个威胁不会奏效。
(2）哪怕这个威胁真的管用，日本也不傻，一定会重新揣摩美国究竟是不是它的盟友。
(3）假如日本不肯进口更多柑橘，美国说到做到，当真实践自己的威胁，其他国家就会谴责美国选择了一个很不恰当的惩罚方式，日本更会怒不可遏。不过，假如美国不实践自己的威胁，又会让自己日后的信誉大打折扣。无论是不是实践自己的威胁，美国都将遭到失败。
(4）这个威胁由于引入了一个本来毫不相干的因素——武力——而使原来的问题变得模糊不清。
上述各点的核心在于，这个威胁大而不当，对方难以置信，而自己又不能说到做到，更别说进一步确立自己的信誉了。
博弈的参与者发出威胁的时候，首先考虑的问题可能恰恰相反，认为威胁必须足够大，大到足以阻吓或者强迫对方的地步。接下来要考虑的则是可信度，即能不能让对方相信，假如他不肯从命，一定逃脱不了已经明说的下场。若是在理想状况下，再没有别的需要考虑的相关因素了。假如受到威胁的参与者知道反抗的下场，并且感到害怕，他就会乖乖就范。那么，我们为什么还要担心若实践这个威胁，会有多么可怕的情况发生呢？
问题在于，在这个方面，我们永远不会遇到理想状况。只要我们仔细考察美国不能威胁动武的理由，我们就会看得更清楚，现实与理想状况究竟有什么区别。
首先，发出威胁的行动本身就可能代价不菲。国家、企业乃至个人都参加着许多不同的博弈，他们在一个博弈中的行动会对所有其他博弈产生影响。比如美国若是威胁对日本动武，就会影响到美国日后与日本的关系、目前和日后与其他国家的关系，而美国用过这么一个大而不当威胁的事情也会留在别人的记忆里。别人在和美国打交道时就会犹豫不决，美国则会失去许多其他贸易和伙伴关系带来的好处。
其次，一个大而不当的威胁即便当真实践了，也可能产生相反的作用。日本会惊慌失措地高举双手投降，请求世界舆论声援，谴责美国人民，从而将大大推迟有关谈判的进度；美国本来希望迫使它尽快开放国内市场，结果却适得其反。
第三，所谓一个成功的威胁完全不必实践的理论，只在我们绝对有把握不会发生不可预见的错误的前提下成立。假设美国错误地判断了日本农场主的势力，而他们宁可让国家投人战争也不愿失去自己受到保护的市场。又或者，假设日本同意美国的条件，可是美军某指挥官想起自己当初不幸沦为战俘的惨痛经历，咬牙切齿要进行报复，就会抓住这个机会贸然发动攻击。面对发生诸如此类错误的可能性，美国应该三思而后行，在考虑作出一个很大的威胁的时候更应如此。
最后，在讨论过以上几点后，我们可以看到，一个威胁可能由于过大而丧失可信度。假如日本不相信美国当真愿意实践这个威胁，这个威胁就不可能影响它的行动。
结论是，能奏效的最小而又最恰当的威胁应该成为美国的首要选择，务必使惩罚与罪行相适应。如果美国希望刺激日本多买柑橘，就应该选择一个更具互惠性质的威胁，使惩罚与不肯多买柑橘的做法更加匹配。比如，美国可以威胁说要削减日本汽车或者电器的进口配额。
有些时候，一个合适的威胁简直得来全不费工夫。而在其他时候，我们眼前只存在大而不当的威胁，必须缩小其范围才能考虑加以采纳。边缘政策可能是这类用于缩小范围的机制当中最管用的一个，我们会在第9章进行讨论。
8 ．案例分析之五：波音、波音，完蛋了？
开发一种新型商用飞机简直可以说是一场豪赌。单是设计一个新引擎的成本就可能高达20亿美元。我们可以毫不夸张地说，开发一种新更好的飞机实际上等于“把公司作为赌注押上去”, [6]。难怪政府会被牵涉进去，竭力要为本国企业谋求更大的市场。
这里我们研究一下可以承载150位乘客的中程喷气式客机市场，这两种客机分别是波音727和空中客车320。波音首先开发出波音727。这时，空中客车闯入这个市场是不是明智呢？
这类客机的主要市场是美国及欧共体各成员国。我们假设，对于一个垄断企业，美国和欧共体市场各值9亿美元。假如出现两个企业发生正面竞争，总利润就会从9亿美元跌到6亿美元，且由两家平分。竞争虽然导致利润下跌了，却带来了更廉价的飞机和更便宜的机票，于是消费者得益不浅。两个市场的消费者分别得到7亿美元的好处。
空中客车公司估计，开发空中客车320的成本是10亿美元。假如它没有得到政府支持而独立实施这一开发计划，它将在美国和欧共体市场分别创造3亿美元利润，总值6亿美元，这还不够弥补开发的成本。
欧共体各国政府没有能力以提供补贴的方式直接支持这一计划，因为它们的预算早已承诺要用来补贴农民。在传统的“要大炮还是要黄油”的抉择面前，欧共体早就选择了要黄油，没给大炮或者空中客车留下什么位置。
现在，布鲁塞尔要召见你，就欧共体是不是应该通过建立一个受到保护的市场的方式支持空中客车的问题征询你的意见，其中保护的意思是要求欧洲航空公司购买空中客车320，不要购买波音727。你会怎么说呢？你预计美国政府又会怎样回应呢？
案例讨论
假如欧共体选择保护本土市场，而美国市场继续保持开放，空中客车就能作为欧洲市场的惟一垄断企业以及美国市场的双寡头垄断企业之一，分别在欧洲和美国赚到9亿美元和3亿美元。这就足以弥补10亿美元的开发成本。
这一政策是不是符合作为一个整体的欧共体的利益呢？我们必须同时比较空中客车之得与欧洲消费者之失。假如没有受到保护的市场，空中客车就不会实施开发计划，加入竞争。波音将在欧洲取得垄断地位。消费者不会得到什么好处。因此，消费者本身不会有什么损失。然而，欧共体作为一个整体，其经济得益与空中客车的利润是挂钩的。看起来，欧共体应该通过许诺造就一个受到保护的市场，支持空中客车投资开发新型客机。
欧共体承诺采取保护主义政策这一点非常重要。假设它还没有拿定主意，空中客车就进人这个市场。在这个当口，欧共体没有保护空中客车的动机。保持市场开放将使空中客车的预计利润减少6亿美元（从净赚2亿美元变成亏损4亿美元），但是，来自波音的竞争将使欧共体消费者的得益增加7亿美元。一旦意识到这一点，空中客车就不会进人这个市场，因为它没能得到欧共体各国政府的承诺，答应继续保护本土市场。
那么，美国方面又会怎样回应呢？假如美国人迅速采取措施，他们同样可以抢在空中客车开始生产之前承诺保护本国市场。现在就让我们向前展望，倒后推理。假如美国市场继续开放，情形就和前面讨论过的一样。波音被挡在欧洲市场之外，在美国又要与空中客车竞争，只能得到3亿美元利润。美国消费者则从竞争当中得益7亿美元。因此，对于美国经济而言，市场继续开放意味着总得益达到10 亿美元。
假设美国进行针锋相对的反击，同样要求美国航空公司购买波音727，而不能购买空中客车320。若是这样，即便空中客车在欧洲取得垄断地位，其利润9亿美元还是不够弥补开发的成本。因此，空中客车320也就永远不会开工制造。波音将在两个市场取得垄断地位，总利润达到18亿美元。这一经济得益远远高于市场继续开放时的数字。[7]
可见，美国可以通过采取针锋相对的保护主义措施，击败欧共体对空中客车的支持。这么做符合美国自身的利益。