海盗分金

“海盗分宝石”是世界上一道极其有名的逻辑趣题,尽管实际生活中绝无此事,可是由于其题型新奇,解法独特,还是吸引了大量读者。
有10名海盗(海盗人数多寡不一,有多达500名者,但解法法所据之原理差不多)抢到了100颗宝石,宝石不可分割,也不能由数人共享。这些价值连城的赃物,究竟应该怎样分配呢?

所有的10名海盗都具有以下的一些特点,他们的心全是凶狠毒辣的,如果能把别人抛人大海,那是他们最喜欢看到的;他们自己又是十分贪生怕死的,在任何情况下都以保全自己的性命为第一;他们又是贪婪钱财的,蝇头小利也不舍得放弃。海盗们都是非常聪明的。他们总是会按照对自己最为有利的方式来行事。

说白了,就是按照保命、得到宝石、欣赏别人被抛人大海的顺序来作出自己的决策。
假定像梁山泊好汉一样,海盗们已经排好了“座次”,力量最弱的是1号,次弱的为2号;号数越大,力量越强。

分赃的具体操作进行如下:由最厉害的一名海盗(“老大”)提出一种分配方案,然后所有的海盗(包括提方案者在内)就此方案进行表决。表决办法遵循简单多数原则,只要有50%的人同意,即可获得通过。但如果达不到50%,那么提出分配方案的海盗“众怒难犯”,将被大家抛入大海去喂鲨鱼,然后再由剩下来的、力量最强的海盗重复以上过程。

10名海盗还是太多,难以说清问题。让我们从更少的情况开始讨论,然后一步一步地进行逆推。
假定从只剩两名海盗(1号和2号)开始,此时的“老大”不言而喻是2号,而他的最佳分配方案是“一目了然”的,100颗宝石全由他一个人“独吞”,1号海盗什么也得不到。由于他自己可以投赞成票,这就占了总数的50%,分配方案肯定能通过。

现在在加上3号海盗。1号海盗心里头很清楚,如果3号的方案通不过,那么最后只剩下2名海盗,而他将一无所得,这种情况已在上面分析过了。3号海盗也明白,1号是会完全理解这种形势的。因此,只要3号的分配方案能给1号一点甜头使他不至于空手而归,那么不论3号提出何种方案,1号都将投赞成票。于是3号决定给1号一点点“好处”,既然宝石不允许分割,那就是1颗宝石吧!这样3号提出的分配方案为:3号分得99颗宝石,2号一颗都没有,1号分得1颗宝石。

4号海盗的策略也差不多。他需要有50%的赞成票,因此必须找一人做同党。他可以给同党捞到的“好处”是1颗宝石,而他可以用它来贿赂2号海盗。因为如果4号的方案被否决而3号的方案得以通过,则2号海盗将一文不名,所以2号和4号是同一阵营的。故而,4号的分配方案应是:99颗宝石归自己,给2号1颗宝石,3号与1号一点好处也没有。在这儿有一点值得注意,4号贿赂1号是没有意义的,1号海盗肯定会乐滋滋地欣赏4号被抛人大海,因为3号当家后,他反正还是有1颗宝石可得。

5号海盗的策略有一些小小的变化。他需要有两名同党,才能使自己的方案得以通过。所以他提出的方案应是:98颗宝石归已,给3号与1号各1颗宝石。
可以按照以上思路继续进行下去,事实上,每个分配方案都是唯一确定的,它既保证该方案肯定能通过,又能使提出者获得最大限度的收益。照这一模式进行下去,10号海盗所提的方案将是:他自己拿96颗宝石,编号为偶数的海盗(2号、4号、6号、8号)各得一颗宝石,编号为奇数的海盗(1号、3号、5号、7号)什么也得不到。

结论很怪异,但由于推理本身没有漏洞,所以尽管看上去显得多么不合情理,仍然是站得住脚的。
  
这里“海盗分宝石”的逻辑题,与网上流传的是有一定区别的,但这是从数学书中找到的标准答案,比网上流传的更准确。

网上流传的一般是5个海盗分100颗宝石,每一颗都一样的大小和价值连城。海盗抽签决定自己的号码(1,2,3,4,5号),而这里是按照海盗个人的力量(Power)来确定提出方案的顺序,力量(Power)大的优先提出分配方案。这样才更合理,否则假定从只剩两名海盗时,不是力量(Power)更大的提出分配方案,很可能引起“不服”,事实上力量(Power)是规则的保障。以此类推,整个逻辑才能站的注脚。
这才是Power博弈的结果。无论海盗人数多少,实际上都被规则(行为、策略)潜在地分成了“奇数阵营”和“偶数阵营”,哪个阵营被拉拢收买,哪个阵营最一无所获,完全取决于最大的Power恰好属于哪个阵营。

这个“海盗分宝石”逻辑题的最大启发就在于:
一个看似公正的程序为什么会得出一个出人意料的“赢者通吃”结果?
这里先不说“赢者通吃”的结果是不是“公正”,因为这牵扯到对“公正”概念的定义。但是这种“赢者通吃”的结果肯定是没有“效率”的,这似乎不用证明,因为正如前面所说的“实际生活中绝无此事”,“不合情理”。逻辑上存在并不等于现实中存在,这也算是“存在的就是合理的”吧?
盗亦有道。甚至按照自由主义的观点,海盗内部的规则应该是最公正的。Power博弈的结果也应该是按照海盗个人力量的强弱来分配宝石,只有这样才能维持一个海盗群体,才能在海盗群体之间的竞争中立于不败之地。

什么是“程序公正”?并不是每个博弈参与人(player)都遵守规则就是“程序公正”。“程序公正”与“实体公正”也并非像一些人想象的那样是毫无关系的。按照博弈论来说,只要规则(行为:action、策略:strategies)定了,那么均衡(equilibrium)、收益(payoff)往往就是唯一的,正如上述“海盗分宝石”的逻辑题一样,每个分配方案都是唯一确定的。但是博弈论中的“均衡”概念,一般称之谓“纳什均衡(Nash equilibrium),并不是我们日常生活中所理解的均衡概念。“均衡”不等于“平衡”;“均衡”不等于“公正”;“均衡”不等于“稳定”。

博弈论中,规则(行为、策略,不是分配方案)并不是唯一的,但是每个策略的均衡、收益(分配方案)确是唯一的,规则变了均衡也就变了。
现实中的规则是可以被打破的。现实中打破规则的可能性完全取决于打破规则所能获得的“纯收益”。俗话说:杀头的生意有人做,赔本的买卖无人从。
在上述“海盗分宝石”的逻辑题中,只要把“老大(10号)”抛入大海去喂鲨鱼,剩下的人就会多出96颗宝石分配,远远大于原本1或0颗的收益,这种诱惑是贪婪的海盗们绝对难以拒绝的,尽管可以假设他们都是“理性人”。同样作为“理性人”的9号海盗,在接下来提出的分配方案还敢是“赢者通吃”吗?如果9号真敢那样,剩下的人面临的可是更少人分更多宝石的诱惑。这样的结果要么是某个海盗会放弃“赢者通吃”的分配方案,要么是最后只剩两名海盗(1号和2号),2号坚持“赢者通吃”,1号无力反抗的悲剧。当然了,“诱惑”是不确定的,逻辑却是100%确定的。
博弈论是基于逻辑和理性人假设的确定性理论,但并不能完全等同于现实,现实中会出现非理性和不确定性。博弈论中的规则往往是“外生的”、“唯一给定的”不可打破的,而现实中的规则往往是“内生的”、不是“唯一的”,可以被打破的——除了上帝的“自然法则”。

博弈论中每个行为、策略(不是分配方案)的均衡、收益(分配方案)是唯一的;
现实中的“规则”,如法律、制度的执行结果,也就是“均衡”也是唯一的。
有什么样的法律、制度就有什么样的分配方案,与“程序公正”无关。
博弈论中的“行为、策略”与“均衡”之间,就像数学算式与结果之间存在逻辑必然一样;现实中的法律、制度与财富分配之间同样存在必然的因果关系。这与规则或法律、制度是否被完美执行是两个概念。
并不是每个博弈参与人都遵守规则就是“程序公正”。“均衡”不等于“平衡”;“均衡”不等于“公正”;“均衡”不等于“稳定”。
而我们通常所说的“实体公正”往往是指“Power博弈的结果”使得每个参与人的利益最大化。
而博弈论中每个参与者的策略也都是保证自身利益最大化,均衡也是所有参与人的最优策略或行动的组合,但却并不一定就是我们通常认为的“公正”。
按照我们同的观点,上述“海盗分宝石”的例子中,就只是Power最大者的利益得到的最大化,其他海盗的利益并没有达到最大化,甚至连Power次大的9号海盗也是一无所获。

博弈论是与价值无涉的,资源是博弈论中没有的概念,例如上述“海盗分宝石”逻辑题中的“宝石”,并没有被赋予“价值”意义,但是“宝石”这种“资源”的确影响着博弈的结果。
前面已经说了,“海盗分宝石”是一个“赢者通吃”的结果,但是如果变成10个海盗分5颗宝石,或者是200个海盗分100颗宝石,结果都是“偶数阵营”每个海盗分到都分到1颗宝石,“奇数阵营”一无所获——这看起来似乎又很公正了。
我们再改变一下“资源”条件,设宝石总数为M颗,海盗人数为N人,
如果,M<round(N/2-1),也就是10个海盗分3颗宝石,即便10号、9号提出大公无私、自己不要的方案,也没有办法得到简单多数的支持,都要难免被抛入大海去喂鲨鱼的悲惨命运。
如果,N>M>=round(N/2-1),也就是10个海盗分4到9颗宝石时,“赢者通吃”的分配也不会显得那么太不公平。

博弈论的前提条件都是外生的,无法改变的,规则(行动、策略)与“程序公正”无关;均衡与公正“实体无关”。这就牵扯到抽象的博弈论与现实的博弈游戏之间的关系。
一些自由主义者往往一提“博弈的结果”就认为是“程序公正”了,其实就是混淆了抽象的博弈论与现实的博弈游戏之间的关系。抽象的博弈论的前提条件是可以任意设置的,最典型的就算是“囚徒困境”了,结果是“双输”,根本谈不上什么“公正”。

“囚徒困境”说的是两个囚犯(参与人players)被抓后,分别关在两个独立的不能互通信息的牢房里进行审讯。所有的博弈问题都会遇到三个要素。在囚徒的故事中,参与人所做的选择策略(strategies)是承认罪行,最后两个人均赢得(payoffs)了中间的宣判结果。如果两个囚徒之中有一个承认罪行,另外一个不承认罪行,那么承认者将会得到减刑处理,而抵赖者将会得到最严厉的死刑判决。这说明了非合作博弈及其均衡解的成立,但是这与两个囚犯(参与人players)是否真的犯有罪行无关,只是“理性人”在特定前提条件下博弈结果的必然。

并非所有博弈论的规则和均衡都是公正的,因为博弈论的是可以随意设置的。
现实中的博弈游戏,只是博弈论中的一些“特例”。如果按照博弈论来分析,现实博弈游戏的均衡都应该是“和局”、“平局”,不论是国际象棋、围棋、桥牌、麻将……,当然前提是参与人都是理性人,都能够计算出完美(利益最大化)的策略。
与之相反现实博弈游戏的现实结果往往是不能达到均衡,也就是有输有赢。这是因为现实的参与人都不可能做到完全的理性,或者说是智力不足以计算出完美(利益最大化)的策略。现实博弈游戏的结果往往反映的是参与者的智力差异,而不是均衡。只有智力相当的参与者之间才能达到“均衡”。
只有“均衡”是“和局”、“平局”的博弈游戏规则才能推广、流传下来,其他的都淘汰了。我们应该这样理解“存在的就是合理的”:试想一下,谁会去玩儿一个规则上必输的游戏呢?还不如省掉过程,直接承认失败。

 “海盗分宝石”首先不是“合作博弈”,不许参与人之间结盟——监管规则已经潜在地将参与人分成了“奇数阵营”和“偶数阵营”,就像相声里说的“只要路线对了头,没有棉猴也能有棉猴”,路线斗争站错了队,跟错了人,不要说人家吃肉,自己就连汤都喝不上,只有死路一条,除了Power最大的“老大”之外,即便是“二把手”9号也没用。

“海盗分宝石”最关键的就是:只要不把“老大”这个最大的Power抛入大海去喂鲨鱼,其他人就没有机会提出分配方案,这重规则就必然是“赢者通吃”的结果。
而且更危险的是把最大的Power抛掉之后的“纯收益”是巨大的,这种巨大的诱惑是对理性人假说的最大挑战。试想一下,9号只要提出一个“平分”宝石的方案,其他的海盗们是不是会群起响应呢?尽管2、4、6、8、10号的Power加起来要远大于1、3、5、7、9号,但是,至少10:1的收益诱惑难免不让“偶数阵营”内讧、倒戈。

当然,“平分”、“平均主义”也不能算是“公正”,真正要达到每个海盗(理性人)的利益最大化是要求收益与力量Power相适应。例如还是这个“海盗分宝石”的例子,5、6、7、8、9、10、11、12、13、19的分配方案,可能算是比较公正的,既不是“赢者通吃”的Power最大者的利益最大化,也不是平均主义,而是兼顾了每个海盗的力量。
世界上恐怕没有绝对的“公正”,不论是“实体公正”还是“程序公正”。但是现实社会肯定有相对的“公正”。就像人类社会从奴隶社会到封建社会再到资本主义社会、社会主义社会,社会制度总是向着更“公正”的方向发展的。或者换句话说,就是向着每个人利益都达到最大化的方向发展的,向着每个人的收益与其力量Power相适应的方向发展的。而不是相反,不是向着“赢者通吃”的方向发展的。
“赢者通吃”的关键还不在于道德上的缺陷,而在于“均衡”的“不稳定”。
前面已经说了,“均衡”不等于“稳定”,因为现实中的社会规则不是外生的,不是不能改变的。改变规则的动力只在于“纯收益”的大小。只要收益足够大,没有改变不了的永恒规则。改变规则的收益越大,规则越不稳定,反之规则越稳定。

一个好的博弈规则,一个好的法律、制度应该使破坏它的收益最小化。破坏收益的最小化,也就应该是所有博弈参与人的收益最大化。这种博弈规则下的“均衡”也是最“稳定”的、最有“效率”的。
纵观现实中存在的博弈游戏,就是最好的例证。他们都是博弈论的“特解”,国际象棋、围棋、桥牌、麻将……,它们规则很难说就是“绝对公正”,但是至少现在还没有人发现改变其规则的“收益”——注意:是指“所有人”而不是“个别人”从规则改变中获得“收益”。“个别人”收益的最大化,必然导致“赢者通吃”的规则。