博弈经济学原理:海盗分金博弈模型
博弈经济学原理创始人赵宁,著名的博弈论学者,经济学家,行为经济学家,制度经济学家,演化经济学家,在2024年9月发布了《博弈经济学原理》一书,将行为经济学,制度经济学和演化经济学纳入了博弈理论体系中,作为一种新的科学出现。

海盗分金是博弈论的一个非常经典的案例,自从1999年,在《科学美国人》正式把它发表之前,就已经流行很多年了,相信很多人都有所耳闻。
关于海盗给大家的印象,大多数情况是这样的,一帮亡命之徒,在海上掠人钱财,夺人性命,干的都是些刀头上舔血的营生。他们一般都是独眼龙,用条黑布把瞎眼遮上。他们还有在地下埋宝藏的习惯,而且总要画上一张藏宝图,以方便后人掘取。然而很少有人知道,海盗是世界上最富有民主的团体。参加海盗的都是桀骜不驯的汉子,富有独立精神。
平时,海盗们之间一切事都是通过投票来解决的。船长的唯一特权,就是拥有自己的一套餐具。可是在他不用时,其他海盗是可以借来用的。海盗船上的唯一惩罚,就是被丢到海里去喂鱼。
现在,船上有10名海盗,要分得来的100枚金币。自然,这样的问题,他们是需要通过投票来解决的。
投票的规则是这样的,先由等级最高的海盗来提出分配方案,然后大家(其中包括提出分配方案的海盗本人)一人一票进行表决,如果有50%或者50%以上的海盗同意这个分配方案,那么就依此方案进行分配,如果少于50%的海盗同意这个分配方案,那么提出这个分配方案的海盗,就将被丢到大海里去喂鱼,然后再由剩下的海盗中,等级最高的那个海盗再次提出分配方案,依此类推。
博弈之前,我们需要做一些基本的假设,船上有10名海盗,他们分别是P1,P2,P3,P4,P5,P6,P7,P8,P9,P10,假定海盗P10的等级最高。这10名海盗就是博弈的参与人,每一个参与者都是很聪明的人,都能非常理智的判断得失,并作出恰当的策略选择。每一个参与者都希望得到更多的金币,并且没有被抛下海喂鱼的可能。每一个参与者都是功利主义者,如果在一个方案中他得到了1枚金币,而在下一个方案中,他有两种可能,一种是得到许多金币,一种是得不到金币,他会同意目前的这一方案。每一个参与者都希望自己的同伴被抛到海里喂鱼,在不损害自己利益的前提下。最后一条也是最重要的,参与者之间不存在私底下的交易,因为海盗除了自己谁都不相信。
这些假设都基本符合海盗的生活习性,为了保证博弈能在公平的环境中进行,也就是必须保证海盗之间不存在私底下的交易。
对于这10名海盗而言,分配方案就是海盗们的策略,每一个海盗都可以选择1~100之间的任何一个数字,并把这个数字的金币归自己所有,然后把剩余的金币分给同伴,如果你是海盗P10,你认为怎么分,才能获得更多的金币,并且没有被扔下海喂鱼的可能?
这是一个多参与者,多策略选择的博弈模型。我们要想知道海盗P10的最佳决策,必须从最后的情形开始向前推理,首先考虑海盗船上只剩下2个海盗的情况,即海盗P1和海盗P2,其中等级关系是海盗P2>海盗P1。海盗P2选择的最佳方案是,在这之前要强调一下,金币是不可分割的,不能你半枚,我半枚,很明显,海盗P2会分给自己100枚金币,而海盗P1一枚不分。在投票表决时,他自己给自己投一票就足够50%了,这样就不会被扔到海里了,这是只剩下海盗P1和海盗P2两名海盗,对于海盗P2的最佳分配方案。
现在我们把海盗P3也考虑进去,也就是船上又多了一个海盗P3,海盗P1和海盗P3都明白,如果海盗P3自己的方案被否决了,这个博弈游戏就会只由海盗P1和海盗P2来继续,这样的话,海盗P1就一枚金币也得不到。因此海盗P3知道,只要给海盗P1一枚金币,海盗P1就会同意他的方案。相反,如果海盗P3不给海盗P1一枚金币,海盗P1反正什么也得不到,宁可投票让海盗P3去喂鱼。所以海盗P3的最佳策略是:海盗P1得1枚,海盗P2得0枚,海盗P3得99枚。
再来考虑海盗P4加进来的情况,他只要得两票就可以不被丢到海里了,海盗P4比谁都明白,他只要给海盗P2一枚金币就可以让他投票赞同这个方案,因为接下来在海盗P3的方案中,海盗P2什么也得不到。海盗P5也是相同的推理方法,他给在海盗P4方案中,什么也得不到的海盗P1和海盗P3各一枚金币,自己留下98枚,就可以获得大于50%的支持率。依此类推,最终得到海盗P10的最佳方案是:他自己得96枚,给每一个在P9方案中什么也得不到的海盗P2、海盗P4、海盗P6和海盗P8各一枚金币。
“海盗分金”这个模型的成立,必须保证10名海盗都是理性的人,有主见的人,并且不存在私下的交易,这是一个必要的前提。这10名海盗中,对于海盗P10的最佳分配方案,结果是这样的,P1、P2、P3、P4、P5、P6、P7、P8、P9、P10各可以获得0、1、0、1、0、1、0、1、0、96枚金币。
在“海盗分金”中,对于任何一名海盗而言,想让自己的方案获得通过的关键是,事先考虑清楚其他海盗的分配方案是什么,拉拢那些在下一次分配方案中得不到金币的同伴,并且以最小的付出获得更大的利益。
这个博弈看起来有些难以置信。海盗P10最有可能被扔到海里去喂鱼,但他却牢牢地把握住先发优势,运用博弈推理,结果不但消除了死亡威胁,还获得了最大收益。而海盗P1,看起来最安全,没有死亡的威胁,甚至还能坐收渔人之利,但却因不得不看别人脸色行事,结果连一小杯羹都无法分到,却只能够保住性命而已。
拉拢那些在分配方案中最不得意的海盗,这一策略是值得我们借鉴的。现实中这样的例子有很多,革命者往往找穷苦人,并最终获得成功,因为他们都是些最失意的人;恐怖分子拉登在沙特阿拉伯没有市场,在阿富汗却大受欢迎,他们都是抓住了这一点。