经济学中的“囚徒困境”小故事

甲乙两个劫匪因为抢银行被捕,警方没有足够的证据指控二人定罪,但明白他们至少可以以逃税为由将劫匪定罪。

警方将这二人分开囚禁,单独审讯,并向他们提供相同的选择。

每个人都可以认罪或拒绝认罪。

如果他们其中一个认罪而另一个拒绝认罪,则认罪者将不被视为主犯,并可转作证人。

拒绝认罪者,将被判处20年监禁,而认罪者释放。

如果二人都拒绝认罪,那么他们将会因为逃税被判1年监禁。

如果二人都认罪,他们将因为抢劫罪判处8年有期徒刑。

劫匪们会怎么做?假设其中一个劫匪认为同伙会认罪的话,拒绝认罪将会导致他被悲惨地关押 20 年,因此他必定会认罪。从另一个角度来说,即使他不相信同伙会认罪,他也应该认罪,因为那样他可能会得到自由。当两个人都进行了同样的推理后,他们就都会认罪。

囚徒困境(Prison Dilemma)是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择。虽然困境本身只属模型性质,但现实中的价格竞争、环境保护等方面,也会频繁出现类似情况。

单次发生的囚徒困境,和多次重复的囚徒困境结果不会一样。

在重复的囚徒困境中,博弈被反复地进行。因而每个参与者都有机会去“惩罚”另一个参与者前一回合的不合作行为。这时,合作可能会作为均衡的结果出现。欺骗的动机这时可能被受到惩罚的威胁所克服,从而可能导向一个较好的、合作的结果。

囚徒困境的主旨为,囚徒们虽然彼此合作,坚不吐实,可为全体带来最佳利益(1年监禁),但在信息不明的情况下,因为出卖同伙可为自己带来利益(无罪释放),也因为同伙把自己招出来可为他带来利益,因此彼此出卖虽违反最佳共同利益,反而是自己最大利益所在。

但实际上,执法机构不可能设立如此情境来诱使所有囚徒招供,因为囚徒们必须考虑刑期以外之因素(出卖同伙会受到报复等),而无法完全以执法者所设立之利益(刑期)作考量。

该法则于1950年,由就职于兰德公司的梅里尔·弗勒德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问艾伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。