1950年,美国数学家阿尔伯特·塔克在斯坦福大学给心理学家作报告时,讲了一个故事。警察在盗窃现场附近抓到了两名疑犯阿尔和鲍勃,把他们分开审讯,并分别向他们开了条件:如果两人都不招供(疑犯彼此“合作”),警方没有他们盗窃的证据,将以携带武器这一较轻的罪名各判处一年监禁。如果两人都招供并牵连对方(疑犯彼此“背叛”),两人都将各判处10年监禁。如果有一人招供并牵连对方,而对方不招供,此人将被免于起诉,而对方将被判处最高刑期20年。
阿尔想:“如果鲍勃招了而我不招,那么我将被判20年,我招了则被判10年。如果鲍勃不招,我也不招,那么我将被判1年,但是如果我招了,我将被免于起诉。所以不管鲍勃招不招,我招供都是最好的选择。”鲍勃也这么想。最终两人因为都“理性”地选择招供而被判了10年。但是如果他们都“非理性”地选择不招,则只会被判1年。
理性的选择却不能带来最佳的结果,这个“囚徒困境”后来成了博弈论最著名的问题。博弈论还有一个类似的问题也是关于合作与背叛(或欺骗)的关系,但是条件有些不同。有两个人驾车回家,遇到暴风雪,被雪堆分别堵在了街道的两头。司机要么出来铲雪清除路障,要么待在车中。如果两个司机分别从两头铲雪(“合作”),就能都开回家并分担劳动付出。如果只有一个司机铲雪,另一个司机待在车中等对方铲完雪,他也能回家,而且还避免了劳动付出(“欺骗”)。当然,如果两人都待在车中,没人铲雪,那就谁也回不了家了。在这种情况下应该怎么选择呢?最佳的策略是作出与对方相反的选择:如果对方当“好人”铲雪,我就当“骗子”坐等其成;如果对方不铲雪,我就当“好人”自己来铲雪,这样虽然被人占了便宜,总比坐以待毙的好。
博弈论在第二次世界大战结束不久后出现,本来是为了解决政治学和经济学问题的。上个世纪70年代,它开始被用来解决自达尔文以来就困扰着生物学家的一个生物进化难题:本质上是自私的生物个体为什么会进化出合作行为?它是自然选择作用下不加思索的本能行为,因此就连毫无思考能力的单细胞生物,也会面临着合作还是欺诈的两难,比如酵母菌。
酵母菌通常利用单糖(葡萄糖和果糖)作为营养。如果环境中没有这些单糖,酵母菌也能利用其他糖,例如蔗糖(比单糖复杂的二糖)。但是酵母菌要先把蔗糖消化成单糖,为此需要分泌转化酶来催化这个消化过程。这个消化过程发生在细胞外(更确切地说,发生在细胞膜和细胞壁之间),产生的单糖扩散开去,其他酵母菌也能利用。有的酵母菌的基因发生突变,生产转化酶的基因失去了作用,自己不能分泌转化酶,但是它们能窃取其他酵母菌制造的单糖,又可以节省进行消化的成本。它们成了“骗子”,而那些耗费能量把蔗糖变成单糖的酵母菌成了“好人”(合作者)。
对群体来说,大家当好人彼此合作,全都生产单糖并分享,这样最有优势。但是对个体来说,当骗子最有优势。休斯顿大学的研究人员曾经做过一个实验,结果表明,一个酵母菌群体中好人的密度越大,当骗子的优势就越明显。他们认为这像是“囚徒困境”。在这样的群体中,好人和骗子分享全部的资源,而好人要承担生产成本,因此好人总是竞争不过骗子,一旦出现骗子,它们的后代数量会越来越多,好人的数量会越来越少,等到骗子们统一了天下,末日也就快到了,好人遗留下来的单糖被耗尽后,群体就会灭绝。一个处于“囚徒困境”的群体是很不稳定的。
实际的情形可能比这复杂。麻省理工学院的研究人员最近发现,好人生产的单糖并不是100%拿出来共享的,而是自己会截留一小部分,虽然私藏的这部分很少(只占约1%),却让好人在利用单糖方面比骗子有了一点优势,在一定条件下这点优势超过了制造单糖的成本,就会让当好人在总体上比当骗子更有优势。好人也会有机会。
实验的结果的确如此。在好人的数量比较少、单糖的量也比较少时,能否有效地利用单糖就显得比较重要,好人对单糖的利用率高了1%,其优势较为明显,好人的数量会逐渐增多。等到好人的数量达到一定程度,好人制造单糖花费的成本的劣势体现出来了,骗子的优势反而更为明显,骗子的数量就开始逐渐增多了。最终,好人和骗子的比例会达到平衡。实验表明,不管一开始酵母菌群体中的好人和骗子的比例是多少,演变的结果,最后的比例都是一样的。
因此,这更像是“雪堆博弈”,特立独行是最佳策略:举世皆好人时当骗子,举世皆骗子时当好人,这样最有可能获得成功。