海纳百川

登录 | 登录并检查站内短信 | 个人设置 网站首页 |  论坛首页 |  博客 |  搜索 |  收藏夹 |  帮助 |  团队  | 注册  | RSS
主题: 【博弈论漫谈】大众定理与文化冲突 by云儿
回复主题   printer-friendly view    海纳百川首页 -> 罕见奇谈
阅读上一个主题 :: 阅读下一个主题  
作者 【博弈论漫谈】大众定理与文化冲突 by云儿   
秋实
[博客]
[个人文集]

游客









文章标题: 【博弈论漫谈】大众定理与文化冲突 by云儿 (762 reads)      时间: 2001-12-21 周五, 上午5:52

作者:Anonymous罕见奇谈 发贴, 来自 http://www.hjclub.org

【博弈论漫谈·囚犯博弈】



大众定理与文化冲突



·云 儿·





  我们知道,单凭理性计算,有限次重复博奕,是解决个体理性与集体

理性之间矛盾的。无限重复又如何呢?且听我细细道来。



  在无限重复中,行为规则可以用自动机来代表,于是不同行为规则的

相争,便成了机器与机器的角斗。假设甲和乙玩无限重复的囚犯博奕。甲

相信《美德的起源》一书作者的教导,认定仁厚忠恕既高尚又有效,于是

以它为策略。乙信奉理性流氓主义,崇尚实力和实利,于是以流氓主义为

策略。这样,二人间的博弈,就可以看作恕道机器与流氓机器的争斗。根

据《自动机与博奕策略》一文中列出的框图,我们可以推演出各个回合双

方的行为如下:



第一回合,甲仁厚玩合作H;乙宰客玩欺骗D。

第二回合,甲报复玩欺骗D;乙仍然宰客玩欺骗D。

第三回合,甲仍报复玩欺骗D;乙发现甲并非傻客,于是玩合作H。

第四回合,甲原谅乙,玩合作H;乙却因甲上次不合作,回头玩欺骗D宰客。

……

如此等等。采用我们在《重复博奕中的行为和行为规则》给出的报偿表,

整个结果序列如下图所示:



        循 环   循 环   循 环

       ┌───┐ ┌───┐ ┌───┐

       ↓   ↓ ↓   ↓ ↓   ↓  

  行为:甲 H D D H D D H D D ……

     乙 D D H D D H D D H ……



  报偿:甲 0 2 6 0 2 6 0 2 6 ……

     乙 6 2 0 6 2 0 6 2 0 ……



  请注意,此序列呈现一个有趣的规律:就是每三个一组,不断循环重

复。于是我们很容易算出,博弈各方平均每个回合的报偿有多少  只要

取相继三个回合,作个简单平均就够了。甲得到(0+2+6)/ 3 =

2.67,乙得到(6+2+0)/ 3=2.67。显然,两者平分秋色,

不相上下,谁也不比谁差,谁也不比谁强。



  这种循环重复并不是特例。可以证明,有限自动机玩无限重复博弈,

其结果最终都会变成循环重复序列。于是,利用类似的办法,我们可以针

对《自动机与博奕策略》中列出的七种策略,算出每一对策略相博所产生

的的平均报偿。这些报偿可以写成一个7×7博奕矩阵,如下表所示(其

中一些略去了小数,这不影响下面的讨论):



                 乙



     傻客  恶棍  冷血  恕道  侠义  流氓  摇摆

    ·---------------------------·

  傻客|4,4|0,6|4,4|4,4|4,4|0,6|0,6|

    |---+---+---+---+---+---+---|

  恶棍|6,0|②,②|2,2|2,2|2,2|3,1|2,2|

    |---+---+---+---+---+---+---|

  冷血|4,4|2,2|④,④|④,④|2,2|3,1|2,2|

    |---+---+---+---+---+---+---|

  恕道|4,4|2,2|④,④|④,④|3,3|2,2|2,2|

甲   |---+---+---+---+---+---+---|

  侠义|4,4|2,2|2,2|3,3|2,2|2,2|2,2|

    |---+---+---+---+---+---+---|

  流氓|6,0|1,3|1,3|2,2|2,2|④,④|2,4|

    |---+---+---+---+---+---+---|

  摇摆|6,0|2,2|2,2|2,2|2,2|4,2|③,③|

    ·---------------------------·



  上面这个表里面,有带圈数字的格子都是平衡点。比如,乙玩恶棍策

略时,甲无论玩什么,都不比当恶棍带来的好处更多,顶多不致受损而已。

因此,甲乙双方都当恶棍,次次都玩欺骗,便是重复囚犯博奕的平衡点之

一,此时各方的报偿与一次性博奕相同,都是2。



  观察一下上面这个表,我们会发现它有多个平衡点。非重复一次性博

弈中的均衡点,恶棍对恶棍,双方永远玩欺骗,仍然是无限重复博弈的均

衡点。无条件合作的傻客策略,仍然不是重复博弈的均衡点――理性的人,

决不会当傻客。



  除此之外更重要的是,重复博弈引进了许多新的平衡点,其中有不少

平衡点,都可以实现合作报偿(4,4)。 这包括恕道策略对恕道策略,恕道

策略对冷血策略,冷血策略对冷血策略,流氓策略对流氓策略等,都可以

维持双方的合作。以流氓对流氓为例:第一回合,双方耍流氓互宰,发现

对方不是好惹的之后,双方转入合作心态,此后一直维持合作,这样无限

次重复,其平均报偿都是4。



  事实上,存在这无穷多对有限自动机策略,可以成为无限重复博弈的

平衡点,并同时实现双方的合作。这就是有名的“大众定理(Folk Theorem)”,

又译作“无名氏定理”。它之得名,是由于重复博弈促进合作的思想,早

就有很多人提出,以致无法追溯到其原创者,于是以“无名氏”名之。



  大众定理说明了行为规则的多样性:支持合作的行为规则有无穷多种。

有此而来的可观察行为,在正常的平衡状态中,是完全相同的,这就是博

弈双方相互合作,不玩欺骗。但其背后的行为规则却可能大不相同――合

作,可以是由于双方都信奉仁厚的恕道主义,也可能是因为双方都是理性

流氓,还可能是因为双方都一冷血报复作威胁。这些行为规则上的区别,

在正常的平衡状态中,是看不出来的,只有在离开平衡态的非正常情况下,

比如说在与奉行不同行为规则的外人交往时,才会表现出来。



  为说明此点,设想有两个相互隔离的社会:一个形成了理性流氓式的

行为规则,一个形成仁厚恕道的行为规则,他们各自内部都能维持相互合

作,这形成了社会的正常状态。外人但凭观察这两个社会中人们的正常行

为,看不出他们有什么区别。现在假设两个社会打破隔离,相互接触,会

产生甚么情况?我们会发现,两套行为规则间将出现激烈的冲突!



  初次接触,流氓主义者将把对方当傻客,大宰其客。恕道主义者假设

对方是好人,选择合作,只是在吃了亏之后,才以回宰其客相回报。流氓

主义者见对方回宰,以为对方也是跟自己一样的流氓,于是转向合作心态,

同时预期对方也选择合作。但恕道主义者根据“以直报怨”的原则,仍然

以宰客回报对方上次的欺骗。流氓主义者一看对方不合作,怒从心起,于

是报之以宰客,如此循环往复,双方永远无法达成合作。



  不难看出,行为规则的冲突,十分类似于人文学科里常说的文化冲突。

由于行为规则反映了人们对各自行为的稳定预期,一些博弈论者把不同的

行为规则解释为不同的文化信仰,应当是不无道理的。我觉得,重复博弈

理论,为我们科学理解许多文化现象,打开了大门。



  正是由于行为规则本身的多样性和复杂性,可以达成合作的规则千千

万,理论上没有任何基础说哪种规则就特别的优异。我们需要的,不是吹

嘘某种特定规则和文化,而是正视规则的多样性和他们之间的潜在冲突,

努力寻求现实的解决之道。所以,我对成朴文章中过分抬高“一报还一报

(tit for tat)”单一规则,将之推崇为美德的起源,始终

抱有疑虑。





2000年10月18日草







【博弈论漫谈·囚犯博弈】之一:爱情故事中的“囚犯困境”

http://www.hjclub.com/TextBody/16563.asp



【博弈论漫谈·囚犯博弈】之二:重复博奕中的行为和行为规则

http://www.hjclub.com/TextBody/16809.asp



【博弈论漫谈·囚犯博弈】之三:自动机与博奕策略

http://www.hjclub.com/TextBody/17116.asp





作者:Anonymous罕见奇谈 发贴, 来自 http://www.hjclub.org
返回顶端
    显示文章:     
    回复主题   printer-friendly view    海纳百川首页 -> 罕见奇谈 所有的时间均为 北京时间


     
    论坛转跳:   
    不能在本论坛发表新主题
    不能在本论坛回复主题
    不能在本论坛编辑自己的文章
    不能在本论坛删除自己的文章
    不能在本论坛发表投票
    不能在这个论坛添加附件
    不能在这个论坛下载文件


    based on phpbb, All rights reserved.
    [ Page generation time: 2.102904 seconds ] :: [ 24 queries excuted ] :: [ GZIP compression enabled ]