[转载]：博弈论与纳什平衡 (车东[Blog^2])

[转载]：博弈论与纳什平衡

博弈论（game theory）对人的基本假定是：人是理性的（rational，或者说自私的）,理性的人是指他在具体策略选择时的目的是使自己的利益最大化，博弈论研究的是理性的人之间如何进行策略选择的。

纳什（John Nash）编制的博弈论经典故事"囚徒的困境"，说明了非合作博弈及其均衡解的成立，故称"纳什平衡"。

所有的博弈问题都会遇到三个要素。在囚徒的故事中，两个囚徒是当事人(players)又称参与者；当事人所做的选择策略 (strategies)是承认了杀人事实，最后两个人均赢得(payoffs)了中间的宣判结果。如果两个囚徒之中有一个承认杀人，另外一个抵赖，不承认杀人，那么承认者将会得到减刑处理，而抵赖者将会得到最严厉的死刑判决，在纳什故事中两个人都承认了犯罪事实，所以两个囚徒得到的是中间的结果。

类似的：我们也能从“自私的基因”等理论中看到“纳什平衡”的体现。

在互联网这个原始丛林中：最优策略是如何产生的呢？

一、博弈中最优策略的产生

艾克斯罗德（Robert Axelrod）在开始研究合作之前，设定了两个前提：一、每个人都是自私的；二、没有权威干预个人决策。也就是说，个人可以完全按照自己利益最大化的企图进行决策。在此前提下，合作要研究的问题是：第一、人为什么要合作；第二、人什么时候是合作的，什么时候又是不合作的；第三、如何使别人与你合作。

社会实践中有很多合作的问题。比如国家之间的关税报复，对他国产品提高关税有利于保护本国的经济，但是国家之间互提关税，产品价格就提高了，丧失了竞争力，损害了国际贸易的互补优势。在对策中，由于双方各自追求自己利益的最大化，导致了群体利益的损害。对策论以著名的囚犯困境来描述这个问题。

A和B各表示一个人，他们的选择是完全无差异的。选择C代表合作，选择D代表不合作。如果AB都选择C合作，则两人各得3分；如果一方选C，一方选D，则选C的得零分，选D的得5分；如果AB都选D，双方各得1分。

显然，对群体来说最好的结果是双方都选C，各得3分，共得6分。如果一方选C，一方选D，总体得5分。如果两人都选D，总体得2分。

对策学界用这个矩阵来描述个体理性与群体理性的冲突：每个人在追求个体利益最大化时，就使群体利益受损，这就是囚徒困境。在矩阵中，对于A来说，当对方选C，他选D得5分，选C只得3分；当对方选D，他选D得1分，选C得零分。因此，无论对方选C或D，对A来说，选D都得分最多。这是A单方面的优超策略。而当两个优超策略相遇，即A，B都选D时，结果是各得1分。这个结果在矩阵中并非最优。困境就在于，每个人采取各自的优超策略时，得出的解是稳定的，但不是帕累托最优的，这个结果体现了个体理性与群体理性的矛盾。在数学上，这个一次性决策的矩阵没有最优解。

如果博弈进行多次，只要对策者知道博弈次数，他们在最后一次肯定采取互相背叛的策略。既然如此，前面的每一次也就没有合作的必要，因此，在次数已知的多次博弈中，对策者没有一次会合作。

如果博弈在多人间进行，而且次数未知，对策者就会意识到，当持续地采取合作并达成默契时，对策者就能持续地各得3分，但如果持续地不合作的话，每个人就永远得1分。这样，合作的动机就显现出来。多次对局下，未来的收益应比现在的收益多一个折现率W，W越大，表示未来的收益越重要。在多人对策持续进行下去，且W比较大，即未来充分重要时，最优的策略是与别人采取的策略有关的。假设某人的策略是，第一次合作，以后只要对方不合作一次，他就永不合作。对这种对策者，当然合作下去是上策。假如有的人不管对方采取什么策略，他总是合作，那么总是对他采取不合作的策略得分最多。对于总是不合作的人，也只能采取不合作的策略。

艾克斯罗德做了一个实验，邀请多人来参加游戏，得分规则与前面的矩阵相同，什么时候结束游戏是未知的。他要求每个参赛者把追求得分最多的策略写成计算机程序，然后用单循环赛的方式将参赛程序两两博弈，以找出什么样的策略得分最高。

第一轮游戏有14个程序参加，再加上艾克斯罗德自己的一个随机程序(即以50%的概率选取合作或不合作)，运转了300次。结果得分最高的程序是加拿大学者罗伯布写的"一报还一报"(tit for tat)。这个程序的特点是，第一次对局采用合作的策略，以后每一步都跟随对方上一步的策略，你上一次合作，我这一次就合作，你上一次不合作，我这一次就不合作。艾克斯罗德还发现，得分排在前面的程序有三个特点：第一，从不首先背叛，即"善良的"；第二，对于对方的背叛行为一定要报复，不能总是合作，即" 可激怒的"；第三，不能人家一次背叛，你就没完没了的报复，以后人家只要改为合作，你也要合作，即"宽容性"。

为了进一步验证上述结论，艾氏决定邀请更多的人再做一次游戏，并把第一次的结果公开发表。第二次征集到了62个程序，加上他自己的随机程序，又进行了一次竞赛。结果，第一名的仍是"一报还一报"。艾氏总结这次游戏的结论是：第一，"一报还一报"仍是最优策略。第二，前面提到的三个特点仍然有效，因为63人中的前15名里，只有第8名的哈灵顿程序是"不善良的"，后15名中，只有1个总是合作的是"善良的"。可激怒性和宽容性也得到了证明。此外，好的策略还必须具有的一个特点是"清晰性"，能让对方在三、五步对局内辨识出来，太复杂的对策不见得好。"一报还一报"就有很好的清晰性，让对方很快发现规律，从而不得不采取合作的态度。

　二、合作的进行过程及规律

"一报还一报"的策略在静态的群体中得到了很好的分数，那么，在一个动态的进化的群体中，这种合作者能否产生、发展、生存下去呢？群体是会向合作的方向进化，还是向不合作的方向进化？如果大家开始都不合作，能否在进化过程中产生合作？为了回答这些疑问，艾氏用生态学的原理来分析合作的进化过程。

假设对策者所组成的策略群体是一代一代进化下去的，进化的规则包括：一，试错。人们在对待周围环境时，起初不知道该怎么做，于是就试试这个，试试那个，哪个结果好就照哪个去做。第二，遗传。一个人如果合作性好，他的后代的合作基因就多。第三，学习。比赛过程就是对策者相互学习的过程，"一报还一报"的策略好，有的人就愿意学。按这样的思路，艾氏设计了一个实验，假设63个对策者中，谁在第一轮中的得分高，他在第二轮的群体中所占比例就越高，而且是他的得分的正函数。这样，群体的结构就会在进化过程中改变，由此可以看出群体是向什么方向进化的。

实验结果很有趣。"一报还一报"原来在群体中占1/63，经过1000代的进化，结构稳定下来时，它占了24%。另外，有一些程序在进化过程中消失了。其中有一个值得研究的程序，即原来前15名中唯一的那个"不善良的"哈灵顿程序，它的对策方案是，首先合作，当发现对方一直在合作，它就突然来个不合作，如果对方立刻报复它，它就恢复合作，如果对方仍然合作，它就继续背叛。这个程序一开始发展很快，但等到除了"一报还一报"之外的其它程序开始消失时，它就开始下降了。因此，以合作系数来测量，群体是越来越合作的。

进化实验揭示了一个哲理：一个策略的成功应该以对方的成功为基础。"一报还一报"在两个人对策时，得分不可能超过对方，最多打个平手，但它的总分最高。它赖以生存的基础是很牢固的，因为它让对方得到了高分。哈灵顿程序就不是这样，它得到高分时，对方必然得到低分。它的成功是建立在别人失败的基础上的，而失败者总是要被淘汰的，当失败者被淘汰之后，这个好占别人便宜的成功者也要被淘汰。

那么，在一个极端自私者所组成的不合作者的群体中，"一报还一报"能否生存呢？艾氏发现，在得分矩阵和未来的折现系数一定的情况下，可以算出，只要群体的 5%或更多成员是"一报还一报"的，这些合作者就能生存，而且，只要他们的得分超过群体的总平均分，这个合作的群体就会越来越大，最后蔓延到整个群体。反之，无论不合作者在一个合作者占多数的群体中有多大比例，不合作者都是不可能自下而上的。这就说明，社会向合作进化的棘轮是不可逆转的，群体的合作性越来越大。艾克斯罗德正是以这样一个鼓舞人心的结论，突破了"囚犯困境"的研究困境。

在研究中发现，合作的必要条件是：第一、关系要持续，一次性的或有限次的博弈中，对策者是没有合作动机的；第二、对对方的行为要做出回报，一个永远合作的对策者是不会有人跟他合作的。

那么，如何提高合作性呢？首先，要建立持久的关系，即使是爱情也需要建立婚姻契约以维持双方的合作。（火车站的小贩为什么要骗人？为什么工作中要形成小组制度？换防的时候一方总是要小小地进攻一下的，在中越前线就是这样）第二、要增强识别对方行动的能力，如果不清楚对方是合作还是不合作，就没法回报他了。第三、要维持声誉，说要报复就一定要做到，人家才知道你是不好欺负的，才不敢不与你合作。第四、能够分步完成的对局不要一次完成，以维持长久关系，比如，贸易、谈判都要分步进行，以促使对方采取合作态度。第五、不要嫉妒人家的成功，"一报还一报"正是这样的典范。第六、不要首先背叛，以免担上罪魁祸首的道德压力。第七、不仅对背叛要回报，对合作也要作出回报。第八、不要耍小聪明，占人家便宜。

（打桥牌和打麻将的区别）

艾克斯罗德在《合作的进化》一书结尾提出几个结论。第一、友谊不是合作的必要条件，即使是敌人，只要满足了关系持续，互相回报的条件，也有可能合作。比如，第一次世界大战期间，德英两军在战壕战中遇上了三个月的雨季，双方在这三个月中达成了默契，互相不攻击对方的粮车给养，到大反攻时再你死我活地打。这个例子说明，友谊不是合作的前提。第二、预见性也不是合作的前提，艾氏举出生物界低等动物、植物之间合作的例子来说明这一点。但是，当有预见性的人类了解了合作的规律之后，合作进化的过程就会加快。这时，预见性是有用的，学习也是有用的。

当游戏中考虑到随机干扰，即对策者由于误会而开始互相背叛的情形时，吴坚忠博士经研究发现，以修正的"一报还一报"，即以一定的概率不报复对方的背叛，和 "悔过的一报还一报"，即以一定的概率主动停止背叛。群体所有成员处理随机环境的能力越强，"悔过的一报还一报"效果越好，"宽大的一报还一报"效果越差。

　三、艾克斯罗德的贡献与局限性

艾克斯罗德通过数学化和计算机化的方法研究如何突破囚徒困境，达成合作，将这项研究带到了一个全新境界，他在数学上的证明无疑是十分雄辩和令人信服的，而且，他在计算机模拟中得出的一些结论是非常惊人的发现，比如，总分最高的人在每次博弈中都没有拿到最高分。（刘邦和项羽的战争）

艾氏所发现的"一报还一报"策略，从社会学的角度可以看作是一种"互惠式利他"，这种行为的动机是个人私利，但它的结果是双方获利，并通过互惠式利他有可能覆盖了范围最广的社会生活，人们通过送礼及回报，形成了一种社会生活的秩序，这种秩序即使在多年隔绝，语言不通的人群之间也是最易理解的东西。比如，哥伦布登上美洲大陆时，与印地安人最初的交往就开始于互赠礼物。有些看似纯粹的利他行为，比如无偿损赠，也通过某些间接方式，比如社会声誉的获得，得到了回报。研究这种行为，将对我们理解社会生活有很重要的意义。

囚徒困境扩展为多人博弈时，就体现了一个更广泛的问题──"社会悖论"，或"资源悖论"。人类共有的资源是有限的，当每个人都试图从有限的资源中多拿一点儿时，就产生了局部利益与整体利益的冲突。人口问题、资源危机、交通阻塞，都可以在社会悖论中得以解释，在这些问题中，关键是通过研究，制定游戏规则来控制每个人的行为。

艾克斯罗德的一些结论在中国古典文化道德传统中可以很容易地找到对应，"投桃报李"、"人不犯我，我不犯人"都体现了"tit for tat"的思想。但这些东西并不是最优的，因为"一报还一报"在充满了随机性的现实社会生活里是有缺陷的。对此，孔子在几千年前就说出了"以德报德，以直报怨"这样精彩的修正策略，所谓"直"，就是公正，以公正来回报对方的背叛，是一种修正了的"一报还一报"，修正的是报复的程度，本来会让你损失5分，现在只让你损失3分，从而以一种公正审判来结束代代相续的报复，形成文明。

但是，艾氏对博弈者的一些假设和结论使其研究不可避免地与现实脱节。首先，《合作的进化》一书暗含着一个重要的假定，即，个体之间的博弈是完全无差异的。现实的博弈中，对策者之间绝对的平等是不可能达到的。一方面，对策者在实际的实力上有差异，双方互相背叛时，可能不是各得1分，而是强者得5分，弱者得0 分，这样，弱者的报复就毫无意义。另一方面，即使对局双方确实旗鼓相当，但某一方可能怀有赌徒心理，认定自己更强大，采取背叛的策略能占便宜。艾氏的得分矩阵忽视了这种情形，而这种赌徒心理恰恰在社会上大量引发了零和博弈。因此，程序还可以在此基础上进一步改进。

其次，艾氏认为合作不需预期和信任。这是他受到质疑颇多之处。对策者根据对方前面的战术来制定自己下面的战术，合作要求个体能够识别那些曾经相遇过的个体并且记得与其相互作用的历史，以便作出反应，这些都暗含着"预期"行为。在应付复杂的对策环境时，信任可能是对局双方达成合作的必不可少的环节。但是，预期与信任如何在计算机的程序中体现出来，仍是需要研究的。

最后，重复博弈在现实中是很难完全实现的。一次性博弈的大量存在，引发了很多不合作的行为，而且，对策的一方在遭到对方背叛之后，往往没有机会也没有还手之力去进行报复。比如，资本积累阶段的违约行为，国家之间的核威慑。在这些情况下，社会要使交易能够进行，并且防止不合作行为，必须通过法制手段，以法律的惩罚代替个人之间的"一报还一报"，规范社会行为。这是艾克斯罗德的研究对制度学派的一个重要启发。

注：没有找到文章出处，请知情者提供线索。

作者：车东发表于：2005-04-12 20:04 最后更新于：2007-04-15 19:04
版权声明：可以转载，转载时请务必以超链接形式标明文章 [转载]：博弈论与纳什平衡的原始出处和作者信息及本版权声明。
http://www.chedong.com/blog/archives/000728.html

« FeedBurner: 使用RSS路由器的风险 | (回到Blog入口)|(回到首页) | 免费杀毒软件下载：AVG Avira Avast » [再编辑]

Comments

博弈论的规则在数学上也许可以用决策树(Decision Tree)来解释，根据每一步的概率计算各种最终出现的情况的概率，从而能够选择对自己利益最佳的。

回复6e：
但很多概率的计算所依赖的基础数据还是很难量化；

车东

由: 6e 发表于 2005年04月13日早上08时30分

文章逻辑相当清晰,车东真是十分了得.

回复：大郎
抱歉：没有附上文章出处，只是最近在学习这方面的资料。

由: 大郎发表于 2005年04月14日上午10时23分

车东，我是你以前网易的同事，你这文章写的不错，也许我们有机会可以交流交流。

由: 陈镇波发表于 2005年04月25日晚上09时44分

我有点迟钝阿，“如果博弈进行多次，只要对策者知道博弈次数，他们在最后一次肯定采取互相背叛的策略”，这是为什么呢，。。。。想不明白哦。。。。。

由: twenty 发表于 2005年07月28日晚上09时27分

因为每个人都要最大化自己的利益。如果双方指导博弈次数，那么每一次他们都会选择合作，来扩大利益.但是最后一次的时候对策者就会希望能得到那个5分而选择D,从而互相背叛。

由: cat 发表于 2005年08月21日晚上10时49分

先试试能发表吗

由: dingolinbo 发表于 2005年11月14日下午12时13分

完全和不完全信息,有无威胁可以置信,寡头利益,垄断利益,双赢,--------纳什均衡.~!

由: dingolinbo 发表于 2005年11月14日下午12时18分

精彩！

由: airlink 发表于 2005年12月16日晚上09时57分

"在研究中发现，合作的必要条件是：第一、关系要持续，一次性的或有限次的博弈中，对策者是没有合作动机的；第二、对对方的行为要做出回报，一个永远合作的对策者是不会有人跟他合作的。"
这一段，第二点，疑为“一个永远不合作的对策者是不会有人跟他合作的。”之误。

车东介绍艾克斯罗德的研究成果很透彻。不过该成果的标准化建模，使其结论带有更多的鼓舞性。而事实可能是“怨怨相报何时了”。在非合作的环境，善良将成为历史名词，这是非常可怕的。

由: ablo 发表于 2005年12月22日下午01时31分

因此，在博弈中，应该存在一个临界点，该临界点会导致社会整体朝合作转化还是朝不合作转化。
感觉中国的现状是朝不合作转化。这个时候，社会治理的整体成本非常大。道德的说教失去作用，严刑峻法不足以威慑，既得利益者不择手段捞取资本，文化附庸寡廉鲜耻，为虎作伥。其最终后果，就是进入“分久必合，合久必分，乱久必治，治久必乱”这种政治周期的怪圈。

由: ablo 发表于 2005年12月22日下午01时39分

有资格博弈的,是没赌输的.
没资格博的.就是赌输的.
好啊.田忌赛马的另一老外解释.

由: dave 发表于 2006年03月09日傍晚08时59分

社会上更多的是一次性的非合作博弈
所以一些理论的使用面比较狭窄

由: DDV 发表于 2006年03月09日晚上09时12分

我也刚刚对博弈论感兴趣，有机会向你请教啊～

由: Samuel 发表于 2006年03月28日晚上10时09分

刚刚开始学呢，才起步，请多指教~~鞠躬

由: Emily 发表于 2006年04月01日晚上10时23分

大家对博弈有兴趣，那来一起玩嘛

由: a.sang 发表于 2006年04月08日上午10时00分

令社会参与者懂得合作，从基础教育开始。我是miss，有这个使命！

由: sarah w 发表于 2006年05月07日夜间12时37分

好文章啊，我喜欢。
我以前只是听说，现在总算有个大概了解了
多谢楼主。
以后多多学习，肯定用得上的

由: Julia 发表于 2006年05月23日晚上10时04分

数学的深入研究,会使社会科学和人文科学与自然科学在最后相结合.以前上高中的时候就有这种感觉.哲学和数学的顶点一定是在一起的.甚至宗教都可以用数学的量化来解释.

怎么想怎么说,初来窄到,多多关照

由: pink.9 发表于 2006年05月28日傍晚07时41分

不好意思,改正一个错字

初来乍到.希望作者能有回复

由: pink.9 发表于 2006年05月28日傍晚08时01分

听说过博弈论，但是今天是第一次读到文章，车东的文思很敏捷，佩服！希望以后多见到你的文章。

由: steven 发表于 2006年06月18日下午02时21分

如果博弈进行多次，只要对策者知道博弈次数，他们在最后一次肯定采取互相背叛的策略。既然如此，前面的每一次也就没有合作的必要，因此，在次数已知的多次博弈中，对策者没有一次会合作.
想了好久才明白这句话。

由: white 发表于 2006年07月13日下午02时41分

在现实世间中,博弈论的观点似乎在触动我们生活的每一个细节,我们怎样才能把其中的理论用活是最重要的事,然儿似乎只有极少数的人做的好!

由: 肖正言发表于 2006年07月13日晚上09时23分

不过现实生活中,很难说清这合作的次数是不是已知的

由: 1573 发表于 2006年08月30日下午12时34分

非常感谢车东的总结。我正开始思考一些类似的行为，以进化的手段来建立文明的规则，而不是“囚徒困境”。你的总结结了我一些背景的知识，衷心的感谢。

由: zhigang 发表于 2006年10月04日晚上09时24分

不好意思阿，我有个问题向大家请教：如果策略者恰恰在“根据每一步的概率计算各种最终出现的情况的概率，从而能够选择对自己利益最佳的。”中偶然的悖律操作，纳什平衡理论还有用吗？或者说是不是这个理论不讨论的范畴呢？谢谢大家帮助，刚设计博弈论，什么都不懂哈！

由: 奥斯丁发表于 2006年10月07日夜间03时39分

写的不错，正在读韩唐先生的＜博弈生存＞，觉得有必要读读原著，或扩大知识面，韩先生写的似是而非，好多东西没写透，看了你的有些开阔视野的意思．感谢！

由: 大嘴发表于 2006年10月10日晚上11时38分

正在学习博弈论......
此文章写得非常好！

由: ycw 发表于 2006年10月15日下午03时21分

正在学习微观经济学有些地方不怎么明白。想请教一下，在两人3×3的静态对策中，怎样分析纳什均衡，

由: tom 发表于 2006年10月22日下午06时32分

合作就是竞争，博弈在当今社会很难实现得了，每个人都在为自己的利益最大话而努力，即使合作，也会出现过程中背叛的结果！都会认为自己是强者，在竞争中，没有人会服输，如果照囚徒博弈说的，聪明人都会选择合作，而之所以选择不合作，也只能说是心大！如果合作双方实力差距体现的比较明显，大可以不去合作，实力强的一方可以以上级与下级的关系去支配另一方做事，这又何来的囚徒博弈可言？？？？？？？？

由: student 发表于 2006年11月02日上午11时49分

在博弈论外，其实还存在很多的变量事情也许还有其他的变化，也许是我不够了解博弈论的真谛吧

由: Echochen 发表于 2006年11月16日下午05时47分

初涉这种游戏理论，感觉分析的很经典，人生经历丰富，理解会更透彻，但在实际应用的时候,个人感觉缺少的是胆量,否则收益应该是明显的

由: workman30 发表于 2006年11月29日下午02时50分

博弈论的最终结论是多人博弈则合作最佳,而且不存在赢家.

由: 炜锋发表于 2006年12月11日晚上09时12分

博弈论只能是相对于一开始就有同等机会的人而言，如果小企业家和大的厂商谈博弈，并不是说难，而是真的很悬啊

由: qq 5619755 发表于 2007年01月10日上午11时39分

非常欣赏你的文章．有点问题请指教："在研究中发现，合作的必要条件是：第一、关系要持续，一次性的或有限次的博弈中，对策者是没有合作动机的；第二、对对方的行为要做出回报，一个永远合作的对策者是不会有人跟他合作的。"
这一段，第二点，疑为“一个永远合作的对策者是不会有人跟他合作的。”能否请车东先生（女士）解释一下？那么是不是说一定不要让对局者发现自己是要合作的？解释不通啊．还是少个字？谢谢！！

由: 芳草也忧发表于 2007年01月13日上午11时37分

好喜欢这篇文章:)

“一个永远合作的对策者是不会有人跟他合作的。”

恍然大悟，如果采取永远合作，也就永远不会有人合作了，这样别人才会得到利益最大化。

由: Windy 发表于 2007年01月27日上午11时18分

好精彩的文章！

看完后，我把自己的看法整理下，毕竟不是学数学的，理解上有些费劲，请车老师指正哦.

1.只有利益上的结盟。
2.结盟无非双赢。
3.每个结盟者都不会诚心诚意，都会乘人之危时捞一把。
4.但为了维持结盟关系，必须假戏真做。
5.该出手时就出手，别做不发威的“hello kitty。”

由: 小菊发表于 2007年02月10日下午01时32分

我认为就象石头剪子布一样，要有心理学做铺垫胜的次数才会多

由: 晓东发表于 2007年04月03日下午06时34分

请教："多次对局下，未来的收益应比现在的收益多一个折现率W，W越大，表示未来的收益越重要。在多人对策持续进行下去，且W比较大，即未来充分重要时..."，这个折现率W，其定义是怎么样的呢？能不能充分解释一下这个概念？

由: manon 发表于 2007年04月05日下午06时32分

艾氏的合作理论由于其前提的设置，在现实生活运用中还存在如下局限：
1。“人是理性的”，而现实生活中人恰恰是理性与非理性的混合体，非理性的判断和行为在现实生活中比比皆是，而且影响巨大，股市的动荡就是极好的例子。
2。在混沌的系统中，正反馈的作用巨大，微小的因素会被无限放大，这会不会干扰合作趋势的形成呢？（这只是一个念头，还没有深入思考，抱歉。）

由: manon 发表于 2007年04月05日下午06时39分

http://zh.wikipedia.org/w/index.php?title=%E5%9B%9A%E5%BE%92%E5%9B%B0%E5%A2%83&variant=zh-cn

关于博弈论,大家还可以去维基上翻翻,很好的入门读物.

由: bbzhang 发表于 2007年04月19日下午02时07分

我在渺渺然兮的博客上，转载了这篇文章，特此感谢！因策划了一件事情，不好表说，突想起“博弈”这两个字，一查看很符合，就用上了！

由: 渺渺然兮发表于 2007年04月26日下午04时37分

我非常的喜欢下棋，那么我适合学博奕吗

由: lhc 发表于 2007年05月06日夜间12时12分

第一次学习博弈论,觉得挺有意思的

由: mas 发表于 2007年05月11日下午04时24分

假如有的人不管对方采取什么策略，他总是合作，那么总是对他采取不合作的策略得分最多。

一个永远合作的对策者是不会有人跟他合作的

一起读就会明白了..

由: 羊发表于 2007年05月27日晚上10时49分

钱钟书在围城里对于双赢打了个比方:好比药店掌柜代开棺材铺,吃死你同时还赚副棺材板钱.

第二十二条军规中规定:只有精神病人才可以终止飞行任务,但前提是必须提出申请,可是一个精神病人是不可能提出申请的,所以只有一直飞下去.

由: 王小更发表于 2007年07月06日下午06时39分

“一个永远合作的对策者是不会有人跟他合作的。”

我觉得很奇怪
没有人会不想和一个合作者合作，不管是永远的还是非永远的
我觉得应该是这个永远的合作者会没有能力继续博弈而被淘汰

第一次看博弈论，请指教。

由: Moselle 发表于 2007年07月11日下午06时14分

今天上论坛第二次见博弈这词,所以一搜就进来了,感觉还行,但还是没悟出什么,存下来慢慢看.我刚学管理不久,上了专业课只知道要学经济就要学会追求最大利益化,可是对这些一点概念感觉都没有,我刚看一电影,里面说学商科的都是没有什么方向才选择的,和符合我,但是既然选择就要用心学,期待你的作品.

由: 沈清发表于 2007年07月29日下午03时20分

“一个永远合作的对策者是不会有人跟他合作的。”

我觉得很奇怪
没有人会不想和一个合作者合作，不管是永远的还是非永远的
我觉得应该是这个永远的合作者会没有能力继续博弈而被淘汰

第一次看博弈论，请指教。
--------------------------------------
应该这样理解,因为他采取永远合作,而背叛获得的分数更高,所以我和他合作的时候毫无意外的选择一次次的背叛.所以对于他来说,的确是没有人和他合作的.(这里不讨论他是否有能力永远合作)

由: Bassinio 发表于 2007年08月01日上午10时36分

“一个永远合作的对策者是不会有人跟他合作的。”

简单的说，就是如果大家知道某一个人是老实人，永远都只会选择跟人合作，那么为了追求自己的利益最大化，所有人都会选择不与他合作。

很冷酷的现实。

由: Devon 发表于 2007年08月10日下午04时31分

谢谢Bassinio的解释！

原来是我对于“合作”一词的误解！
（我的理解是“选择合作”，这里应该是“进行合作”吧）

谢谢~！

由: Moselle 发表于 2007年08月21日下午05时42分

是否也可以这样理解：对于一个利益集团。虽然互相之间都有矛盾，但在面对共同的利益时，回选择相互合作。共同谋取最大化的利益。而一旦没有了敌对方或竞争对手，那么他们之间的斗争又将是你死我活的。彼此的合作都是有底限和有保留的。为的只是共同的利益。而如果，一个可以共同谋取利益的广大群体如弱于他们的群体的存在，就能使这个集团的存在时间长久下去。而威胁其自身存在的，正是其自身内部的矛盾对立。呵呵，这不就成了人的本性与生存原则了么？就象是几只狼养着一大群羊一样。既要让羊信任，又要吃羊。

由: ktvsir 发表于 2007年10月28日上午10时17分

物竟天择，适者生存。为了生存下去，就是在不断的挣扎，不断的掠夺。

所以，人性本恶。一切的规则，都是强者制订的。而做为制订规则的人，却往往并不一定遵守。规则不过是用来约束那些弱者的。就如看管着一大群羊的狼。规则就是披在狼身上的羊皮。狼是很聪明的。它不可能一天就把羊全吃光了。这样，它也活不了多久。所以，它披上了羊皮。给羊群制订了规则。当羊们互相争夺，踩踏时，狼正在悠然的吃着羊肉。

羊是温顺的，听话的。只知道遵守狼制订的规则。偶尔看到狼的本来面目的羊。要么被吃掉，要么就是假装什么也没看到。只有狼想让它活的羊，才能安全的活着。但，总免不了被狼当做午餐的一天。

人的社会，也大体如此。拥有强势力量的集团，可以制订对自己有利的规则。甚至，还可以给这些规则冠以庄重的称谓。而那些为有了这些规则欢呼的人们。却不知道早已经落入了圈套。没有什么人或集团，会为了别人的利益而舍弃自己的利益。这不过是个平衡的问题。

人的进化，其实就是剥削手段的进化。从用武力进化到运用智力。

狼群和羊群一样，都在为自身的生存而互相竞争。狼的竞争，是为了获得地位和权利，获得更多的羊。而羊的竞争却是生存，如何才能生存得比其他羊更久更好。而一定程度上，狼虽然有实力消灭对方，但为了长久的利益。彼此间只会互相威慑，而不是真的消灭对方。因为，由于没有帮手，狼对羊群的管理就会逐渐弱化。最终导致完全失去对羊群的占有，自己也会饿死。反之，羊群也因为数量的优势，而使个体得到保护。

人的本性，就是自私和贪婪。这才是社会进步的动力。而又是这个动力，最终又会成为毁灭整个平衡结构的诱因。
人最大的敌人，其实就是他自己的贪婪。

由: wudetai 发表于 2007年10月28日上午10时34分

不错我正学习博弈论我发现我以前经常都不是采用最优策略可能是因为我这人不理性~

由: 果果发表于 2007年12月02日下午03时56分

太简单化了吧，不过的确可以学一学，下棋吗，当然是在人与人之间，猪是肯定下不过人的，人就有高低之分，学一点总比不学强。我只是觉得太简单了点，其实我下棋的水平很臭，但棋中高手有几个学过博弈论呢？人生可不只是博弈，不信问问你父母，你是不是他们博弈的结果和对象。

由: 子发表于 2007年12月10日下午04时10分

喜欢博弈论，整体利益最大化。

由: 和发表于 2008年02月26日下午03时35分

我近两年内专门研究博弈论的均衡与实现路径问题。我有两点较为深刻的感受，一是现有博弈理论中含有大量的富有启发性的观点、思维和方法，二是现有理论比较普遍地存在着以偏概全的缺陷（表现在理论的严谨性和现实性两个方面）。我想提请对博弈论感兴趣的朋友们，在吸收有关知识的同时，一定要注意避免走入教条或绝对化的误区。我们应该谨记：一是人类的行为是极其复杂的，二是人类行为也是有一定规律可循的，特别地，这里所谓的“规律”一般只具有统计上的意义（发生的相对高频率）。

由: charles 发表于 2008年03月01日上午10时47分

路过的,
我个人提出一个观点,对于各种对策者的心理素质,不妨参考心理学上用来判断一个人是否有赌徒心理的反叛概率,再结合"一报还一报",改善那个"一报"的概率,这样就能更好地动态平衡利益了

由: 毕星杭发表于 2008年06月05日上午10时48分

博弈论是很广泛，深刻的一门学问，看了一点点就在这发表偏见，说什么以偏概全，现实难用；肤浅！例子很常见，但是把它用逻辑的方式无限的扩大化，逻辑抽象化，更示其能之所长!难道颁给科学家纳什诺贝尔奖的科学家都不如你们这些宵小吗？希望国人可以不断反省自身，深刻的研究此门学问，可谓博大精深！

由: aking 发表于 2008年06月11日晚上10时25分

太神奇了，通过你的博客里的词释链接可以打开中文维基百科（Wikipedia).

由: iMe 发表于 2008年07月07日下午03时21分

好棒的文章！对课堂上学的经济知识是很好的补充，我们的教授本来就是研究博弈论的，所以好好的微观经济学彻底被博弈论占领了大部分江山：）

由: yvettefrancais 发表于 2008年12月23日夜间03时48分

掌握高熵赛棋，掌握对手，赢得博弈

我们把人类生命运动的形式，看成是一种高级的运动形式，在博弈的行为中表现出来的结果却是很低级的。博弈是自然界中最为直观的经济模式，任何人从博弈失误的行为结果中可以看出，博弈排除了智力，排除了地位、荣誉和友谊，排除了人性表面的一切东西。《博弈圣经》上说：“好像自然不接受内在友谊，也不接受热爱和尊重，让我们冷酷无情地与它竞争。”所以，博弈的复杂、深奥和博弈结果的无情让所有人不敢涉足，甚至人们把大部分的博弈形式看成赌博，不能被人接受，甚至咒骂，或被政府抵制。其实人们干的事情，大半就像赌博，只有一小半是按正常规则进行博弈经济活动。
决策人行为对应着的都是大于三的一个博弈实体，这是一大块，一个容得下更多人的博弈平台。也就是说，直接观察人的生物亲序的行为结果，它对应着的都是一个实体，任何人在实体里决策，期望值都不会大于一半。人们很自然地想到，能不能从决策人生物行为失误的对边找到取胜的可能。人们开始用高熵赛棋探索粒子状态，在空间、时间和决策人行为的研究，通过对高熵赛棋粒子行为论的观察，才发现粒子在时空里的特性和大自然红兰红兰红兰运作模式的秘密。
我们用高熵赛棋的红兰位置和规则，反复地对比调换，弄清它们关于时间、空间、红兰、先后等互相嵌套的关系，证明了两个对局角色有着不平等的赢的规则和不同的特性，有一方会占优，高熵赛棋这个规则的规定和所有游戏规则的理性一样，应该是一种偶然，它让人们研究未知事件，简化了一大步。谁能够掌握高熵赛棋两角色，并能控制一方，自己就占优取胜，然后再将这种给决策人行为定性的（方法）移植到百家乐或股市里的操作中，就会在红兰红兰红兰粒子或涨跌的对局中取胜，也可以应用到显示AB的游戏中。
假如将几个参与人都混在一起，用高熵赛棋的规则分配空间位置，就会自然显示出两方不同的输赢规则，真正懂得国正论里的定性，其中一方改用不同的对局特性，占优的一方最终就会占优取胜。通俗地讲，如果你是高熵赛棋的赢家，移植才有可能会赢。
赛棋的玩法及详细资料请参考http://www.caoab.com/index2.html

由: 灰太狼发表于 2009年11月29日傍晚07时30分

博弈一直在以哲学的形式和科学的方式进展着，因而研究它就要进入逻辑哲学领域。博弈的发现并不提供赌博的诀窍，但它确实讨论了定性取胜的本质。博弈并不关注目的的本身，而关注达到目的的行为，达到目的的行为才是经济研究的内容。
摘自：新华网《博弈圣经》

由: 刘梦发表于 2010年01月19日上午10时21分