博弈論


概述

什么是博弈論?

博弈論高級學術著作《博弈聖經》
 
博弈論的定義

博弈論的定義:Definition of the game theory:
我們把動物利用大自然移動的癮魂,在決策人期待的空間裏,形成相對均衡的語文學理論,稱爲博弈論。

摘自《博弈聖經》中《人類未知的藍色檔案》一文)。

The theory of relative balance about the mobile addicts and soul of animals in the nature and in the expectation of decision makers is called the game theory. (quoted from the article “The Blue Files Unknown to Humankind” in Bible of Game Theory)


 

博弈論的陳舊理論

博弈論(Game Theory),有時也稱爲對策論,或者賽局理論,應用數學的一個分支, 目前在生物學,經濟學,國際關系,計算機科學, 政治學,軍事战略和其他很多學科都有廣泛的應用。主要研究公式化了的激勵結構(遊戲或者博弈(Game))間的相互作用。是研究具有鬥爭或競爭性質現象的數學理論和方法。也是運籌學的一個重要學科。 博弈論考慮遊戲中的個體的預測行爲和實際行爲,並研究它們的優化策略。 表面上不同的相互作用可能表現出相似的激勵結構(incentive structure),所以他們是同一個遊戲的特例。其中一個有名有趣的應用例子是囚徒困境悖論(Prisoner's dilemma)。 具有競爭或對抗性質的行爲成爲博弈行爲。在這類行爲中,參加鬥爭或競爭的各方各自具有不同的目標或利益。爲了達到各自的目標和利益,各方必須考慮對手的各種可能的行動方案,並力圖選取對自己最爲有利或最爲合理的方案。比如日常生活中的下棋,打牌等。博弈論就是研究博弈行爲中鬥爭各方是否存在着最合理的行爲方案,以及如何找到這個合理的行爲方案的數學理論和方法。 生物學家使用博弈理論來理解和預測進化論的某些結果。例如,John Maynard Smith 和George R. Price 在1973年發表於Nature上的論文中提出的“evolutionarily stable strategy”的這個概念就是使用了博弈理論。還可以參見進化博弈理論(evolutionary game theory)和行爲生態學(behavioral ecology)。 博弈論也應用於數學的其他分支,如概率,統計和线性規劃等。 
 

博弈論的發展

博弈論的研究可以追溯到19世紀,甚至更早。對於博弈論的研究,开始於策墨洛(Zermelo,1913),波雷爾(Borel,1921)及馮·諾伊曼(von Neumann, 1928),後來由馮·諾伊曼和奧斯卡·摩根斯坦(von Neumann and Morgenstern,1944,1947)(《博弈論與經濟行爲》)首次對其系統化和形式化(參照Myerson, 1991)。隨後約翰·福布斯·納什(John Forbes Nash Jr., 1950, 1951)利用不動點定理證明了均衡點的存在,爲博弈論的一般化奠定了堅實的基礎。 直至《博弈聖經》的出現, 《博弈聖經》與原有博弈論書籍最大的不同就在於,獨創了國正論、國正雙贏理論和粒子行爲論,書中博弈取勝的文化理論統一了人類的博弈佔優行爲。更重要的是,它讓博弈理論終於可以在現實生活中具體操作,讓普通大衆通過研習,成爲真正的博弈高手。因此, 《博弈聖經》中的博弈理論在政治、經濟、文化、生活、娛樂等社會的各個領域具有可應用性,並且對於個人的工作、生活也有具體的指導意義。此外,塞爾頓、哈桑尼的研究也對博弈論發展起到推動作用。今天博弈論已發展成一門較完善的的學科。

我們應用科學發展觀的博弈哲學思想,闡明了博弈論、矛盾論、概率論的战術性質。
博弈論是二人對局,一個叫決策人,一個稱對抗者。
矛盾論是兩個同性質的二人對決。
概率論則是通過二人對局的個數之比得出。
博弈論、矛盾論、概率論各自都是兩個相同性質的對決只能提供經驗,只有對實體與性質的區分才能稱爲知識。西方文化大宗教理論都是極其渺小的個體性質的战術屬性,決不能處理博弈實體裏的战略。在任何博弈實體的系統裏,在具體事件中,用矛盾論建立的二人博弈對局都是在悖論中自圓其說,都不能通達博弈實體的事實真相。博弈論、矛盾論、概率論這些文化大宗教理論已經不能解決未來博弈實體裏的文明,到了極不正常的歷史死亡階段。因爲這些抄來抄去的非物質文化概念,界定模糊,無法定性,無法區分,無法操作,無法驗證,不能證明,又不能證僞。它讓人沒有自在,沒有自我,沒有哲學,更沒有科學。科學不是爲哪個階級服務的,科學是大自然前進的規則,科學又像似監工,《博弈聖經》中說:“科學是專門批判他人的。”任何邪惡和迷信都會後退,科學的任務是如實地讓人們認識自然本來的面貌。粒子行爲論、國正論、國邊常數1.992187是對政府和人民的提醒,也是讓懷疑論者百口難辨。博弈基因取勝的理論會引發更多人對战略文化的思考。

 

分類
博弈的分類根據不同的基準也有不同的分類。一般認爲,博弈主要可以分爲合作博弈和非合作博弈。它們的區別在於相互發生作用的當事人之間有沒有一個具有約束力的協議,如果有,就是合作博弈,如果沒有,就是非合作博弈

行爲時間序列性,博弈論進一步分爲兩類:靜態博弈是指在博弈中,參與人同時選擇或雖非同時選擇但後行動者並不知道先行動者採取了什么具體行動;動態博弈是指在博弈中,參與人的行動有先後順序,且後行動者能夠觀察到先行動者所選擇的行動。通俗的理解:“囚徒困境”就是同時決策的,屬於靜態博弈;而棋牌類遊戲等決策或行動有先後次序的,屬於動態博弈

目前經濟學家們現在所談的博弈論一般是指非合作博弈,由於合作博弈論比非合作博弈論復雜,在理論上的成熟度遠遠不如非合作博弈論。)。

博弈論還又很多分類,比如:以博弈進行的次數或者持續長短可以分爲有限博弈和無限博弈;以表現形式也可以分爲一般型(战略型)或者展开型,等等。

 

博弈論中的國正論

國正論,國正雙贏理論、粒子行爲論,是博弈論的重要理論,出自著名經濟學高級學術著作一書,爲博弈論理論打下了堅實的基礎。

國正論釋義:它是一個實體性質的地域似的區間,具有復雜的結構,用情、理、法、力都不容易分割的一個不知大小的抽象體。從中我們可分出正確和期望得到的那一小部分,與反相對、與負相對,又可以判斷事物的道理。世界上的萬物、事件的結果,都是不平等的、非絕對對立的兩塊,大的那部分是國,小的那部分是正。
博弈聖經》中的國正論
  人的行爲互相作用,互相影響,高熵賽棋─—就是研究判定人的行爲,互相作用時的決策和結果之間的關系,是國是正,沒有任何決策能獨立於國正大小不同的兩塊之外,博弈結果的國正論顯得更爲重要而廣泛。
  世界上的任何事情,都可以看成是博弈,把世界看成是一個大的博弈場。發明家的粒子行爲論、國正論、博弈的正理理論,正在啓迪人們,並逐漸地感覺到那是博弈的大發明,並告訴所有的人,去除一切傳統的博弈思想,改用新的博弈行爲,對待每一個事情,找到一個最好的單方佔優的博弈正理的決策立場,可以對未來一切的事物進行因特分配
       理解國正論的發明,再用國正論理解決策人和對抗者,解釋現在和未來。用國正論解釋不絕對對立的現象十分恰當,當人們涉及到過去,把它看成和現在或未來相關,實際這是混爲一談。整個過去、現在、未來失去了各自的位置,陷入了混沌無序之中,有時候人們把過去當成未來,有時又把現在和二者混起來。一個真切的感覺是它們實現真理的一致性,國正論就是實現它們真理的理論,先進行體驗,辨別出或然性真理,再把未來博弈正理推導出來。我們說國正論是來自大自然,國正論必須被當成自然的教令加以接受,我們注意到,越是崇高神聖的東西越不太容易被接受。國正論的國,指的是包含了負的意思,決策人作出贊成的決定,是國(博弈的結果是負),決策人作出反對的決定也是國(博弈的結果也是負),國與正本身就是一個難以理解的分配結果的博弈的詞匯,一個人決策,兩個以上的人對抗,就有可能會出現雙贏,就是大於兩個以上的合作者才會出現雙贏

 

博弈論的意義

博弈聖經》中《人類未知的藍色檔案》一文中寫道:“誰能讓現代的博弈行爲接近野蠻,誰能讓友善與兇殘之間的距離大到令人不解,誰就在博弈中取勝。”

博弈論的研究方法和其他許多利用數學工具研究社會經濟現象的學科一樣,都是從復雜的現象中抽象出基本的元素,對這些元素構成的數學模型進行分析,而後逐步引入對其形勢產影響的其他因素,從而分析其結果。

基於不同抽象水平,形成三種博弈表述方式,標準型、擴展型和特徵函數型利用這三種表述形式,可以研究形形色色的問題。因此,它被稱爲“社會科學的數學”從理論上講,博弈論是研究理性的行動者相互作用的形式理論,而實際上正深入到經濟學、政治學、社會學等等,被各門社會科學所應用。  

 

國務院的战略版本

 《博弈聖經》中說:"一個民族博弈知識的落後,也會落後其他民族。無論是窮國和富國,還是窮人和富人,都會要求改善博弈的結果。""窮富的區別就在於分享博弈正理的多少。"科學發展觀正在利用道德與博弈的版本作爲战略;整合人才、知識、科技、創新的一切優勢,推進着國家的富強,並向未來發出挑战 
。一個國家的高端人羣和各界精英如果掌握了更多的博弈知識,掌握了博弈方法論,就會表現出令人難以置信的經濟成就。也許在某一時期,他們參與世界博弈的混战,世界經濟也會爲此顫抖。 

 

博弈論對納什的嘲諷

我們用高熵賽棋認識粒子行爲,就是認識人的行爲,它和各單元之間的相互作用就是提示我們認識人和社會的關系,就不是部分之和那樣簡單。其實,它包含了無數個體單元性質的主題,它們相互嵌套在一起,是實體的概念。科學發展觀就是這個博弈實體的概念,《博弈聖經》上說:“實體一元論在數目上的同一性,發生的因果次序不屬於個人的部分本性,這種屬性是實體的性質。”由此看出,人是代表了實體。如果認識科學發展觀是用博弈實體的理論,就可以確定人性與物的對局是決策粒子二特性,也是大自然的平行法則。如果我們用科學發展觀的定義,理解科學發展觀和博弈實體相關聯的許多事物並把它應用到社會中的具體事件上,用四種量具作出的區分,那才是完美的知識論。   由此,我們也看出了三筆糊塗账

一,中國的孫子兵法:運籌帷幄,審時度勢,權衡利弊,知己知彼,至今卻沒有形成標準化的尺度,也沒嚴格的數據。如果我們用科學發展觀的定義度量它們,它是一筆糊塗账。

二,現代人對社會的認識:什么是各部門之間加強溝通、協調與綜合平衡,什么是精確思維和模糊思維的對立統一,什么是個人目標與組織目標綜合思考,什么是定性定量相結合,什么是相互合作又相互競爭,什么是單極思維與綜合思維。我們對每一句話進行追蹤,發現它們抽象、空洞,沒有具體內容。誰也不知道表述的一大半一小半是什么結構,沒有實體,就沒有性質,沒辦法定性就沒辦法區分,沒辦法量化就沒辦法計算。如果我們用科學發展觀的定義度量它們,它又是一筆糊塗账。

三, 近代科學家的理論:廣義相對論和狹義相對論、牛頓的力學和絕對時空觀、彎曲時空、坐標對應、平衡對稱、四維時空、場屬性等這些概念,如果我們用科學發展觀的定義度量它們,它是科學家的一筆糊塗账。

無論他們用什么方法,都是在用不同的方式進行排列,也是在進行博弈重組。幾百年來,人類探索博弈取勝之道毫無進展,理論思維極度混亂。今日我們用科學發展觀的定義再看博弈論、矛盾論、概率論,還有所謂的經濟學名著,無論多么偉大的經濟學天才,使用上述的這些理論,都不知道怎么佔優,不知道怎么能贏。

既然他們在預測未來上毫無進展,那么在科學發展觀的時代,就應該對高熵賽棋研究博弈單方佔優的理論有所關注。即使總統競選也是使用了高熵賽棋二人對局的博弈機制。以往談囚徒困境和納什均衡的人都是用一個模糊的概念搬來搬去,坐在辦公室裏憑空假想,從無知到無聊爭論了半個多世紀。博弈論是賭徒理論,是真正賭徒的矛盾對決,用籌碼表現輸贏與均衡結果的語文學理論那才是真正有價值經濟學理論。看看《博弈聖經》,怎樣區分決策人和對抗者的先後次序,爲什么對它們進行了不同的稱呼,滿足了托馬斯•謝林多年的困惑,實現了它們的單方佔優。更爲諷刺的是,一本本博弈論著作,古老的內容千篇一律,裏面沒有幾句精彩的話,沒有幾個經典的詞,更沒有定理、定律、定義和法則。至今一個個博弈論專家、矛盾論專家、概率論專家和外行知道得一樣多。從《博弈聖經》的出版,人們才知道博弈的二人對局中一個是決策人,一個是對抗者,《博弈聖經》在166節中寫道:“那些身穿黑色禮服,年邁的紳士們,爲博弈的進步捧走了人類最高的諾貝爾獎,這是人類博弈的最高水平,假如他們進入娛樂場,在百家樂的賭臺上搏擊,我想他也會像拳擊運動員一樣被擊敗在拳臺上,這一定是一個事實,他必須接受這個事實,一定會被裁判瀆秒。”

以往經濟學家爲了降低風險,建議投資多元化,“不要把雞蛋放在一個籃子裏”。這種分散投資經濟思想,實在是經濟學家對博弈取勝的無奈。我們把科學發展觀的理論特徵和高熵賽棋的實際相結合,從實際操作的輸贏結果中得出結論:一個資深的經濟學家在高熵賽棋上的表現比一個智力不全的人還佔弱勢,這是無情的博弈事實。《博弈聖經》在453節有一段風趣的表述:“我們根本不能完全理解大自然,或許人們不如老鼠在尋找食物時能選擇最近的路程,那是大自然的拓撲幾何圖像的捷徑。”

 

西方死亡的博弈

非白即黑的矛盾論辯證法已經受到時間、空間和博弈實體特性的極大限制,而博弈論、矛盾論、概率論和西方經濟學一樣都不是完美的理論,已經不能指導博弈實體向更高文明的發展,更不能指導未來。科學發展觀的博弈實體知識論、國正論哲學辯證法、矛盾論經驗對決,它們共同的結構可以構築未來科學、自然哲學博弈實體經濟學。
我們應用科學發展觀的博弈哲學思想,闡明了博弈論、矛盾論、概率論的战術性質。
博弈論是二人對局,一個叫決策人,一個稱對抗者。
矛盾論是兩個同性質的二人對決。
概率論則是通過二人對局的個數之比得出。
博弈論、矛盾論、概率論各自都是兩個相同性質的對決只能提供經驗,只有對實體與性質的區分才能稱爲知識。西方文化大宗教理論都是極其渺小的個體性質的战術屬性,決不能處理博弈實體裏的战略。在任何博弈實體的系統裏,在具體事件中,用矛盾論建立的二人博弈對局都是在悖論中自圓其說,都不能通達博弈實體的事實真相。博弈論、矛盾論、概率論這些文化大宗教理論已經不能解決未來博弈實體裏的文明,到了極不正常的歷史死亡階段。因爲這些抄來抄去的非物質文化概念,界定模糊,無法定性,無法區分,無法操作,無法驗證,不能證明,又不能證僞。它讓人沒有自在,沒有自我,沒有哲學,更沒有科學。科學不是爲哪個階級服務的,科學是大自然前進的規則,科學又像似監工,《博弈聖經》中說:“科學是專門批判他人的。”任何邪惡和迷信都會後退,科學的任務是如實地讓人們認識自然本來的面貌。粒子行爲論、國正論、國邊常數1.992187是對政府和人民的提醒,也是讓懷疑論者百口難辨。博弈基因取勝的理論會引發更多人對战略文化的思考。

 

單方佔優模型

高熵賽棋這個單方佔優的理論模型,把百家樂賭臺當棋盤,把賽棋“紅方、藍方”轉換成“莊、闲”,一旦特性移植的取勝理論被驗證,那些無知又無聊的一維思想,那些忽悠人的博弈論、矛盾論、概率論將被徹底否決。

貨幣的威力》一書中說:“哪裏有生命,哪裏就有事件的开端。哪裏有矛盾,哪裏就有死亡。哪裏有非絕對對對立的國正論,哪裏就有粒子行爲的碰壁而終結,哪裏就有新體制、新結構和新事物的創生。”                                                           
21世紀是科學發展觀的時代,與此同時各種錯誤的觀念都在轉變。未來的專家不必用圍棋、象棋和多米諾骨牌表示博弈對局,這些都不是博弈的實战模型。那些在媒體上拿着棋子在棋盤上比來比去做廣告的人,沒有一個人能講出什么是战略,什么是战術,什么是決策人和對抗者,他們怎么能單方佔優,怎么才能贏。更爲滑稽的是,一個博弈論專家、矛盾論專家、概率論專家,竟沒有創造一個詞,也沒發明一句經典的話,更不要說定理、定律、定義和法則,所以沒有一個人敢公开說怎么贏。

未來的政治家、軍事家不能僅僅喊幾句博弈口號或知道一點散落在民間的博弈小常識和幾個博弈詞匯,也不是講幾個博弈的小故事。如果不知道高熵賽棋具有極其重要的軍事战略文化價值,沒有真正用高熵賽棋的二人對局對其進行深入地實战性研究,就不知道在二人對局中如何战勝對手,更不知道在未來的大博弈中取勝,對一個國家的各級CEO,那將是一個災難性的未來。《博弈聖經》上說:“21世紀博弈的大事是精確地測量,科學家可以對未來100年的科學進行預測,沒有一個人敢預測博弈的未來,可見難度非同一般。不經過測量的東西是粗糙的、雜亂的、不符合意愿的、難以控制的。”《博弈聖經》闡述的理論和高熵賽棋,這不是虛構的文學故事,也不是官員的形式空話,更不是大學裏抄來的論文,這是公开於世的發現,它所有的理論都受到知識產權的法定保護。

 

成語:(1024連勝法則)

 成語:(1024連勝法則)
  高熵賽棋是一個大發明,它是一個博弈的取勝模型,
    總統候選人用它獲得競選寶座,科學家用它有所發現,傻子用它改變智力的結果
    麻將店老板得知這一消息,就买了幾套高熵賽棋放到店裏,結果很少有人玩,該店就決定通過一次競賽讓人們了解高熵賽棋。當競賽信息發出後,奇怪的是前來報名參賽的人有總統候選人、科學家、還有一些傻子。由於賽期和總統競選日期衝突,候選人就不來了,科學家擔心自己發現的成果會泄漏,科學家也不來了,最後有1024個傻子參加競賽,他們使用末尾淘汰制,經過八輪淘汰之後,剩下四個傻子連續八次不敗,讓人無奈的是他們遵照了“1024連勝法則”,其中的一個傻子對麻將店老板說:“博弈不講智力,只要參與就有機會。”

 

博弈聖經》中的映射均衡

博弈聖經》裏《人類未知的藍色檔案》一文中說:“想贏得未來,不是數學家的映射方程,而是映射均衡。”高熵賽棋上每一次發生的事件分別用紅藍粒子進行記錄,可以看成是一個粒子行爲的一次漲落,也是自己的智慧作出與大自然競賽結果的記錄。當同色粒子連續出現三次之後就另外加上一個粒子,通過這樣一個粒子插值,有可能產生一個基本粒子單元,也就相當於結束了一個事件或一個階段。這個虛擬的粒子插值組成了一個粒子大分子,這個插值相當於正常機體裏的癌細胞,它的增值會使這個健康的大分子染上與它同樣的性質,已經失去真實大分子的價值,根據國正論系統的辯證法原理,人們把這個虛擬癌化的大分子看成“國”,把它映射均衡的空間看成一個“正”的穩定區間,這是博弈取勝的空間,在事件發生之前一大半的信息可以被人掌握。

博弈

人的行爲表現自然科學一切創新的文化,借用高熵賽棋這個二人博弈對局的模型認識粒子行爲基因的映射均衡原理,它證明了自然界的一切事物不可約化的復雜性,科學家越來越多的努力在這裏遭到了莫名奇妙的失敗。我們從科學的定義裏可以看出,任何一個人在博弈實體中發生的事件都是前所未有的,也不可預測。誰通過觀察高熵賽棋上的粒子狀態,誰用歷史上自然顯示出來的粒子規律和經驗預測未來,誰將失敗。創新的設計和預測沒有固定的章法,也沒有不變的模式。
經驗是個人可復制的歷史文明行爲
規律是領袖對未來秩序的文化思考。

 

 

合作的過程

博弈論(game theory)對人的基本假定是:人是理性的(rational,或者說自私的),理性的人是指他在具體策略選擇時的目的是使自己的利益最大化,博弈研究的是理性的人之間如何進行策略選擇的。 
納什(John Nash)編制的博弈論經典故事"囚徒的困境",說明了非合作博弈及其均衡解的成立,故稱"納什平衡"。 
所有的博弈問題都會遇到三個要素。在囚徒的故事中,兩個囚徒是當事人(players)又稱參與者;當事人所做的選擇策略 (strategies)是承認了殺人事實,最後兩個人均贏得(payoffs)了中間的宣判結果。如果兩個囚徒之中有一個承認殺人,另外一個抵賴,不承認殺人,那么承認者將會得到減刑處理,而抵賴者將會得到最嚴厲的死刑判決,在納什故事中兩個人都承認了犯罪事實,所以兩個囚徒得到的是中間的結果。 
“一報還一報”的策略在靜態的羣體中得到了很好的分數,那么,在一個動態的進化的羣體中,這種合作者能否產生、發展、生存下去呢?羣體是會向合作的方向進化,還是向不合作的方向進化?如果大家开始都不合作,能否在進化過程中產生合作?爲了回答這些疑問,艾氏用生態學的原理來分析合作的進化過程。 艾克斯羅德(Robert Axelrod)在开始研究合作之前,設定了兩個前提:一、每個人都是自私的;二、沒有權威幹預個人決策。也就是說,個人可以完全按照自己利益最大化的企圖進行決策。在此前提下,合作要研究的問題是:第一、人爲什么要合作;第二、人什么時候是合作的,什么時候又是不合作的;第三、如何使別人與你合作。 
社會實踐中有很多合作的問題。比如國家之間的關稅報復,對他國產品提高關稅有利於保護本國的經濟,但是國家之間互提關稅產品價格就提高了,喪失了競爭力,損害了國際貿易的互補優勢。在對策中,由於雙方各自追求自己利益的最大化,導致了羣體利益的損害。對策論以著名的囚犯困境來描述這個問題。
假設對策者所組成的策略羣體是一代一代進化下去的,進化的規則包括:一,試錯。人們在對待周圍環境時,起初不知道該怎么做,於是就試試這個,試試那個,哪個結果好就照哪個去做。第二,遺傳。一個人如果合作性好,他的後代的合作基因就多。第三,學習。比賽過程就是對策者相互學習的過程,“一報還一報”的策略好,有的人就愿意學。按這樣的思路,艾氏設計了一個實驗,假設63個對策者中,誰在第一輪中的得分高,他在第二輪的羣體中所佔比例就越高,而且是他的得分的正函數。這樣,羣體的結構就會在進化過程中改變,由此可以看出羣體是向什么方向進化的。 實驗結果很有趣。“一報還一報”原來在羣體中佔1/63,經過1000代的進化,結構穩定下來時,它佔了24%。另外,有一些程序在進化過程中消失了。其中有一個值得研究的程序,即原來前15名中唯一的那個“不善良的”哈靈頓程序,它的對策方案是,首先合作,當發現對方一直在合作,它就突然來個不合作,如果對方立刻報復它,它就恢復合作,如果對方仍然合作,它就繼續背叛。這個程序一开始發展很快,但等到除了“一報還一報”之外的其它程序开始消失時,它就开始下降了。因此,以合作系數來測量,羣體是越來越合作的。 進化實驗揭示了一個哲理:一個策略的成功應該以對方的成功爲基礎。“一報還一報”在兩個人對策時,得分不可能超過對方,最多打個平手,但它的總分最高。它賴以生存的基礎是很牢固的,因爲它讓對方得到了高分。哈靈頓程序就不是這樣,它得到高分時,對方必然得到低分。它的成功是建立在別人失敗的基礎上的,而失敗者總是要被淘汰的,當失敗者被淘汰之後,這個好佔別人便宜的成功者也要被淘汰。 那么,在一個極端自私者所組成的不合作者的羣體中,“一報還一報”能否生存呢?艾氏發現,在得分矩陣和未來的折現系數一定的情況下,可以算出,只要羣體的 5%或更多成員是“一報還一報”的,這些合作者就能生存,而且,只要他們的得分超過羣體的總平均分,這個合作的羣體就會越來越大,最後蔓延到整個羣體。反之,無論不合作者在一個合作者佔多數的羣體中有多大比例,不合作者都是不可能自下而上的。這就說明,社會向合作進化的棘輪是不可逆轉的,羣體的合作性越來越大。艾克斯羅德正是以這樣一個鼓舞人心的結論,突破了"囚犯困境"的研究困境。 在研究中發現,合作的必要條件是:第一、關系要持續,一次性的或有限次的博弈中,對策者是沒有合作動機的;第二、對對方的行爲要做出回報,一個永遠合作的對策者是不會有人跟他合作的。 艾克斯羅德在《合作的進化》一書結尾提出幾個結論。第一、友誼不是合作的必要條件,即使是敵人,只要滿足了關系持續,互相回報的條件,也有可能合作。比如,第一次世界大战期間,德英兩軍在战壕战中遇上了三個月的雨季,雙方在這三個月中達成了默契,互相不攻擊對方的糧車給養,到大反攻時再你死我活地打。這個例子說明,友誼不是合作的前提。第二、預見性也不是合作的前提,艾氏舉出生物界低等動物、植物之間合作的例子來說明這一點。但是,當有預見性的人類了解了合作的規律之後,合作進化的過程就會加快。這時,預見性是有用的,學習也是有用的。

 

艾克斯羅德的貢獻與局限性
博弈

艾克斯羅德通過數學化和計算機化的方法研究如何突破囚徒困境,達成合作,將這項研究帶到了一個全新境界,他在數學上的證明無疑是十分雄辯和令人信服的,而且,他在計算機模擬中得出的一些結論是非常驚人的發現,比如,總分最高的人在每次博弈中都沒有拿到最高分。(劉邦和項羽的战爭)

艾氏所發現的“一報還一報”策略,從社會學的角度可以看作是一種"互惠式利他",這種行爲的動機是個人私利,但它的結果是雙方獲利,並通過互惠式利他有可能覆蓋了範圍最廣的社會生活,人們通過送禮及回報,形成了一種社會生活的秩序,這種秩序即使在多年隔絕,語言不通的人羣之間也是最易理解的東西。比如,哥倫布登上美洲大陸時,與印地安人最初的交往就开始於互贈禮物。有些看似純粹的利他行爲,比如無償損贈,也通過某些間接方式,比如社會聲譽的獲得,得到了回報。研究這種行爲,將對我們理解社會生活有很重要的意義。

囚徒困境擴展爲多人博弈時,就體現了一個更廣泛的問題──“社會悖論”,或“資源悖論”。人類共有資源是有限的,當每個人都試圖從有限的資源中多拿一點兒時,就產生了局部利益與整體利益的衝突。人口問題、資源危機、交通阻塞,都可以在社會悖論中得以解釋,在這些問題中,關鍵是通過研究,制定遊戲規則來控制每個人的行爲

艾克斯羅德的一些結論在中國古典文化道德傳統中可以很容易地找到對應,“投桃報李”、“人不犯我,我不犯人”都體現了“tit for tat”的思想。但這些東西並不是最優的,因爲“一報還一報”在充滿了隨機性的現實社會生活裏是有缺陷的。對此,孔子在幾千年前就說出了“以德報德,以直報怨”這樣精彩的修正策略,所謂“直”,就是公正,以公正來回報對方的背叛,是一種修正了的“一報還一報”,修正的是報復的程度,本來會讓你損失5分,現在只讓你損失3分,從而以一種公正審判來結束代代相續的報復,形成文明。

但是,艾氏對博弈者的一些假設和結論使其研究不可避免地與現實脫節。首先,《合作的進化》一書暗含着一個重要的假定,即,個體之間的博弈是完全無差異的。現實的博弈中,對策者之間絕對的平等是不可能達到的。一方面,對策者在實際的實力上有差異,雙方互相背叛時,可能不是各得1分,而是強者得5分,弱者得0分,這樣,弱者的報復就毫無意義。另一方面,即使對局雙方確實旗鼓相當,但某一方可能懷有賭徒心理,認定自己更強大,採取背叛的策略能佔便宜。艾氏的得分矩陣忽視了這種情形,而這種賭徒心理恰恰在社會上大量引發了零和博弈。因此,程序還可以在此基礎上進一步改進。

其次,艾氏認爲合作不需預期和信任。這是他受到質疑頗多之處。對策者根據對方前面的战術來制定自己下面的战術,合作要求個體能夠識別那些曾經相遇過的個體並且記得與其相互作用的歷史,以便作出反應,這些都暗含着"預期"行爲。在應付復雜的對策環境時,信任可能是對局雙方達成合作的必不可少的環節。但是,預期與信任如何在計算機的程序中體現出來,仍是需要研究的。

最後,重復博弈在現實中是很難完全實現的。一次性博弈的大量存在,引發了很多不合作的行爲,而且,對策的一方在遭到對方背叛之後,往往沒有機會也沒有還手之力去進行報復。比如,資本積累階段的違約行爲,國家之間的核威懾。在這些情況下,社會要使交易能夠進行,並且防止不合作行爲,必須通過法制手段,以法律的懲罰代替個人之間的"一報還一報",規範社會行爲。這是艾克斯羅德的研究制度學派的一個重要啓發。

 

著名的例子:“智豬博弈Pigs’payoffs

 這個例子講的是:豬圈裏有兩頭豬,一頭大豬,一頭小豬。豬圈的一邊有個踏板,每 踩一下踏板,在遠離踏板的豬圈的另一邊的投食口就會落下少量的食物。如果有一只豬去踩踏板,另一只豬就有機會搶先喫到另一邊落下的食物。當小豬踩動踏板 時,大豬會在小豬跑到食槽之前剛好喫光所有的食物;若是大豬踩動了踏板,則還有機會在小豬喫完落下的食物之前跑到食槽,爭喫到另一半殘羹。 
  那么,兩只豬各會採取什么策略? 答案是:小豬將選擇“搭便車”策略,也就是舒舒服服地等在食槽邊;而大豬則爲一點殘羹不知疲倦地奔忙於踏板和食槽之間。 
     原因何在?因爲,小豬踩踏板將一無所獲,不踩踏板反而能喫上食物。對小豬而言,無論大豬是否踩動踏板,不踩踏板總是好的選擇。反觀大豬,已明知小豬是不會 去踩動踏板的,自己親自去踩踏板總比不踩強吧,所以只好親力親爲了。 
“小豬躺着大豬跑”的現象是由於 故事中的遊戲規則所導致的。規則的核心指標是:每次落下的事物數量和踏板與投食口之間的距離。 
  如果改變一下核心指標,豬圈裏還 會出現同樣的“小豬躺着大豬跑”的景象嗎?試試看。 
  改變方案一:減量方案。投食僅原來的一半 分量。結果是小豬大豬都不去踩踏板了。小豬去踩,大豬將會把食物喫完;大豬去踩,小豬將也會把食物喫完。誰去踩踏板,就意味着爲對方貢獻食物,所以誰也不 會有踩踏板的動力了。 
  如果目的是想讓豬們去多踩踏板, 這個遊戲規則的設計顯然是失敗的。 
  改變方案二:增量方案。投食爲原來的一倍 分量。結果是小豬、大豬都會去踩踏板。誰想喫,誰就會去踩踏板。反正對方不會一次把食物喫完。小豬和大豬相當於生活在物質相對豐富的“共產主義”社會,所 以競爭意識卻不會很強。 
  對於遊戲規則的設計者來說,這個 規則的成本相當高(每次提供雙份的食物);而且因爲競爭不強烈,想讓豬們去多踩踏板的效果並不好。 
  改變方案三:減量加移位方案。投食僅原 來的一半分量,但同時將投食口移到踏板附近。結果呢,小豬和大豬都在拼命地搶着踩踏板。等待者不得食,而多勞者多得。每次的收獲剛好消費完。 
  對於遊戲設計者,這是一個最好的 方案。成本不高,但收獲最大。 
  原版的“智豬博弈”故事給了競爭 中的弱者(小豬)以等待爲最佳策略的啓發。但是對於社會而言,因爲小豬未能參與競爭,小豬搭便車時的社會資源配置的並不是最佳狀態。爲使資源最有效配置, 規則的設計者是不愿看見有人搭便車的,政府如此,公司的老板也是如此。而能否完全杜絕“搭便車”現象,就要看遊戲規則的核心指標設置是否合適了。 
  比如,公司激勵制度設計,獎勵 力度太大,又是持股,又是期權公司職員個個都成了百萬富翁,成本高不說,員工的積極性並不一定很高。這相當於“智豬博弈”增量方案所描述的情形。但是如 果獎勵力度不大,而且見者有份(不勞動的“小豬”也有),一度十分努力的大豬也不會有動力了----就象“智豬博弈”減量方案一所描述的情形。最好的激勵 機制設計就象改變方案三----減量加移位的辦法,獎勵並非人人有份,而是直接針對個人(如業務按比例提成),既節約了成本(對公司而言),又消除了“搭 便車”現象,能實現有效的激勵。 
  許多人並未讀過“智豬博弈”的故事,但是卻在自覺地使用小豬的策略。股市上等待莊家擡轎的911.html">散戶;等待產業 市場中出現具有贏利能力產品、繼而大舉仿制牟取暴利的遊資;公司裏不創造效益但分享成果的人,等等。因此,對於制訂各種經濟管理的遊戲規則的人,必須深 諳“智豬博弈指標改變的個中道理。 

 

考考文獻

[1] 經濟學高級學術著作《博弈聖經》曹·國正(新加坡) http://www.caoab.com

[2]Harold W. K.(editor), 1997, Classics in Game theory, Princeton, NJ:Princeton University Press ISBN 0691011931

[3]Myerson, R., 1991, Game Theory: Analysis of Conflict. Cambridge and London: Harvard University Press.

熱門資訊更多