對稱協調博弈

什么是對稱協調博弈

　　對稱協調博弈是指無角色區分的參與之間進行的協調博弈，它表現在支付函數的對稱上，策略集是一樣的。從形式上看：對稱協調博弈就是博弈支付矩陣主對角线上的元素都是納什均衡的博弈。協調博弈的均衡選擇並不涉及到激勵問題而依賴於參與人之間對博弈如何進行有充分相似的信念。正是由於信念形成是一個相對復雜的過程，所以對協調博弈均衡問題的研究也就顯得非常復雜，不同的信念形成過程動態就會產生不同的均衡。

對稱協調博弈的類型1

　　對稱協調博弈分成三類：支付佔優與風險佔優不一致；支付佔優與風險佔優一致（嚴格納什均衡可進行帕累托排序均衡）及無佔優性可比的協調博弈。

　　(1)支付佔優與風險佔優不一致的協調博弈

　　這類博弈最典型的例子就是獵鹿博弈。有兩個打獵人，他們可以合作去獵鹿也可以單獨去獵兔，如果合作獵鹿，那么兩個都可以分得4個單位的支付；如果一個人去獵鹿而另一個人去獵兔，那么前者支付爲0（因爲獵鹿需要兩個人合作可以成功）後者的支付爲2；如果兩個人不合作都去獵兔，那么他們都可以得到3單位的支付。該博弈的支付矩陣如下：

	獵鹿	獵兔
獵鹿	4，4	0，2
獵兔	2，0	3，3

　　表一

　　顯然該博弈有兩個純策略嚴格納什均衡即要么兩個合作獵鹿，要么兩人去獵兔與一個混合策略納什均衡。按Harsayi and Selten(1988)²的定義，純策略獵鹿是支付佔優納什均衡、純策略獵兔是風險佔優納什均衡。獵兔策略是一個保險策略，而獵鹿博弈則是一個帕累托效率策略但由於策略的不確定性而使它具有較大的風險，因此，均衡選擇取決於參與人對風險的態度。

　　(2)支付佔優與風險佔優一致的協調博弈³

　　該類博弈典型例子就是中間值博弈、選美博弈或者平均意見博弈，策略值離中間值越遠則成本越大。博弈雙方的支付用代數式表示爲：，其中。這種協調博弈中存在多當具有帕累托可比的嚴格納什均衡，並且博弈雙方的偏好具有一致性，嚴格納什均衡具有帕累托可比性。如下面支付矩陣所表示的協調博弈：

	X1	X2
X1	1，1	0，0
X2	0，0	2，2

　　表二

　　此類博弈有兩個嚴格納什均衡（X1，X1）；（X2，X2），其中第二個均衡既是風險佔優又是支付佔優均衡，並且博弈雙方有完全一樣的偏好。

　　(3)無支付佔優與風險佔優區分的協調博弈

　　該類博弈最典型的例子就是左行右行博弈。兩個在一條路上相對而行的行人，如果都向左或者都向右那么他們就不會相碰，因此，都獲得支付1個單位.但如果兩個中一個向左前方，一個向右前方那么他們就可能相碰，走起來不方便。這種情況博弈雙方有完全相同的偏好，協調博弈中兩個嚴格納什均衡是無差異的，而該博弈的兩個嚴格納什均衡就是無差異的。

	左行	右行
左行	1,1	0,0
右行	0,0	1,1

　　表三

　　要解決協調博弈均衡選擇問題，首先需要解決各參與人對其他參與行爲的預期問題。第二、三類博弈由於博弈雙方偏好完全一致，均衡選擇問題只取決於支付大小而與風險無關，因此，可以通過博弈前的非約束、無成本的交流或者通過第三方提示而得到解決行爲預期問題。第一類博弈風險性與收益性不同，由於參與人對風險與收益的不同看法而使得此類博弈的處理顯得特別復雜，也正因爲如此，該類協調博弈成爲了理論界研究的重點。

對稱協調博弈 均衡選擇1

　　從已有的研究文獻來看，對稱協調博弈均衡選擇基本沿着兩條路徑來進行的。

　　一是實驗經濟學方法，即通過對參與人真實行爲的研究，重點探討影響協調博弈中均衡選擇的因素；

　　二是沿着純理論研究方法，通過構建數學模型來解釋實驗結果，進一步完善進化博弈理論體系，以便更好地預測參與人的行爲。實驗經濟學研究協調博弈的目的就是爲了尋找影響均衡選擇的因素，爲理論研究提供現實的證據，減少理論研究的盲目性，推動理論研究的發展。

　　(1)策略的顯著性影響協調博弈的均衡選擇

　　運用實驗方法來研究協調博弈均衡選擇問題至少可以追溯到托馬斯·克羅姆比·謝林(Thomas Crombie Schelling)（1960）⁴。Schelling通過一系列的實驗報告得出了第二類、第三類協調博弈的均衡選擇結果並發現參與人常常通過焦點來協調他們的行爲。他認爲：在現實中，參與人可能通過自己的經驗、文化、心理等聯想而使一些均衡較之其他均衡更突出，並產生自動實施的預期而傾向於選擇那些“唯一”的均衡。正是因爲一些策略可能比其他策略更突出或者更顯著，參與人的選擇結果更多地依賴於策略的顯著性而非博弈支付。博弈前的無成本、非約束、不可驗證的交流有助於解決第二類、第三類協調博弈的均衡選擇問題，並且系統會收斂於帕累托效率均衡。現實中第二類、第三類協調博弈的情況是很少見的，多數情況下，參與人的偏好不會完全一致，存在風險與收益之間的權衡。在這種情況下，需要通過如法律、法規等強制性措施來使博弈收斂到特定的均衡。Schelling還研究了法律與顯著性即焦點之間的關系，並指出法律除了通過其制裁功能來改變博弈支付進而影響參與人行爲以外，更重要的是由於其信息的公开性使得相應策略具有焦點的功能，焦點使個人行爲更快地收斂，即法律具有快速轉變已經形成的秩序的功能。

　　schelling是較早運用實驗方法來研究協調博弈中均衡選擇問題的學者之一，不過他所用的實驗是非正式的且局限於小羣體之中的，就連他自己也認爲他所用的方法是“不科學”的。Judith Mehta, Chris Starmer, and Robert Sugden(1994)⁵模仿Schelling(1960)的實驗更正式地考察了Schelling(1960)所提出的焦點在簡單第二類、第三類協調博弈中對均衡選擇的作用。他們通過兩組實驗的比較，驗證了Schelling提出的“焦點對協調博弈中的均衡選擇起着非常重要的作用”的觀點。Aumman(1987)⁶認爲博弈前無成本、非約束的交流會使協調收斂到效率均衡，而對第一類有風險性與收益性衝突的協調博弈，博弈前的交流不能使系統收斂於效率均衡，因爲前者的交流是可置信的，而後者無成本、非約束交流是不可置信的。

　　（2）風險性影響協調博弈的均衡選擇

　　Van Huyck, Battailio and Beil (HBB，1990)⁷系統地研究了協調博弈的均衡選擇問題，目的是探討以下兩個問題：（1）在策略互動的博弈環境下，納什均衡是否是一個好的預測；（2）當存在多個納什均衡時，哪一個均衡最後會出現以及均衡的出現是否與博弈特定均衡的顯著性有關。他們進行了兩種試驗：一是參與人進行隨機匿名配對博弈，二是參與人可以自己選擇博弈對手。結果發現，後者可以很快地達到支付佔優均衡，而前者卻很難達到此結果。顯然，納什均衡能夠很好地預測被觀察到的行爲，這是不爭的事實。另外他們在實驗中發現參與人並不總是選擇帕累托佔優的均衡，多數情況下會選擇風險佔優均衡。該結果與一般認爲帕累托均衡是一個自然的焦點的觀點不一致，即協調失敗可能會在實踐中出現。最後，在實驗中他們還證實了劣策略可能影響納什均衡選擇，因此在非合作博弈理論中的重復剔除嚴格劣策略的方法是值得商榷的。他們的實驗結果成爲了後續理論研究的出發點。

　　（3）初始提示影響協調博弈的均衡選擇

　　Cooper et al.,(1992)⁸通過實驗驗證了博弈前的交流有利於參與人協調於支付佔優狀態，Berninghaus and Van Huyck, Raymond Battalio and Richard Beil(1991)⁹通過實驗研究了平均意見協調博弈中參與人人數、支付佔優、保障水平及歷史事件的顯著性等對均衡選擇的影響。實驗結果發現，在有唯一支付佔優均衡且有唯一保障性均衡的平均意見博弈¹⁰中，在支付佔優與保障性都不具有顯著性的情況下，重復互動產生了一個簡單的動態並且收斂到由初始中位數決定的無效率均衡。因此，如果給定一個初始中間值，那么在未來時期，這個中間值就變得可以預測了。因此，初始提示²是影響協調博弈中均衡選擇的重要因素。

　　（4）重復次數影響協調博弈的均衡選擇

　　Siegfried K. Berninghaus, Karl-Martin Ehrhart(1998)¹¹通過實驗考察了參與人重復次數對協調博弈中均衡選擇的影響，他們是基於以下假說來進行試驗的：協調於帕累托均衡可以獲得更多支付，當博弈次數重復時，參與人爲了長期支付而愿意在开始時犧牲短期支付，表現爲更有耐心尋求協調於帕累托均衡。實驗結果發現：當博弈重復次數爲10次時，參與人常常選擇非帕累托效率均衡；當均衡重復次數爲30次時，兩種均衡都有可能被選擇；當博弈重復次數爲90次時，參與人常常選擇帕累托效率均衡。通過減少博弈的重復次數就得到了大羣體時HBB（1990）的結論，當博弈重復次數足夠大時均衡結果就是帕累托優勢均衡，該結論支持了學習導向理論。一種解釋就是參與人意識到效率均衡的存在，在重復博弈早期就會通過選擇而發出希望協調於支付佔優均衡的信號。另外，在實驗中他們通過改變協調失敗的成本，發現高協調失敗成本會阻礙風險厭惡參與人改變自己行動的可能性，這與Myerson，Roger(1978)¹²所指出的失敗成本越大，參與人犯錯誤的概率就越小的觀點是一致的。

　　（5）互動結構影響協調博弈的均衡選擇

　　Claudia Keser, et. al. (1998)¹³通過了一系列實驗研究了局部互動結構與均衡選擇的關系。他們比較了有局部互動結構與沒有局部互動結構的實驗。結果發現在三人羣體且沒有局部互動結構時，博弈很快就均衡於帕累托效率均衡，該結果與Van Huyck et al. (1990)的小羣體結論是一樣的。當參與人處於局部互動結構中時，他們發現博弈協調於風險佔優均衡。Huyck et al.（1997）¹⁴在另一次實驗中，比較了封閉鄰居與开放鄰居結構對協調均衡選擇的影響。結果發現，前者更易於協調於支付佔優狀態，其原因在於开放鄰居中支付佔優的風險性大於封閉鄰居支付佔優的風險性。同時他們也發現當存在更多迭代時，博弈更多地協調於支付佔優均衡。因此，局部互動對協調博弈中的均衡選擇問題起着非常重要的作用。

　　（6）博弈前的“廉價磋商”影響協調博弈均衡選擇

　　Russell Cooper et. al (1992)¹⁵ 研究了博弈前的廉價磋商對協調博弈中均衡選擇的影響。他們考察第二類博弈⁴與獵鹿博弈。實驗發現在第二類博弈中，單向博弈前廉價磋商能夠提高帕累托佔優均衡出現的可能性，但雙向博弈前廉價磋商卻不一定會降低協調失敗的頻率。獵鹿博弈中雙邊博弈前廉價磋商總是會選擇帕累托佔優均衡而不是選擇風險佔優均衡，而單邊博弈前廉價磋商卻不會。也就是說，博弈前的廉價磋商是影響協調博弈均衡選擇的又一因素。

　　以上學者根據實驗分別從不同的角度研究了影響協調博弈中的均衡選擇問題的因素。從他們的研究中可以看出：博弈支付並不是影響均衡選擇的唯一因素，現實中影響協調博弈的均衡選擇因素是多方面的。因此，要較準確地描述參與人的行爲就必須綜合考慮影響參與人決策過程的各種因素。

基於不變突變率的理論 研究1

　　（1）不變突變率的理論研究成果

　　Michihiro Kandori, Greorge J. Mailath, Rafael Rob (KMR)1993首次運用Foster and Young（1990）⁷的方法考察了離散條件下系統的隨機穩定性並給出了相應的算法。他們的核心思想就是在模型中引入了確定性達爾文動態，在此基礎上再引入了由正態分析描述的隨機影響因素，從而使得確定性動態過程變成了隨機動態過程。在此模型中，他們假定背景突變的存在及每個參與者都在任何時候都以相同的概率發生突變而選擇突變策略，由此便保證了馬爾可夫鏈的遍歷性，因此，隨機動態系統存在平穩分布，他們採取了Freidlin, M. I and Wentzell, A . D. (1984)¹⁶提供的決策樹法來求系統平穩分布即隨機穩定狀態。決策樹法的基本邏輯如下：

　　一是引入一種狀態到另一種狀態的離开阻抗（也就是離开某狀態所需要的突變數）；

　　二是找到每一個常返狀態⁸（Recurrent state）中吸引子（attractor）對應的最小阻抗的路徑，由此研究吸引子的吸引域寬度，或者求出每個吸引子的隨機潛力；

　　最後，有最寬吸引域或者最小隨機潛力的吸引子就是隨機穩定狀態。在KMR一文中，由於假定在任何狀態任何時間每個個體都以相同的非零突變率選擇其他策略，因此，離开阻抗直接可以通過突變者的個體數來描述。阻抗決定吸引域的半徑即寬度，吸引域的寬度決定系統回復到均衡的次數，進而確定隨機穩定狀態。正因爲如此，KMR一文的所有定理的結論都是圍繞着“吸引域最寬的吸引子就是隨機穩定狀態”這一結論而展开的。

　　Peyton Young（1993）應用與KMR相同的方法研究了離散條件下對稱協調博弈的隨機穩定性，他主要考察社會習俗的形成問題。他認爲由於參與人有高昂的信息搜尋成本，每一個人都只能依據非常有限的博弈歷史來進行決策，均衡選擇並不是依據其本身所具有內在顯著性，而是由系統演化的動態過程所決定的。動態過程也就是參與人對其他參與人行爲的信念即預期形成的適應性學習過程。只要信息充分不完全性並且參與人永不犯錯誤，那么滿足弱非循環博弈的適應性學習過程以概率1會收斂到純策略嚴格納什均衡；不完全性可以有效防止博弈鎖定於次優循環，有限記憶則可以使參與人很快忘記過去協調失敗的行爲，這兩個條件在一起實際上就是保證系統不會被粘住在一個均衡，也就是說隨機因素的影響使系統在不同吸引域之間不斷跳躍。Young（1993）在其模型引入了適應性動態過程，在此基礎上來引入隨機因素，然後，通過Freidlin, M. I and Wentzell, A . D.提供的決策樹法來計算系統的隨機穩定狀態。與KMR相比，兩者盡管在形式上不同，但都沒有超越“吸引域大的均衡就是長期隨機穩定均衡”這一基本框架。另外，Young（1993）在文中給出了計算隨機穩定狀態的步驟：

　　第一步求出在無擾動適應性動態下的常返狀態。對一般的n人協調博弈，常返狀態的求法是非常復雜的，但如果協調博弈是弱非循環且樣本是充分不完全，那么常返狀態就是對應於博弈中的嚴格納什均衡；

　　第二步計算從一個常返狀態到另一個常返狀態的最小阻抗。理論上說這就相當於解決一系列的最短路徑問題，但實際上可以直接通過博弈的支付矩陣來計算⁹；

　　第三步依據以上的阻抗來構建“方向樹”，並且尋找有最小阻抗的樹，除完全相同阻抗的情形外，隨機進化穩定狀態一般都是唯一的。Young（1993）還是沒有跳出不變突變率的框架，盡管在處理方法不同於KMR，但核心思想是一樣的，

　　第一、文中的適應性動態依然是支付單調的；

　　第二、與KMR一樣，文中假定突變率不變，因而突變率與吸引域的寬度無關，突變的作用與KMR完全一樣，是爲了使系統在不同狀態之間跳躍，系統狀態的吸引域半徑完全是由博弈支付決定的；

　　第三、結論與KMR一樣，只是說法不同，即吸引域寬者就是長期隨機穩定狀態。

　　從以上兩文可以看出：引入動態過程是爲了常返狀態的存在性；引入突變是爲了使系統在不同常返狀態之間跳躍；引入不變突變率是爲了簡化計算。有了前述的保證就可以得到“隨機穩定狀態即是吸引域最寬的常返狀態”這一結論。正是因爲這樣，Ellision（2000）直接假定以上三個條件直接從吸引域及其寬度出發來分析系統的隨機穩定狀態。

　　Ellision（2000）直接從轉移矩陣出發來定義狀態的吸引域¹¹，抓住了求隨機穩定狀態方法的核心思想，繞過了求不變分布，直接利用吸引域半徑來求解協調博弈中的均衡選擇問題。其結論爲：如果離开常返狀態的阻抗大於進入常返狀態的阻抗，也就是說，當離开吸引域的阻抗大於進入吸引域的阻抗時，也就是離开的難度大於進入的難度，因此，系統的進化穩定狀態就一定在此吸引子之中。當然，如果是對稱協調博弈，那么常返狀態就是由純策略嚴格納什均衡組成，隨機穩定狀態就是最小隨機潛力的狀態。在Ellison模型中一步一步的演化比休克式演化的速度更快，爲了在模型中體現這一點，他把系統向均衡狀態演化過程的成本減掉而定義了修進的共軛半徑，共軛半徑的修進無形地增加了向均衡靠攏的可能性也就是增加了吸引域的寬度。事實上，從分析可以看出，Ellison的結論依賴於參與人在任何時候任何狀態都有不變的突變率。因此，博弈的隨機穩定狀態完成由博弈的支付確定的，並且有最大離开阻抗或者最小隨機潛力的就是隨機穩定狀態。

　　（2）不變突變率理論研究的評述

　　以上三篇研究對稱協調博弈隨機穩定性文章在學術界被多次引用，足以說明這些文章已經得到了學者們的重視，其共同的特點就是假定突變率不隨時間與狀態的變化而變化，因而，把求隨機穩定狀態直接轉化爲求吸引子或者嚴格納什均衡的吸引域寬度，最寬吸引域所對應的吸引子就是隨機穩定狀態。另外，不變突變率帶來的一個非常重要的結果就是吸引域完成是由博弈支付確定的，因而，只要確定了基礎博弈，系統的隨機穩定狀態就已經確定了。文中引入隨機動態的主要作用就是使系統在不同吸引子之間反復跳躍而不被粘住，從而達到求隨機穩定狀態之目的。盡管形式不同，他們的結論卻是一樣的，即“在有風險佔優與帕累托佔優的協調博弈中”系統的長期隨機穩定狀態是有較寬吸引域的風險佔優狀態，具體地說：

　　a、動態過程與常返狀態的存在性。KMR的達爾文動態是典型的支付單調動態，所謂支付單調動態就是指支付越多則選擇人數就越多，即參與人的行動是基於博弈支付而作出的，支付單調動態確保對稱協調博弈中常返狀態就是嚴格納什均衡集。 PY的適應性動態（實際上就是一種相對羣體分布的最優反應動態），在滿足弱非周期條件並且樣本不完全及參與人永遠不犯錯誤，那么適應性動態就以概率1收斂到嚴格納什均衡；Ellison（2000）模型脫離了博弈的動態過程，他直接假定常返狀態的存在性（默認動態過程是支付單調的或者博弈滿足弱非周期性），並且認爲在弱非周期條件下常返狀態就是嚴格納什均衡。

　　b、隨機因素的引入與遍歷性。KMR、PY與Ellison都是假定不變突變率，但他們沒有說明突變率不變的原因。不變突變率的隨機因素引入保證動態過程滿足遍歷性要求，從而系統不會被粘在某一處，即不會出現鎖定（lock in）的情況，保證系統在不同均衡狀態之間跳動。具體地說：爲了保證不變分布的存在性，PY（1990）通過假定隨機因素的累積作用而保證遍歷性的存在；KMR則是假定狀態轉移矩陣各元素不爲零而保證系統不會被粘住；PY（1993）與Ellison（2000）則是假定博弈滿足非周期條件而使系統收斂到嚴格納什均衡，同時假定樣本不完全或者有限記憶（也就是參與人很快會忘記過去而不會被鎖定）而保證系統不會被粘住。有了常返狀態存在性與遍歷性條件就可以保證系統存在一個平穩分布，於是求隨機穩定狀態問題就轉化爲求平穩分布。在此基礎上直接應用Freidlin, M. I and Wentzell, A . D. (1984)的方法計算隨機穩定狀態。BL與JO兩文沒有直接求隨機穩定狀態，只是從數理邏輯上證明了隨機因素可變時隨機穩定狀態也是可變的。

　　c、實驗經濟學、社會學及心理學的研究表明，參與人的突變率是隨着隨機動態系統狀態與時間變化而變化的，也就是說隨機動態系統的隨機穩定狀態不僅依賴於吸引域的寬度，而且也依賴於吸引域的深度，如何度量吸引域的深度是值得理論界探討的。根據上面的模型，求解隨機穩定狀態實際就是解決兩個問題：一是保證平穩分布的存在性；二是保證系統的常返狀態的存在性。平穩分布可以通過背景突變率的存在性而假定滿足遍歷性。常返狀態可假定基礎博弈是對稱協調博弈即得到滿足。有了這兩個假定，那么隨機穩定狀態就完全由常返狀態的吸引域確定。因而，對吸引域的影響因素進行深入探討是解決協調博弈的隨機穩定性一條很好的途徑。

基於可變突率的理論 研究成果及評述1

　　（1）可變突變率的理論研究成果

　　首次對不變突變率假定提出挑战的是James Bergin and Lipman(BL 1996)，他們認爲系統在不同狀態突變率應該是不同的。特別是：如果突變來自於試驗，那么有理由認爲在帕累托佔優的博弈中，處於帕累托狀態均衡會比其他均衡狀態的突變率更少；如果突變來自於參與經驗的不足，那么重復次數更多的參與人犯錯誤概率就應該少於一次性博弈；如果突變來自於環境的約束，那么隨着博弈的進行，參與人對環境的熟悉程度會不斷增加，因此，犯錯誤的概率也會應該越來越少。只有深入到突變產生的過程中去才能更好地研究協調博弈中的隨機穩定性。通過研究他們得到：隨機系統的穩定性不僅依賴於博弈的支付，而且依賴於突變產生的過程，不同的突變率決定了不同的隨機穩定狀態。因而，要準確地研究系統的穩定性就必須深入到系統突變產生的過程中去。

　　Jack Robles(JR 1998) 認爲增加不變突變率使系統得到唯一的隨機穩定均衡是前面三篇文章的共同點，他們並沒有把突變產生的原因加入到模型中去，因而與現實是不相符合的。實驗證據表明隨着博弈重復次數的增加，策略選擇中的隨機因素的影響會不斷地減少；隨着博弈的重復，參與人更爲熟悉他們所處的環境並能夠更準備地預期對手未來的行爲而減少試驗與錯誤的次數。因此，只有把把突變產生的原因即突變過程引入到博弈模型中去才可以更爲準確地描述參與人的行爲，即假定突變率隨時間而減少是合理的，突變率應該是內生性的。他們考察了突變率隨系統演化時間變化而變化的情況，認爲突變率趨於零的速度不同就會使動態系統不滿足遍歷性要求。因而，難以通過已知的方法來求系統的隨機穩定狀態。他得到如下結論：如果隨機動態滿足遍歷性要求，那么突變率趨於零時系統就會達到長期均衡，其結果與小的常突變率的極限行爲是一樣。然而，突變率趨於零的速度不同而使得遍歷性這一要求很難滿足，因此考察突變率趨於零的不同的速度對協調博弈均衡選擇問題的影響是非常重要。由突變率下降速度不同而導致遍歷分布不存在時，他採用非平穩馬爾可夫鏈來進行分析，並用了歷史依賴的弱遍歷性與強遍歷性兩個概念來描述其結論。他們並沒有得出均衡與突變率收斂零的速度之間的具體關系，只證明了突變率並不能決定系統的最終狀態，隨機穩定狀態是依賴於系統的初始條件的。

　　Sandholm, H.W. and Pauzner, A. (SP 1998)¹⁷ 研究了既有羣體增長也有個體突變的情形。他認爲KMR與PY等假定固定羣體與現實是不相符的，現實中羣體的規模隨着時間的演化是不斷增長的，要更現實地研究協調博弈中的均衡選擇問題就必須把羣體增長率納入到模型中來。在演化過程中增加羣體增長率會產生兩種效應：第一個效應是直接的，羣體增長使得在均衡之間跳躍隨時間的變化而變得越來越少，因此，當羣體增長足夠快時，跳躍的可能性就會慢慢地消失；第二個效應是相對的，當羣體的增長率足夠大時，通過突變從風險佔優均衡跳到支付佔優均衡的困難就會越來越大，當羣體爲無窮大時，這種效應就會非常明顯。羣體的快速增長使得進化過程變得非平穩，因此，無法保證平穩分布的存在性。他們通過引入伯努利動態來描述參與人修進自己的策略過程，並且假定羣體按照對數增長率來增長，在此條件下他們證明了系統的均衡選擇是歷史依賴的。

　　Bhaskar, V. and Vega-Redondo, F. (BV 2004)¹⁸考察了多個有局部互動的地點的情況下協調博弈中均衡選擇問題。他們引入了兩種動態：一是同一地點內個體之間按模仿者動態進行選擇，二是地點之間個體按向高支付的地點遷移而引入遷移動態。並分別引入了突變率與遷移率，最後他們證明了在這種情況下，動態系統長期均衡於效率均衡即支付佔優均衡。其實他們結論的道理很簡單，因爲遷移的存在使得無效率均衡變得不穩定，這與博弈前交流的作用是一樣的。

　　（2）可變突變率理論研究的評述

　　盡管可變突變率模型更現實地考察了參與人的行爲，但也存在固有的缺陷：一是這些模型都沒有區分突變率與錯誤率，把突變率與錯誤率混爲一談，突變是無目的性的，假定在任何狀態下任何時間都不變有一定道理，但錯誤率就能這樣假定；二是與可變突變率模型都沒有結合到現實中參與人行爲，沒有結合社會學心理學等的研究成果，僅僅從數學理論上給予描述，難以應用於描述現實人的行爲，難以很好地應用於研究協調博弈的隨機穩定性。

進一步 研究的方向評述1

　　實驗研究表明，對稱協調博弈不一定收斂到風險佔優均衡，但可能收斂到其他的均衡。支付只是影響均衡選擇的因素之一，不變突變率相關理論並不能很好地解釋現實中參與人的行爲，其合理性是令人署凝的，

　　第一，人們常說的“習慣成自然”，即當某種行爲被多次選擇時極可能內化爲參與人的行爲指南，這時參與進行試驗或者發生錯誤的可能性就會大大減少，發生錯誤的可能性隨着選擇次數的增加而增加；

　　第二，消費理論中的“羊羣行爲”，即當某種行爲被周圍大多數人所選擇時，在一定條件下參與人極可能陷入信息陷阱而忽視自己的信息，一旦達到這種狀態參與人發生錯誤的困難就會很大；

　　第三，Myersion (1991)¹⁹基於“越昂貴的策略犯錯誤的可能就越少”這一現實而提出相對均衡策略的穩鍵策略概念，認爲越昂貴的錯誤犯的可能性就會越少；宏觀經濟學中的“效率工資理論” 說明高於平均工資的工資增加工人被解僱的機會成本，從而刺激工人努力工作而減少犯錯誤，大大降低了參與人選擇不可預見行爲的可能性；

　　第四，在帕累托效率狀態時，參與人出現錯誤的可能性會少於其他狀態，當然還有許多其他因素影響系統的均衡選擇。總之，爲了更好地描述參與人的行爲，就需要分清哪是突變率，哪是錯誤率，在此基礎上再研究協調博弈的隨機穩定性會更具現實意義。

參考文獻

↑ ^1.0^1.1^1.2^1.3^1.4 張良橋.對稱協調博弈隨機穩定性研究文獻綜述
↑ ^2.0^2.1 羅素·W·庫珀（著），張軍，李池譯（2001）：《協調博弈----互補性與宏觀經濟學》M，第一版，中國人民大學出版社。
↑ Maynard Smith, J. and G. R. Price.(1973): “The Logic of Animal Conflicts” J, Nature, , (246): 15-18.
↑ ^4.0^4.1 Harsanyi, J. and Selten, R. (1988): A general theory of equilibrium selection in gamesM. The MIT Press, Cambridge, MA.
↑ Schelling, T. (1960): The strategy of conflictM, Harvard University. Press, Cambridge, MA.
↑ Mehta J., Starmer C., and Sugden R. (1994): The nature of salience: An experimental investigation of pure coordination gamesJ. American economic review. 84, 658-673.
↑ ^7.0^7.1 Aumann, R. (1987): correlated equilibrium as an expression of Bayesian rationalityJ, Econometrica, 55, 667-677
↑ ^8.0^8.1 Van Huyck, J. b. Battalio, R. c.,Beil, R. O. (1990): Tacit coordination games, strategic uncertaintyJ. American economic review. 80, 234-248.
↑ ^9.0^9.1 Cooper, R. D. V. Dejong, R. Forsythe and J. W. Ross(1992): Communication in coordination gamesJ, American economic review, 107, 739-771
↑ Crawford, P. V. and Haller, H. (1990): Learning how to cooperate: Optimal play in repeated coordination gamesJ, Econometrica, 58, 571-595.
↑ ^11.0^11.1 Van Huyck, J. b. Battalio, R. c. Beil, R. O. (1991): Strategic uncertainty, equilibrium selection, and coordination failure. Average opinion games. Quarterly journal of economics. 106, 885-910.
↑ Myerson, R. (1978): Refinements of the Nash equilibrium conceptJ, International journal game theory. 7, 73-80
↑ Keser C., and Ehrhart K., and Berninghaus K. (1998): Coordination and local interaction: experimental evidenceJ. Economics Letters. 58, 269-275.
↑ Van Huyck, J. Raymond, C. and Frederick W. (1997): On the origin of convention: evidence from coordination games, American economic review. 107, 576-596.
↑ Cooper, R. D. V. Dejong, R. Forsythe and J. W. Ross(1992): Forward induction in coordination gamesJ, Economics Letters, 40, 167-172
↑ Freidlin, M. I and Wentzell, A . D. (1984): Random perturbations of dynamical systemsM, Springer-verlag, Berlin/New York.
↑ Sandholm, H.W. and Pauzner, A. (1998): Evolution, population growth, and history dependenceJ. Games and economic behavior. 22, 84-120.
↑ Bhaskar, V. and Vega-Redondo, F. (2004): Migration and the evolution of conventionsJ, Journal of economic behavior ＆organization.
↑ Myerson, R. (1991): Game theory: Analysis of ConflictM. Cambridge University Press.