聖彼得堡悖論

概述

聖彼得堡悖論

聖彼得堡悖論是決策論中的一個悖論。聖彼得堡悖論是數學家丹尼爾·伯努利（Daniel Bernoulli）的表兄尼古拉·伯努利(Daniel Bernoulli)在1738提出的一個概率期望值悖論，它來自於一種擲幣遊戲，即聖彼得堡遊戲(表1)。設定擲出正面或者反面爲成功，遊戲者如果第一次投擲成功，得獎金2元，遊戲結束；第一次若不成功，繼續投擲，第二次成功得獎金4元，遊戲結束；這樣，遊戲者如果投擲不成功就反復繼續投擲，直到成功，遊戲結束。如果第n次投擲成功，得獎金2n元，遊戲結束。按照概率期望值的計算方法，將每一個可能結果的得獎值乘以該結果發生的概率即可得到該結果獎值的期望值。

基本介紹

遊戲的期望值即爲所有可能結果的期望值之和。隨着n的增大，以後的結果雖然概率很小，但是其獎值越來越大，每一個結果的期望值均爲l，所有可能結果的得獎期望值之和，即遊戲的期望值，將爲“無窮大”。按照概率的理論，多次試驗的結果將會接近於其數學期望。但是實際的投擲結果和計算都表明，多次投擲的結果，其平均值最多也就是幾十元。正如Hacking(1980)所說：“沒有人愿意花25元去參加一次這樣的遊戲。”這就出現了計算的期望值與實際情況的“矛盾”，問題在哪裏? 實際在遊戲過程中，遊戲的收費應該是多少? 決策理論的期望值準則在這裏還成立嗎?這是不是給“期望值準則”提出了嚴峻的挑战? 正確認識和解決這一矛盾對於人們認識隨機現象、發展決策理論和指導實際決策無疑具有重大意義。、

聖彼得堡悖論

聖彼得堡問題對於決策工作者的啓示在於，許多悖論問題可以歸爲數學問題，但它同時又是一個思維科學和哲學問題。悖論問題的實質是人類自身思維的矛盾性。從廣義上講，悖論不僅包括人們思維成果之間的矛盾，也包括思維成果與現實世界的明顯的矛盾性。對於各個學科各個層次的悖論的研究，歷來是科學理論發展的動力。聖彼得堡悖論所反映的人類自身思維的矛盾性，首先具有一定的哲學研究的意義；其次它反映了決策理論和實際之間的根本差別。人們總是不自覺地把模型與實際問題進行比較，但決策理論模型與實際問題並不是一個東西；聖彼得堡問題的理論模型是一個概率模型，它不僅是一種理論模型，而且本身就是一種統計的 “近似的”模型。在實際問題涉及到無窮大的時候，連這種近似也變得不可能了。

論文解釋

丹尼爾·伯努利對這個悖論的解答在1738年的論文裏，提出了效用的概念以挑战以金額期望值爲決策標準，論文主要包括兩條原理：

1、邊際效用遞減原理：一個人對於財富的佔有多多益善，即效用函數一階導數大於零；隨着財富的增加，滿足程度的增加速度不斷下降，效用函數二階導數小於零。

2、最大效用原理：在風險和不確定條件下，個人的決策行爲準則是爲了獲得最大期望效用值而非最大期望金額值。

消解歷史

聖彼得堡悖論的提出已有200多年了，所提出的消解方法大致可以歸納爲以下幾種觀點：

(一)邊際效用遞減論

Daniel Bernoulli在提出這個問題的時候就給出一種解決辦法。他認爲遊戲的期望值計算不應該是金錢，而應該是金錢的期望效用，即利用衆所周知的“期望效用遞減律”，將金錢的效用測度函數用貨幣值的對數來表示:效用=log(貨幣值)，如表 2所示。所有結果的效用期望值之和將爲一個有限值log(4)≈ 0.60206，如果這裏的效用函數符合實際，則理性決策應以4元爲界。這一解釋其實並不能令人滿意。姑且假定“效用遞減律”是對的，金錢的效用可以用貨幣值的對數來表示。但是如果把獎金額變動一下，將獎金額提高爲l0的2n次方(n=3時，獎金爲108)，則其效用的期望值仍爲無窮大，新的悖論又出現了當然，我們並不清楚效用值與貨幣值之間究竟有什么樣的關系，不過只要我們按照效用的2n倍增加獎金，悖論就總是存在。

聖彼得堡悖論

(二)風險厭惡論

聖彼得堡悖論對於獎金額大小沒有限制，比如連續投擲40次才成功的話，獎金爲1.1萬億元。但是這一獎金出現的概率極小，1.1萬億次才可能出現一次。實際上，遊戲有一半的機會，其獎金爲 2元，四分之三的機會得獎4元和2元。獎金越少，機會越大，獎金越大，機會越小。如果以前面 Hacking所說。花25元的費用冒險參與遊戲將是非常愚蠢的，雖有得大獎的機會，但是風險太大。因此，考慮採用風險厭惡因素的方法可以消解矛盾。Pual Weirich就提出在期望值計算中加人一種風險厭惡因子，並得出了遊戲費用的有限期望值，認爲這種方法實際上解決了該悖論。

但是這種方法也並不十分完美。首先，並非所有人都是風險厭惡的，相反有很多人喜歡冒險。如每期必买的彩票，以及Casino(卡西諾)紙牌遊戲，其價格都高於得獎的期望值。你也可以說這些喜歡冒險买彩票和賭博的人是非理性的，可他們自有樂趣，喜歡這樣的風險刺激。總之，風險厭惡的觀點很難解釋清楚實際遊戲平均值非常有限的問題。退一步說，即便承認風險厭惡的觀點，矛盾仍然不能消除。我們仍然可以調整獎金額，最後，考慮風險厭惡情況的期望值仍然是無窮大而與實際情況不符。

(三)效用上限論

對前兩種觀點的反駁，我們採用了增加獎金額的方法來補償效用的遞減和風險厭惡，兩者均是假定效用可以無限增加。也有一種觀點認爲獎金的效用可能有一個上限，這樣，期望效用之和就有了一個極限值。Menger認爲效用上限是惟一能消解該悖論的方法。設效用值等於貨幣值，上限爲100 單位，則遊戲的期望效用爲7.56l25，如表3所示。也許這裏的效用上限太小了，不過我們可以任意選定一個更大的值比如225 。有多人如Russell Har—din (1982)，W illiam G uNtaNon (1994)，Richard Jeffrey(1983)等都贊成這樣的觀點。不過這種效用上限的觀點似乎不太令人信服。效用上限與效用遞減不同，或許你認爲有225 的錢夠自己花的了，可是錢並不能給我們帶來所有的效用，有些東西不是錢所能买來的。效用上限意味着再也沒有價值可以添加了。但是一個人有了錢，還希望他的朋友、親戚也像他一樣富有；同一個城市裏的人和他一樣富有...。而效用上限論認爲到了這一上限他們就不用再做任何交易了，看起來這並不能成立。對有些人來講，似乎期望和需求並不是無限增加的，對於現有的有限需求他們已經滿足了。他們覺得這裏的遊戲期望效用值確實是有限的。不過是不是確實有這樣的人還是一個不確定的問題，或者是個經驗性的問題。但認爲“越多越好”的人確實是存在的。對於決策準則這樣的理性選擇的理論，不能基於可疑的和經驗性的判斷而加以限制，因而期望有限論不足以消解這裏的矛盾。

聖彼得堡悖論

(四)結果有限論

Gustason認爲，要避免矛盾，必須對期望值概念進行限制，其一是限制其結果的數目；其二是把其結果值的大小限制在一定的範圍內。這是典型的結果有限論，這一觀點是從實際出發的。因爲實際上，遊戲的投擲次數總是有限的數。比如對遊戲設定某一個投擲的上限數L，在投擲到這個數的時候，如果仍然沒有成功，也結束遊戲，不管你還能再投多少，就按照L付錢。因爲你即便不設定L，實際上也總有投到頭的時候，人的壽命總是有限的，任何原因都可以使得遊戲中止。現在設定了上限，期望值自然也就可以計算了。

問題是，這已經不是原來的那種遊戲了!同時也並沒有證明原來的遊戲期望值不是無限大。原來的遊戲到底存在嗎? Jeffrey說：“任何提供這一遊戲的人都是一個騙子，誰也沒有無限大的銀行!” 是說實際上沒有這種遊戲嗎? 恐怕這也不見的。如果我邀請你玩這種遊戲，你說我實際上不是在這樣做嗎? 或者說我實際上邀請你玩的不是這種遊戲而是另外的什么遊戲? 很多遊戲場提供許多概率極小、獎金額極大幾乎不可能的遊戲，他們仍然在經營、在賺錢，照樣喫飯睡覺，一點兒也不擔心哪一天會欠下一屁股債，崩盤倒閉。

Jeffrey在這樣說的時候，實際上是承認了聖彼得堡遊戲的期望值是無窮大了。認爲遊戲廳不提供這樣的遊戲，正是因爲他們認爲其期望值是無窮大，遲早他們會因此而破產倒閉。這正是用了常規的決策理論，而反過來又說這種遊戲實際上不存在，應該排除在期望值概念之外。因此，用限制期望值概念的方法並不能消解悖論。

不能限制期望值概念的原因還有很多。比如，我們不能用限制期望值概念的方法僅把聖彼得堡遊戲排除在外，而應該是通用的。在人壽保險中，有一個險種根據保險人的年齡，每長一歲給付一定的賠付金額。採用人類壽命的經驗曲线給出每個年齡的生存機會。大於140歲的生存率已經沒有經驗可以借鑑，但可以採用一定的函數將生存年齡擴展至無窮大，當然其生存率趨向於零。注意到這裏的給付金額也是無限的，但是其在期望值計算方面並沒有出現什么問題。

問題的本質

所謂悖論，《辭海》中的定義是：“一命題B，如果承認B，可推得非B，反之，如果承認非B，又可推得

聖彼得堡悖論

B，稱命題B 爲一悖論。”可見，作爲一種推理的矛盾現象，悖論是人們自己制造出來的。現在已經有人證明，這種意義上的悖論是不存在的。一個命題是一個具有真假的判斷語句，如果一個命題B 和非B 能夠相互推出，則B要么是非真非假的單義句，要么是非真非假的多義句。所以，悖論作爲人類思維系統的一種矛盾形式，它的消解必須從人們思維系統自身的矛盾性和不完善性着手，需要人類战勝和超越自己。歷史上一次一次的悖論的消解，提出了更完備的公理系統，完善了人類的思維和科學系統，使得科學得到進一步的發展。聖彼得堡悖論也是一樣。

(一)對聖彼得堡悖論各種消解觀點的評述

綜合上述悖論的消解觀點，效用遞減論符合了 “邊際效用遞減律”，能夠在一定程度上解決實際問題，但是卻繞开了問題的基本面。聖彼得堡遊戲的期望值到底是多少並沒有真正得到解決；風險厭惡論，犯了同樣的錯誤，只不過是用風險因子替換了效用函數，實際上只是一種風險效用；效用上限論和結果上限論試圖回避問題的無限性，篡改了原問題，自然也不可能解決問題。這些觀點都是從實際出發的，但都沒有觸及人們的思維系統，不能衝破自己思想的牢籠，即便解決了這一悖論，又會有新的悖論出現。

(二)最後的消解

從上述聖彼得堡悖論的消解方法來看，其效果都不是十分理想，都沒有真正解決問題。但是正是這些努力，是我們認識到僅從實際出發是不能解決問題的，而最合理的解釋就是— — 保留期望值的定義，調整我們的思維。當我們這樣做的時候，聖彼得堡悖論就不再是一個悖論了!理論上期望值的計算沒有什么錯誤，我們需要承認它的期望值是無窮大；而實際上它的均值又不可能是無窮大，因爲它是樣本均值，樣本均值隨着樣本容量的增加，以概率收斂於其期望值。這都是正常的，它們本身就是應該有差距的!至於差距應該有多大，在小於無窮大的時候，樣本均值隨着實驗次數的增多，越來越接近總體均值(或理論均值)，聖彼得堡遊戲不正是這樣的嗎? 而在總體均值是無窮大的時候，我們如何讓樣本均值如何接近無窮大呢? 非得是我們認爲的很大很大嗎?再大也不是無窮大，和現在也沒有區別，我們平時的“大小”概念已經不適應了。涉及無窮大概念比較的時候，就需要用相應的比較方法。聖彼得堡遊戲的結果集合是一個無窮集合，而實際實驗的樣本是一個有窮集合，它們是不能用現有的辦法比較的。

利用電腦進行模擬試驗的結果說明，實際試驗的平均值— — 樣本均值是隨着實驗次數的增加而變化的。在大量實驗以後，其實驗均值X可以近似表示爲X≈logn/log2，可見當實驗次數趨向無窮大的時候，樣本均值也趨向無窮大。比如100萬即106次實驗的平均值約等於6/0.301=19.9，即 20元左右；要樣本均值達到1 000元，實驗次數就要達到10332，這時候有可能出現的最高投擲次數約爲1000次左右，相應的最高賠付金額爲，已經達到了天文數字了。如果隨着實驗次數趨向無窮大，趨向於無窮大的速度是慢多了。

與現實的啓示

雖然聖彼得堡遊戲問題只是一個具體問題，但是類似的實際決策問題是存在的。它們起碼是可觀察的，其觀察值確實也是存在的。而且它確實也給決策的期望值準則提出了挑战，所提出的問題需要我們給予解答。通過上述問題的消解，我們至少可以給出下列有關問題的答案和啓示。

首先，理論上應該承認聖彼得堡遊戲的“數學期望”是無窮大的。但理論與實際是有差別的，在涉及無窮大決策問題的時候，必須注意這種差別。

其次，實際試驗中隨着遊戲試驗次數的增加，其均值將會越來越大，並與實驗次數呈對數關系，即樣本均值=log

聖彼得堡悖論

2(實驗次數)=log(實驗次數)/log2。

再次，實際問題的解決還是要根據具體問題進行具體分析。前面的聖彼得堡悖論消解方法都是很實用的方法。也--I以設計其他方法，比如可以運用“實際推斷原理”，根據實驗次數n設定一個相應的“小概率”，對於聖彼得堡問題來講，是一個很實際的方法；或者建立一個近似模型，比如確定一個最大可能成功的投擲次數n，將投擲n 1次以後的概率設爲1 / 2k，仍然符合概率分布的條件(所有結果的概率之和等於1)等等。

最後，聖彼得堡問題對於決策工作者的啓示在於，許多悖論問題可以歸爲數學問題，但它同時又是一個思維科學和哲學問題。悖論問題的實質是人類自身思維的矛盾性。從廣義上講，悖論不僅包括人們思維成果之間的矛盾，也包括思維成果與現實世界的明顯的矛盾性。對於各個學科各個層次的悖論的研究，歷來是科學理論發展的動力。聖彼得堡悖論所反映的人類自身思維的矛盾性，首先具有一定的哲學研究的意義；其次它反映了決策理論和實際之間的根本差別。人們總是不自覺地把模型與實際問題進行比較，但決策理論模型與實際問題並不是一個東西；聖彼得堡問題的理論模型是一個概率模型，它不僅是一種理論模型，而且本身就是一種統計的 “近似的”模型。在實際問題涉及到無窮大的時候，連這種近似也變得不可能了。

決策科學是一門應用學科，它的研究需要自然科學和社會科學的各種基礎理論和方法，包括數學方法。這些方法都具有很強的理論性和高度抽象性。但是，決策科學更是一門應用性、實踐性很強的學科，要求決策理論與決策實踐緊密結合。因此，我們在決策理論的研究和解決實際問題的時候，應高度重視理論和實踐的關系。理論模型的建立，既要源於實踐，又不能囿於實踐，發揮主觀創造力，才能有所突破，有所建立。