概率論

概率


 

  研究隨機現象數量規律的數學分支。隨機現象是指這樣的客觀現象,當人們觀察它時,所得的結果不能預先確定,而只是多種可能結果中的一種。在自然界和人類社會中,存在着大量的隨機現象。例如,擲一硬幣,可能出現正面或反面;測量一物體長度,由於儀器及觀察受到環境的影響,每次測量結果可能有差異;在同一工藝條件下生產出的燈泡,其壽命長短參差不齊;等等。這些都是隨機現象。隨機現象的實現和對它的觀察稱爲隨機試驗,隨機試驗的每一可能結果稱爲一個基本事件, 一個或一組基本事件又通稱隨機事件,或簡稱事件。事件的概率則是衡量該事件發生的可能性的量度。雖然在一次隨機試驗中發生某個事件是帶有偶然性的,但那些可以在相同條件下大量重復的隨機試驗卻往往呈現出明顯的數量規律性。人們在長期實踐中已逐步覺察到某些這樣的規律性,並在實際中應用它。例如,連續多次擲一均勻的硬幣,出現正面的頻率(出現次數與投擲次數之比)隨着投擲次數的增加逐漸穩定於1/2。又如,多次測量一物體的長度,其測量結果的平均值隨着測量次數的增加,逐漸穩定於一常數,並且諸測量值大都落在此常數的近旁,越遠則越少,因之其分布狀況呈現“中間大、兩頭小”及某種程度的對稱性(即近似於正態分布)。大數律及中心極限定理就是描述和論證這些規律性的。在實際中,人們往往還需要研究在時間推進中某一特定隨機現象的演變情況,描述這種演變的就是概率論中的隨機過程。例如,某一電話交換臺從一確定時刻起到其後的每一時刻爲止所收到的呼喚次數便是一隨機過程。又如,微小粒子在液體中因受周圍分子的隨機碰撞而形成不規則的運動(即布朗運動)也是一隨機過程。研究隨機過程的統計特性,計算與過程有關的某些事件的概率,特別是研究與過程樣本軌道(即過程的一次實現)有關的問題,是現代概率論的主要課題。總之,概率論與實際有着密切的聯系,它在自然科學、技術科學、社會科學、軍事和工農業生產中都有廣泛的應用。概率論還是數理統計學的理論基礎。


 

 

概率論發展簡史


 

  概率論有悠久的歷史,它的起源與博弈問題有關。16世紀,意大利的一些學者开始研究擲骰子等賭博中的一些簡單問題,例如比較擲兩個骰子出現總點數爲9或10的可能性大小。17世紀中葉,法國數學家布萊茲·帕斯卡爾、P.de費馬及荷蘭數學家C.惠更斯基於排列組合的方法(見組合數學)研究了一些較復雜的賭博問題,他們解決了“合理分配賭注問題”(即“得分問題”,見概率)、“輸光問題”等等。其方法不是直接計算賭徒贏局的概率,而是計算期望的贏值,從而導致了現今稱之爲數學期望的概念(由惠更斯明確提出)。使概率論成爲數學的一個分支的真正奠基人則是瑞士數學家雅各布第一·伯努利,他建立了概率論中第一個極限定理,即伯努利大數律;該定理斷言:設事件A的概率P(A)=p(0<p<1),若ηn表示前n次獨立重復試驗中事件A出現的次數,從而σn/n爲事件A出現的頻率,則當n→∞時,


  式中ε爲任一正實數。這一結果發表於他死後8年(1713)出版的遺著《推測術》(Ars conjectandi)中。這裏所說的事件的概率,應理解爲事件發生的機會的一個測度,即公理化概率測度(詳見後)。1716年前後,A.棣莫弗對p =1/2情形,用他導出的關於n!的漸近公式(,即所謂斯特林公式)進一步證明了漸近地服從正態分布德國數學家C.F.高斯於1809年研究測量誤差理論時重新導出正態分布,所以也稱爲高斯分布)。亞伯拉罕·棣莫弗的這一結果後來被法國數學家P.-S.拉普拉斯推廣到一般的p(0<p<1)的情形,後世稱之爲棣莫弗-拉普拉斯極限定理,這是概率論中第二個基本極限定理(見中心極限定理)的原始形式。皮埃爾-西蒙·拉普拉斯對概率論的發展貢獻很大。他在系統總結前人工作的基礎上,寫出了《概率的分析理論》(1812年出版,後又再版6次)。在這一著作中,他首次明確規定了概率的古典定義(通常稱爲古典概率,見概率),並在概率論中引入了更有力的分析工具,如差分方程、母函數等,從而實現了概率論由單純的組合計算到分析方法的過渡,將概率論推向一個新的發展階段。皮埃爾-西蒙·拉普拉斯非常重視概率論的實際應用,對人口統計學尤其感興趣。繼拉普拉斯以後,概率論的中心研究課題是推廣和改進伯努利大數律及棣莫弗-拉普拉斯極限定理。在這方面,俄國數學家∏.Л.切比雪夫邁出了決定性的一步,1866年他用他所創立的切比雪夫不等式建立了有關獨立隨機變量序列的大數律。次年,又建立了有關各階絕對矩一致有界的獨立隨機變量序列的中心極限定理;但其證明不嚴格,後來由Α.Α.馬爾可夫於1898年補證。1901年Α.М.李亞普諾夫利用特徵函數方法,對一類相當廣泛的獨立隨機變量序列,證明了中心極限定理。他還利用這一定理第一次科學地解釋了爲什么實際中遇到的許多隨機變量近似服從正態分布。繼李亞普諾夫之後,Α.Я.辛欽、Α.Η.柯爾莫哥洛夫、P.萊維及W. 費勒等人在隨機變量序列的極限理論方面作出了重要貢獻。到20世紀30年代,有關獨立隨機變量序列的極限理論已臻完備。在此期間,由於實際問題的需要,特別是受物理學的刺激,人們开始研究隨機過程。1905年A.愛因斯坦和R.斯莫盧霍夫斯基各自獨立地研究了布朗運動。他們用不同的概率模型求得了運動質點的轉移密度。但直到1923年,N.維納才利用三角級數首次給出了布朗運動的嚴格數學定義,並證明了布朗運動軌道的連續性。1907年馬爾可夫在研究相依隨機變量序列時,提出了現今稱之爲馬爾可夫鏈(見馬爾可夫過程)的概念;而馬爾可夫過程的理論基礎則由柯爾莫哥洛夫在1931年所奠定。稍後一些時候,辛欽研究了平穩過程的相關理論(1934)。所有這些關於隨機過程的研究,都是基於分析方法,即將概率問題化爲微分方程或泛函分析等問題來解決。從1938年开始,萊維系統深入地研究了布朗運動,取得了一系列重要成果,他充分利用概率的直覺性,將邏輯與直覺結合起來,倡導了研究隨機過程的一種新方法,即概率方法。這種方法的特點是着眼於隨機過程的軌道性質。萊維對概率論的另一重要貢獻是建立了獨立增量過程的一般理論。他的著作《隨機過程與布朗運動》(1948)至今仍是隨機過程理論的一本經典著作。現代概率論的另外兩個代表人物是J.L.杜布和伊藤清,前者創立了鞅論,後者創立了布朗運動的隨機積分理論。

  在概率發展史中特別值得一提的是柯爾莫哥洛夫在1933年建立了概率論的公理化體系。


 

 

概率論公理化體系的建立


 


 

  早在拉普拉斯給出概率的古典定義之前,人們就提出了幾何概率的概念,這是研究有無窮多個可能結果的隨機現象問題的,著名的布豐(曾譯蒲豐)投針問題 (1777)就是幾何概率的一個早期例子。19世紀,幾何概率逐步發展起來。但到19世紀末,出現了一些自相矛盾的結果。以著名的貝特朗悖論爲例:在圓內任作一弦,求其長超過圓內接正三角形邊長的概率。此問題可以有三種不同的解答:①由於對稱性,可預先指定弦的方向。作垂直於此方向的直徑,只有交直徑於 1/4點與3/4點間的弦,其長才大於內接正三角形邊長。設所有交點是等可能的,則所求概率爲 1/2(圖1之a)圖② 由於對稱性,可預先固定弦的一端。僅當弦與過此端點的切线的交角在60°~120°之間,其長才合乎要求。設所有方向是等可能的,則所求概率爲1/3(圖 1之b)。③弦被其中點位置惟一確定。只有當弦的中點落在半徑縮小了一半的同心圓內,其長才合乎要求。設中點位置都是等可能的,則所求概率爲1/4(圖1 之c)。這個問題之所以有不同解答,是因爲當一隨機試驗有無窮多個可能結果時,有時很難客觀地規定“等可能”這一概念。這反映了幾何概率的邏輯基礎是不夠嚴密的。幾何概率這類問題說明了拉普拉斯關於概率的古典定義帶有很大的局限性。當嚴密的概率公理化系統建立後,幾何概率才能健康地發展且有廣泛的應用。

  雖然到了19世紀下半葉,概率論在統計物理學中的應用及概率論的自身發展已突破概率的古典定義,但關於概率的一般定義則始終未能明確化和嚴格化。這種情況既嚴重阻礙了概率論的進一步發展和應用,又落後於當時數學的其他分支的公理化潮流。1900年,D.希爾伯特在世界數學家大會上公开提出了建立概率論公理化體系的問題,最先從事這方面研究的是(J.-)H.龐加萊、(F.-É.-J.-) É.波萊爾及С.Η.伯恩斯坦。關於概率論與測度論有聯系這一重要思想就出自波萊爾。伯恩斯坦於1917年構造了概率論的第一個公理化體系。20年代以後,相繼出現了 J.M.凱恩斯及R.von米澤斯等人的工作。凱恩斯主張把任何命題都看作是事件。例如,“明天將下雨”,“土星上有生命”,“某出土文物是某年代的產品”,等等。他把一事件的概率看作是人們根據經驗對該事件的可信程度,而與隨機試驗沒有直接聯系,因此,通常稱爲主觀概率。從凱恩斯起,對主觀概率提出了幾種公理體系,但沒有一種堪稱權威。也許,主觀概率的最大影響不在概率論領域自身,而在數理統計學中近年來出現的貝葉斯統計學派。和主觀概率學派相對立的是以米澤斯爲代表的概率的頻率理論學派。米澤斯把一事件的概率定義爲該事件在獨立重復隨機試驗中出現的頻率的極限,並把此極限的存在性作爲他的第一條公理。他的第二條公理是,對隨機選取的子試驗序列,事件出現的頻率的極限也存在並且極限值相等。

  嚴格說來,這第二條公理沒有確切的數學含義。因此,這種所謂公理化在數學上是不可取的。此外,象某個事件在一獨立重復試驗序列中出現無窮多次這一事件的概率,在米澤斯理論中是無法定義的。這種頻率法的理論依據是強大數律,它具有較強的直觀性,易爲實際工作者和物理學家所接受。但隨着科學的進步,它又已逐漸被絕大多數物理學家所拋棄。

  20世紀初完成的勒貝格測度(見測度論)和勒貝格積分理論以及隨後發展起來的抽象測度和積分理論,爲概率論公理體系的確立奠定了理論基礎。人們通過對概率論的兩個最基本的概念即事件與概率長期研究,發現事件的運算與集合的運算完全類似,概率測度有相同的性質。到了30年代,隨着大數研究的深入,概率論與測度論的聯系愈來愈明顯。例如強、弱大數律中的收斂性(見概率論中的收斂) 與測度論中的幾乎處處收斂及依測度收斂完全類似。在這種背景下,柯爾莫哥洛夫於1933年在他的《概率論基礎》一書中第一次給出了概率測度論式的定義和一套嚴密的公理體系。這一公理體系着眼於規定事件及事件概率的最基本的性質和關系,並用這些規定來表明概率的運算法則。它們是從客觀實際中抽象出來的,既概括了概率的古典定義、幾何定義及頻率定義的基本特性,又避免了各自的局限性和含混之處。這一公理體系一經提出,便迅速獲得舉世的公認。它的出現,是概率論發展史上的一個裏程碑,爲現代概率論的蓬勃發展打下了堅實的基礎。


 

 

現代概率論的內容


 

  由於科學技術中許多實際問題的推動以及概率論邏輯基礎的建立,概率論從20世紀30年代以來得到了迅速的發展。

  目前其主要研究內容大致可分爲極限理論,獨立增量過程,馬爾可夫過程,平穩過程和時間序列,鞅和隨機微分方程,點過程等。此外,包括組合概率(用組合數學方法解決只涉及有限個基本事件的概率問題)、幾何概率等在內的一些屬於古典範疇的問題,至今仍有人在繼續研究,並有新的發展。

  極限理論是研究與隨機變量序列或隨機過程序列的收斂性有關的問題的理論。20世紀30年代以後,有關隨機變量序列的極限理論(主要是中心極限定理)的研究,是將獨立序列情形的結果推廣到鞅差序列和更一般的弱相依序列等情形,以及研究收斂速度問題。近年來,由於統計力學的需要,人們开始研究強相依隨機變量序列的非中心極限定理

  自1951年M.唐斯克提出不變原理(見隨機過程的極限定理)後,有關隨機過程序列的弱收斂的研究成了極限理論的一個中心課題。ю.Β.普羅霍洛夫及A.B.斯科羅霍德在這方面作出了最主要的貢獻。1964年V.斯特拉森的工作出現後,引起了有關隨機過程序列的強收斂的研究,這就是強不變原理。近年來,鞅論方法已滲透到這一領域,使許多經典結果的證明得到簡化和統一處理,並且還導致一些新的結果。

  人們最早知道的獨立增量過程是在物理現象中觀察到的布朗運動和泊松過程,一般的獨立增量過程的研究,歸功於萊維,它在20世紀40年代已臻成熟。在這些研究中,包含了許多重要的方法和概念,概率論的許多近代研究課題都直接或間接地受其啓發與影響。

  在實際中遇到的很多隨機現象有如下的共同特性:它的未來的演變,在已知它目前狀態的條件下與以往的狀況無關。描述這種隨時間推進的隨機現象的演變模型就是馬爾可夫過程

  20世紀50年代以前,研究馬爾可夫過程的主要工具是微分方程和半羣理論(即分析方法);1936年前後就开始探討馬爾可夫過程的軌道性質,直到把微分方程和半羣理論的分析方法同研究軌道性質的概率方法結合運用,才使這方面的研究工作進一步深化,並形成了對軌道分析必不可少的強馬爾可夫性概念。1942 年,伊藤清用他創立的隨機積分和隨機微分方程理論來研究一類特殊而重要的馬爾可夫過程──擴散過程,开闢了研究馬爾可夫過程的又一重要途徑。近年來,鞅論方法也已滲透到馬爾可夫過程研究中,它與隨機微分方程結合在一起,已成爲目前處理多維擴散過程的工具。此外,馬爾可夫過程與分析學中的位勢論有密切的聯系。對馬爾可夫過程研究,推動了位勢理論的發展,並爲研究偏微分方程提供了概率論的方法。最近十多年發展起來的吉布斯隨機場和無窮粒子隨機系統,是由於統計物理的需要而提出的。

  許多自然的和生產過程中的隨機現象表現出某種平穩性。一種平穩性是過程在任意一些時刻上的聯合概率分布隨時間推移不變,這種平穩性稱爲嚴平穩性。嚴平穩過程的研究與遍歷理論有密切的聯系。如果上述對概率分布的要求放寬爲僅對二階相關矩的要求,即過程在任意兩時刻上的協方差隨時間推移不變,則稱這種平穩性爲寬平穩性。關於寬平穩過程的研究,辛欽、柯爾莫哥洛夫和維納等人運用傅裏葉分析和泛函分析的工具,在40年代已經找出了過程的相關函數及過程本身的譜分解式,並且較完滿地解決了有應用意義的預測問題。許多應用問題還要求根據觀測數據去建立這些數據所來自的隨機過程的模型。爲此產生了時間序列分析這一課題,提出了寬平穩序列的自回歸滑動平均(ARMA)模型以及一些非线性模型。

  鞅是另一類重要的隨機過程。從20世紀30年代起,萊維等人就开始研究鞅序列,把它作爲獨立隨機變量序列的部分和的推廣。40年代到50年代初,杜布對鞅進行了系統的研究,得到有名的鞅不等式、停止定理和收斂定理等重要結果。1962年,P.A.邁耶解決了杜布提出的連續時間的上鞅分解爲鞅及增過程之差的問題。在解決這個問題的過程中,出現了很多新鮮而深刻的概念,使鞅和隨機過程一般理論的內容大大豐富起來。鞅的研究豐富了概率論的內容,並引起人們用它所提供的新方法新概念對概率論中許多經典的內容重新審議,把以往認爲是復雜的東西納入鞅論的框架而加以簡化。此外,利用上鞅的分解定理,可以把伊藤清的對布朗運動的隨機積分推廣到對一般鞅乃至半鞅的隨機積分;因而,更一般的隨機微分方程的研究也隨之發展。隨機微分方程理論不僅可以用來研究馬爾可夫過程,它還是解決濾波問題的必要工具。最近出現的流形上的隨機微分方程又和微分幾何及分析力學的研究發生了密切的聯系。鞅論還對本學科以外的位勢理論、調和分析及復變函數論等提供了有用的工具。

  點過程是從所謂計數過程發展出來的,它們的特點是,可用落在不相重疊的集合上的隨機點數目的聯合概率分布來刻畫整個過程的概率規律。最基本的計數過程是泊松過程,1943年,C.帕爾姆將它作爲最簡單的輸入流應用於研究電話業務問題;1955年,辛欽又以嚴密的數學觀點作了整理和發展。

  在60年代以前,點過程的研究主要限於泊松過程及其推廣的過程。以後,由於大量實際問題的需要以及隨機測度論和現代鞅論的推動,進一步把實軸上的點過程(即計數過程)推廣到一般的可分完備度量空間上,在內容和方法上都有根本性的進展。


 

 

現代概率論的應用


 

  概率論的發展史說明了理論與實際之間的密切關系。許多研究方向的提出,歸根到底是有其實際背景的。反過來,當這些方向被深入研究後,又可指導實踐,進一步擴大和深化應用範圍。概率論作爲數理統計學的理論基礎是盡人皆知的。下面簡略介紹一下概率論本身在各方面的應用情況。

  在物理學方面,高能電子或核子穿過吸收體時,產生級聯(或倍增)現象,在研究電了-光子級聯過程的起伏問題時,要用到隨機過程,常以泊松過程、弗瑞過程或波伊亞過程作爲實際級聯的近似,有時還要用到更新過程(見點過程)的概念。當核子穿到吸收體的某一深度時,則可用擴散方程來計算核子的概率分布。物理學中的放射性衰變,粒子計數器,原子核照相乳膠中的徑跡理論和原子核反應堆中的問題等的研究,都要用到泊松過程和更新理論。湍流理論以及天文學中的星雲密度起伏、輻射傳遞等研究要用到隨機場的理論。探討太陽黑子的規律及其預測時,時間序列方法非常有用。

  化學反應動力學中,研究化學反應的時變率及影響這些時變率的因素問題,自動催化反應,單分子反應,雙分子反應及一些連鎖反應的動力學模型等,都要以生滅過程(見馬爾可夫過程)來描述。

  隨機過程理論所提供的方法對於生物數學具有很大的重要性,許多研究工作者以此來構造生物現象的模型。研究羣體的增長問題時,提出了生滅型隨機模型,兩性增長模型,羣體間競爭與生尅模型,羣體遷移模型,增長過程的擴散模型等等。有些生物現象還可以利用時間序列模型來進行預報。傳染病流行問題要用到具有有限個狀態的多變量非线性生滅過程。在遺傳問題中,着重研究羣體經過多少代遺傳後,進入某一固定類和首次進入此固定類的時間,以及最大基因頻率的分布等。

  許多服務系統,如電話通信,船舶裝卸,機器損修,病人候診,紅綠燈交換存貨控制,水庫調度,購貨排隊,等等,都可用一類概率模型來描述。這類概率模型涉及的過程叫排隊過程,它是點過程的特例。排隊過程一般不是馬爾可夫型的。當把顧客到達和服務所需時間的統計規律研究清楚後,就可以合理安排服務點。

  在通信、雷達探測、地震探測等領域中,都有傳遞信號與接收信號的問題。傳遞信號時會受到噪聲的幹擾,爲了準確地傳遞和接收信號,就要把幹擾的性質分析清楚,然後採取辦法消除幹擾。這是信息論的主要目的。噪聲本身是隨機的,所以概率論是信息論研究中必不可少的工具。信息論中的濾波問題就是研究在接收信號時如何最大限度地消除噪聲的幹擾,而編碼問題則是研究採取什么樣的手段發射信號,能最大限度地抵抗幹擾。在空間科學和工業生產的自動化技術中需要用到信息論控制理論,而研究帶隨機幹擾的控制問題,也要用到概率論方法。

  概率論進入其他科學領域的趨勢還在不斷發展。值得指出的是,在純數學領域內用概率論方法研究數論問題已經有很好的結果。在社會科學領域,特別是經濟學中研究最優決策和經濟的穩定增長等問題,也大量採用概率論方法。正如拉普拉斯所說:“生活中最重要的問題,其中絕大多數在實質上只是概率的問題。”

 

概率論的案例分析


 

  1.基於概率論的圍巖分類法

  基於概率論的圍巖分類法的基本思想是:在確定圍巖分類時同時考慮到幾種常用分類法:RQD法,彈性波速vp法和公路隧道設計規範(JTGD70–2004)中採用的BQ值法。各種分類情況見下表。爲了簡化公式,便於計算,假定這3個不同的劃分標準作爲隨機事件來說是各自獨立的,並且這三者在判定中所起的作用也是等同的,因此,按照概率論原理,待判定圍巖在3種圍巖分類法中取得一致判斷結果的概率就是待判定圍巖每種分類法概率的乘積。只要分別計算出各種圍巖分類標準中每一類圍巖出現的概率,其乘積所對應的圍巖類別就是該圍巖的分類級別。

  

  取RQD值上限爲100%,下限爲0%;取vp值上限爲5km/s,下限爲0km/s;取BQ值上限爲600,下限爲0。各種分類法均看成連續型變量,按照期望值原理,計算各種圍巖分類法中每種圍巖類別的期望值,結果見下表。

  

  2.各類圍巖的概率

  按照概率論原理,每一類公路隧道圍巖在多種分類方法下取得相同結果的概率如下所述。

  (1)Ⅰ類圍巖出現的概率

  (7)

  (2)Ⅱ類圍巖出現的概率

  (8)

  (3)Ⅲ類圍巖出現的概率

  (9)

  (4)Ⅳ類圍巖出現的概率

  (10)

  (5)Ⅴ類圍巖出現的概率

  (11)

  (6)Ⅵ類圍巖出現的概率

  (12)

  3.圍巖類別判定

  按照概率學原理,在多個事件中,概率最大的事件出現的可能性是最大的。因此通過計算圍巖類別的概率,即可確定概率最大的一類即爲該待定圍巖最有可能的圍巖類別,即最有可能的圍巖類別爲maxPI,PII,PIII,PIV,PV,PVI所對應的圍巖類別。

  4.算例

  爲了驗證概率論方法在圍巖概率分類方面的合理性和科學性,選取雲嶺隧道中有代表性的2段,利用本文的方法進行計算,其中,一段爲軟弱圍巖,另一段爲硬巖。

  (1)算例1

  樁號裏程爲K104+800—K104+850,設計圍巖類別爲Ⅲ類。根據勘察資料可知,該段圍巖爲弱風化千枚巖,RQD值爲0%—30%,屬Ⅰ—Ⅱ類圍巖,可取RQD值爲30%進行計算;彈性波速爲2—3km/s,屬Ⅲ—Ⅳ類圍巖,可取3km/s計算;按照《公路隧道設計規範》(JTGD70–2004)計算得出BQ值爲212.5,屬Ⅱ類圍巖。

  

  用概率論方法計算出來的結果如上表所示。顯然,該類巖石爲Ⅱ類圍巖的概率最大,因此計算判斷該類圍巖應屬Ⅱ類圍巖。這與施工過程中遇到的真實圍巖情況非常吻合。

  (2)算例2

  樁號裏程爲K106+850K106+800,設計圍巖類別爲IV類。根據勘察資料可知,該段爲弱—微風化灰巖微風化灰巖RQD值爲50%—70%,弱風化灰巖的爲20%—50%,爲Ⅰ—Ⅲ類圍巖,取RQD值爲50%進行計算,對應的圍巖屬Ⅲ類;彈性波速爲3.1—4.0km/s,屬Ⅳ類圍巖,取彈性波速爲4km/s計算;按照《公路隧道設計規範》(JTGD70–2004)計算得出BQ值爲390,屬IV類圍巖用概率論方法計算出來的圍巖類別如下表所示。顯然該類巖石爲Ⅳ類圍巖的概率最大,因此該類圍巖應屬Ⅳ類圍巖。這與施工過程中遇到的真實的圍巖情況非常吻合。

 

熱門資訊更多