點估計


概述
  point estimation
  由樣本數據估計總體分布所含未知參數的真值,所得到的值,稱爲估計值。點估計的精確程度用置信區間表示。
  當母羣的性質不清楚時,我們須利用某一量數作爲估計數,以幫助了解母數的性質.如:樣本平均數乃是母羣平均數μ的估計數.當我們只用一個特定的值,亦即數线上的一個點,作爲估計值以估計母數時,就叫做點估計.
  點估計目的是依據樣本X=(X1,X2,…,Xn)估計總體分布所含的未知參數θ或θ的函數 g(θ)。一般θ或g(θ)是總體的某個特徵值,如數學期望、方差、相關系數等。
  點估計的常用方法有矩估計法、順序計量法、最大似然法、最小二乘法等。正文
  參數估計的一種形式。目的是依據樣本X=(X1,X2,…,Xn)估計總體分

pic-info">點估計

布所含的未知參數θθ的函數 g(θ)。一般θg(θ)是總體的某個特徵值,如數學期望、方差、相關系數(見相關分析)等。θg(θ)通常取實數或k維實向量爲值。點估計問題就是要構造一個只依賴於樣本X的量抭(X),作爲g(θ)的估計值。抭(X)稱爲g(θ)的估計量。因爲k維實向量可表爲k維歐幾裏得空間的一個點,故稱這樣的估計爲點估計。
  例如,設一批產品廢品率爲θ,爲估計θ,從這批產品中隨機地抽出 n個作檢查,以X 記其中的廢品個數,用 X/n估計θ,就是一個點估計。又如用樣本方差(見計量)估計總體分布的方差,或用樣本相關系數估計總體分布的相關系數,都是常見的點估計。構造點估計的方法

矩估計法

  這是英國統計學家К.皮爾森在1894年提出的方法,其要旨是用樣本矩的

pic-info">點估計

函數估計總體矩的同一函數。例如,若總體分布服從正態分布 N(μ,σ2),其中μ是總體均值,σ2是總體方差,未知參數可記爲θ=(μ,σ)。σ/μ(μ≠0)稱爲變異系數,它是總體的一階原點矩(即均值)μ與二階中心矩(即方差)σ2的函數。設有樣本X=(X1,X2,…,Xn),其一階樣本原點矩爲,二階樣本中心矩爲,而用估計 σ/μ,就是一個典型的矩估計方法。

最大似然估計

  此法作爲一種重要而普遍的點估計法,由英國統計學家R.A.費希爾在1912年提出。後來在他1921年和1925年的工作中又加以發展。設樣本X=(X1,X2,…,Xn)的分布密度爲L(X,θ),若固定X

pic-info">點估計

而將L視爲θ的函數,則稱爲似然函數,當X是簡單隨機樣本時,它等於ƒ(X1,θ)ƒ(X2,θ)…ƒ(Xn,θ),其中,ƒ(X,θ)是總體分布的密度函數或概率函數(見概率分布)。一經得到樣本值x,就確定(x),使 ,然後用估計g(θ),這就是g(θ)的最大似然估計。例如,不難證明,前面爲估計正態分布N(μ,σ2)中的參數μ和σ2而提出的估計量和2,就是μ和σ2的最大似然估計

最小二乘估計法

  這個重要的估計方法是由德國數學家C.F.高斯在1799~1809年和法國數學家A.-M.勒讓德在1806年提出,並由俄國數學家Α.Α.馬爾可夫在1900年加以發展。它主要用於线性統計模型中的參

pic-info">點估計

數估計問題。 貝葉斯估計法 是基於“貝葉斯學派”的觀點而提出的估計法(見貝葉斯統計)。

小樣本優良性準則

  可以用來估計g(θ)的估計量很多,於是產生了怎樣選擇一個優良估計量的問題。首先必須對

pic-info">點估計

“優良性”定出準則。這種準則不是惟一的,它可以根據問題的實際背景和理論上的方便進行選擇。優良性準則有兩大類:一類是小樣本準則,即在樣本大小固定時的優良性準則;另一類是大樣本準則,即在樣本大小趨於無窮時的優良性準則。最重要的小樣本優良性準則是無偏性及與此相關的一致最小方差無偏估計。若一個估計量抭(X)的數學期望等於被估計的g(θ),即對一切θ,,則稱抭(X)爲g(θ)的無偏估計,這種估計的特點是:在多次重復

pic-info">點估計

用時, 抭(X)與g(θ)的偏差的算術平均值隨使用次數的增加而趨於零。因此,無偏性只在重復使用中,並且各次誤差能相互抵消時,才顯出其意義。無偏估計並不總是存在。例如,設總體服從二項分布B(n,θ),0<θ<1,則1/θ的無偏估計就不存在。有時,無偏估計雖然存在,但很不合理。在一些

pic-info">點估計

問題中,無偏估計有很多,它們的優良性由其方差來衡量,方差愈小愈好。若一無偏估計的方差比任何別的無偏估計的方差都小,或至多相等,則稱它爲一致最小方差無偏估計。尋找一致最小方差無偏估計的一個普遍方法,是D.布萊克韋爾、E.L.萊曼和H.謝菲在1950年提出的,它基於計量的充分性與完全性的概念:設抭(X)是一個無偏估計,T是一個完全充分計量,則抭(X)在給定T時的條件期望就是一個一致最小方差無偏估計。 克拉默-拉奧不等式是尋求一致最小方差無偏估計的另一重要工具,是由印度統計學

pic-info">點估計

C.R.拉奧和瑞典統計學家H.克拉默在1945年和1946年先後獨立地證明的。當樣本的似然函數 L(X,θ)滿足一定條件時,則 g(θ)的任一無偏估計 抭(X)的方差 ,對於一切θ滿足不等式這個不等式的右邊只與樣本的分布及待估函數 g有關,而與抭(X)無關。通常稱這個不等式爲克拉默-拉奧不等式,或C-R不等式。它的右邊給出了 g(θ)的無偏估計的方差的最小下界,稱爲克拉默-拉奧下界或C-R下界。因此,若某一無偏估計的方差達到上述C-R下界,則它必是一致最小方差無偏估計。C-R不等式在其他統計問題中也有應用。

pic-info">點估計

在點估計問題中還使用其他一些小樣本準則,如容許性準則、最小化最大準則、最優同變準則(見統計決策理論)等。大樣本優良性準則

重要的如下

  相合性 若g(θ)的估計量 抭n(X1,X2,…,Xn)在n趨於無窮時,在某種收斂意義下

pic-info">點估計

(見概率論中的收斂)收斂於g(θ),則稱抭n(X1,…,Xn)是 g(θ)的在這種收斂意義下的相合估計。這是點估計最基本的大樣本準則。例如依概率收斂意義下的相合性稱爲弱相合,幾乎必然收斂意義下的相合性稱爲強相合。矩估計一般具有相合性。最大似然估計在一定條件下爲強相合的證明始自A.瓦爾德1949年的工作,並在以後爲許多學者所發展。线性統計模型中參數的最小二乘估計的強相合性研究始於20世紀60年代,近年來取得很大的進展。

最優漸近正態估計

  簡稱BAN估計。設X1,X2,…,Xn爲從一總體中隨機獨立地抽出的樣本,總體分布具有密度函數或概率函數 ƒ(x,θ),滿足一定的正則條件,設g(θ)爲待估函數,記 式中稱爲費希爾信息量,若g(θ)

pic-info">點估計

的估計量爲抭n(X1,X2,…,Xn),當n→時,依分布收斂於正態分布 N(0,v2(θ)),就稱此估計量爲g(θ)的 BAN估計。在g(θ)的一類漸近正態估計中,以這種估計的漸近方差最小,故稱爲最優漸近正態估計。在一般條件下,最大似然估計BAN估計。

漸近有效估計

  當樣本大小爲n時,C-R不等式的右邊(即C-R下

pic-info">點估計

界)就是 v2(θ)/n。在BAN估計定義中,並未要求估計量抭n(X1,X2,…,Xn)的方差存在,如果去掉漸近正態性的要求,而要求抭n(X1,X2,…,Xn)的方差存在且漸近於C-R下界,則得到克拉默於1946年定義的漸近有效估計的概念。不少情況下,BAN估計也是漸近有效估計。1960年印度統計學家R.R.巴哈杜爾提出另一種漸近有效性的概念,還可以用於假設檢驗問題。近年來,日本統計學家竹內啓又在兩個方面發展了估計的漸近有效性概念:一是漸近分布不必是正態分布;二是收斂於漸近分布的階不必是。 點估計理論是數理統計學得到較多和較深入發展的一個方面。在小樣本方面,1955年C.施坦提出了一個反例,證明當維數大於2時,多維正態分布均值向量的通常估計(樣本均值)在平

pic-info">點估計

方損失下不可容許。這個簡單的但出乎意料的反例啓發了關於點估計的容許性的一系列研究。在大樣本方面,值得提到的發展還有自適應估計、穩健估計及非參數估計方面許多深入的結果。

參考書目

  H.克拉默著,魏宗舒等譯:《統計學數學方法》,上海科學技術出版社,上海,1966。(H.Cramér,MatheMatical Methods of Statistics,Princeton Univ. Press

pic-info">點估計

,Princeton, 1946.) 成平等著:《參數估計》,上海科學技術出版社,上海,1985。

熱門資訊更多