最小二乘法

什么是最小二乘法
　　所謂的最小二乘法（generalized least squares）是一種數學優化技術，它通過最小化誤差的平方和找到一組數據的最佳函數匹配。最小二乘法是用最簡的方法求得一些絕對不可知的真值，而令誤差平方之和爲最小。最小二乘法通常用於曲线擬合。很多其他的優化問題也可通過最小化能量或最大化熵用最小二乘形式表達。
　　比如從最簡單的一次函數y=kx+b講起已知坐標軸上有些點(1.1,2.0),(2.1,3.2),(3,4.0),(4,6),(5.1,6.0),求經過這些點的圖象的一次函數關系式。當然這條直线不可能經過每一個點,我們只要做到5個點到這條直线的距離的平方和最小即可,這這就需要用到最小二乘法的思想.然後就用线性擬合來求。一般只用於建模。
最小二乘法歷史簡介
　　1801年，意大利天文學家朱賽普·皮亞齊發現了第一顆小行星谷神星。經過40天的跟蹤觀測後，由於谷神星運行至太陽背後，使得皮亞齊失去了谷神星的位置。隨後全世界的科學家利用皮亞齊的觀測數據开始尋找谷神星，但是根據大多數人計算的結果來尋找谷神星都沒有結果。時年24歲的高斯也計算了谷神星的軌道。奧地利天文學家海因裏希·奧爾伯斯根據高斯計算出來的軌道重新發現了谷神星。
　　高斯使用的最小二乘法的方法發表於1809年他的著作《天體運動論》中。
　　法國科學家勒讓德於1806年獨立發現“最小二乘法”。但因不爲時人所知而默默無聞。
　　勒讓德曾與高斯爲誰最早創立最小二乘法原理發生爭執。
　　1829年，高斯提供了最小二乘法的優化效果強於其他方法的證明，因此被稱爲高斯-莫卡夫定理。
">編輯]最小二乘法原理
　　在我們研究兩個變量(x, y)之間的相互關系時，通常可以得到一系列成對的數據(x1, y1、x2, y2... xm , ym)；將這些數據描繪在x -y直角坐標系中:
　　YX= a0 + a1 X　　(式1-1)
　　其中：a0、a1 是任意實數
　　爲建立這直线方程就要確定a0和a1，應用《最小二乘法原理》，將實測值Yi與利用(式1-1)計算值(Y計=a0+a1X)的離差(Yi-Y計)的平方和〔∑(Yi - YX)2〕最小爲“優化判據”。
　　令: φ = ∑(Yi - YX)2　　(式1-2)
　　把(式1-1)代入(式1-2)中得:
　　φ = ∑(Yi - a0 - a1 Xi)2　　(式1-3)
　　當∑(Yi-YX)平方最小時，可用函數 φ 對a0、a1求偏導數，令這兩個偏導數等於零。亦即：
　　m a0 + (∑Xi ) a1 = ∑Yi (式1-4)
　　(∑Xi ) a0 + (∑Xi2 ) a1 = ∑(Xi, Yi) (式1-5)
　　得到的兩個關於a0、 a1爲未知數的兩個方程組，解這兩個方程組得出：
　　a0 = (∑Yi) / m - a1(∑Xi) / m (式1-6)
　　a1 = / (式1-7)
　　這時把a0、a1代入(式1-1)中, 此時的(式1-1)就是我們回歸的元线性方程即： $\text{[math]}$ tp://wiki.mbalib.com/w/images/math/1/1/e/11e5e0dcb4dfd3c3aa1e36829e7079b9.png" alt="LM=a_1\times LS+a_0">。
　　在回歸過程中，回歸的關聯式是不可能全部通過每個回歸數據點(x1, y1、 x2, y2...xm,ym),爲了判斷關聯式的好壞,可借助相關系數“R”，統計量“F”，剩余標準偏差“S”進行判斷；“R”越趨近於 1 越好；“F”的絕對值越大越好；“S”越趨近於 0 越好。
　　R = / SQR{} (式1-10) ＊
　　在(式1-1)中，m爲樣本容量，即實驗次數；Xi、Yi分別任意一組實驗X、Y的數值。微積分應用
最小二乘法-課題一
　　從前面的學習中, 我們知道最小二乘法可以用來處理一組數據, 可以從一組測定的數據中尋求變量之間的依賴關系, 這種函數關系稱爲經驗公式. 本課題將介紹最小二乘法的精確定義及如何尋求與之間近似成线性關系時的經驗公式. 假定實驗測得變量之間的個數據 , , …, , 則在平面上, 可以得到個點 , 這種圖形稱爲“散點圖”, 從圖中可以粗略看出這些點大致散落在某直线近旁, 我們認爲與之間近似爲一线性函數, 下面介紹求解步驟.
　　考慮函數 , 其中和是待定常數. 如果在一直线上, 可以認爲變量之間的關系爲 . 但一般說來, 這些點不可能在同一直线上. 記 , 它反映了用直线來描述 , 時, 計算值與實際值產生的偏差. 當然要求偏差越小越好, 但由於可正可負, 因此不能認爲總偏差時, 函數就很好地反映了變量之間的關系, 因爲此時每個偏差的絕對值可能很大. 爲了改進這一缺陷, 就考慮用來代替 . 但是由於絕對值不易作解析運算, 因此, 進一步用來度量總偏差. 因偏差的平方和最小可以保證每個偏差都不會很大. 於是問題歸結爲確定中的常數和 , 使爲最小. 用這種方法確定系數 , 的方法稱爲最小二乘法.
　　由極值原理得 , 即
　　解此聯立方程得
　　(*)
　　問題 I 爲研究某一化學反應過程中, 溫度 ℃)對產品得率 (％)的影響, 測得數據如下:
　　溫度 ℃)
　　100 110 120 130 140 150 160 170 180 190
　　得率 (％)
　　45 51 54 61 66 70 74 78 85 89
　　(1) 利用“ListPlot”函數, 繪出數據的散點圖(採用格式: ListPlot] );
　　(2) 利用“Line”函數, 將散點連接起來, 注意觀察有何特徵? (採用格式: Show] , Axes->True ]);
　　(3) 根據公式(*), 利用“Apply”函數及集合的有關運算編寫一個小的程序, 求經驗公式;
　　(程序編寫思路爲: 任意給定兩個集合A (此處表示溫度)、B(此處表示得率), 由公式(*)可定義兩個二元函數(集合A和B爲其變量)分別表示和 . 集合A元素求和: Apply 表示將加法施加到集合A上, 即各元素相加, 例如Apply=6;Length表示集合A 元素的個數, 即爲n; A.B表示兩集合元素相乘相加;A*B表示集合A與B元素對應相乘得到的新的集合.)
　　(4) 在同一張圖中顯示直线及散點圖;
　　(5) 估計溫度爲200時產品得率.
　　然而, 不少實際問題的觀測數據 , , …, 的散點圖明顯地不能用线性關系來描敘, 但確實散落在某一曲线近旁, 這時可以根據散點圖的輪廓和實際經驗, 選一條曲线來近似表達與的相互關系.
　　問題 II 下表是美國舊轎車價格的調查資料, 今以表示轎車的使用年數, (美元)表示相應的平均價格, 求與之間的關系.
　　使用年數
　　1 2 3 4 5 6 7 8 9 10
　　平均價格
　　2651 1943 1494 1087 765 538 484 290 226 204
　　(1) 利用“ListPlot”函數繪出數據的散點圖, 注意觀察有何特徵?
　　(2) 令 , 繪出數據的散點圖, 注意觀察有何特徵?
　　(3) 利用“Line”函數, 將散點連接起來, 說明有何特徵?
　　(4) 利用最小二乘法, 求與之間的關系;
　　(5) 求與之間的關系;
　　(6) 在同一張圖中顯示散點圖及關於的圖形.
思考與練習
　　1. 假設一組數據: , , …, 變量之間近似成线性關系, 試利用集合的有關運算, 編寫一簡單程序: 對於任意給定的數據集合 , 通過求解極值原理所包含的方程組, 不需要給出、計算的表達式, 立即得到、的值, 並就本課題 I /(3)進行實驗.
　　注: 利用Transpose函數可以得到數據A的第一個分量的集合, 命令格式爲:
　　先求A的轉置, 然後取第一行元素, 即爲數據A的第一個分量集合, 例如
　　(A即爲矩陣 )
　　= (數據A的第一個分量集合)
　　= (數據A的第二個分量集合)
　　B-C表示集合B與C對應元素相減所得的集合, 如 = .
　　2. 最小二乘法在數學上稱爲曲线擬合, 請使用擬合函數“Fit”重新計算與的值, 並與先前的結果作一比較.
　　注: Fit函數使用格式:
　　設變量爲x, 對數據A進行线性擬合, 如對題1中的A擬合函數爲:
參考文獻