曲线擬合

曲线擬合的定義
　　曲线擬合是指用連續曲线近似地刻畫或比擬平面上離散點組所表示的坐標之間的函數關系。推求一個解析函數y=f(x)使其通過或近似通過有限序列的資料點(xi，yi)，通常用多項式函數通過最小二乘法求得此擬合函數。
曲线擬合的分析
　　用連續曲线近似地刻畫或比擬平面上離散點組所表示的坐標之間的函數關系。更廣泛地說，空間或高維空間中的相應問題亦屬此範疇。在數值分析中，曲线擬合就是用解析表達式逼近離散數據，即離散數據的公式化。實踐中，離散點組或數據往往是各種物理問題和統計問題有關量的多次觀測值或實驗值，它們是零散的，不僅不便於處理，而且通常不能確切和充分地體現出其固有的規律。這種缺陷正可由適當的解析表達式來彌補。
數學表述　設給定離散數據
　　(xk,yk) (k=1,2,…,m),(1)
　　式中xk爲自變量x(標量或向量,即一元或多元變量)的取值；yk爲因變量 y（標量）的相應值。曲线擬合要解決的問題是尋求與(1)的背景規律相適應解析表達式
　　y=f(x,b),(2)
　　使它在某種意義下最佳地逼近或擬合(1),?(x,b)稱爲擬合模型；爲待定參數,當b)僅在?中线性地出現時，稱模型爲线性的，否則爲非线性的。量
　　 $\text{[math]}$ tp://wiki.mbalib.com/w/images/math/5/1/e/51e3e12f67bfed9633b6fd3533f44b0e.png" alt="e_k\equiv y_k -f (x_k ,b)">(k=1,2,…，m)
　　稱爲在xk處擬合的殘差或剩余，衡量擬合優度的標準通常有
　　 $\text{[math]}$ tp://wiki.mbalib.com/w/images/math/f/0/4/f04af5ea7f8098c7b7cbde92735d9aa1.png" alt="T_b \equiv \max_{1 \le k \le m}w_k \left|e_k\right|"> 或 $\text{[math]}$ tp://wiki.mbalib.com/w/images/math/5/6/b/56ba2fa5776dda2206442af19a518c7a.png" alt="Q_b=\sum_{k=1}^m w_k e_k^2">
　　式中ωk>0爲權系數或權重（如無特別指定，一般取爲平均權重，即wk(k=1,2,…,m),此時無需提到權）。當參數b)使T(b))或Q(b))達到最小時，相應的(2)分別稱爲在加權切比雪夫意義或加權最小二乘意義下對 (1)的擬合，後者在計算上較簡便且最爲常用。
　　模型中參數的確定　一般的线性模型是以參數 b)爲系數的廣義多項式，即
　　f(x,b)=b0g0(x)+b1g1(x)+…bngn(x)　　　 (3)
　　式中g0,g1,…，gn稱爲基函數。對諸gj的不同選取可構成多種典型的和常用的线性模型。從函數逼近的觀點來看，式(3)還能近似地體現許多非线性模型的性質。
　　在最小二乘意義下用线性模型(3)擬合離散點組(1)，參數b可通過解方程組 $\text{[math]}$ tp://wiki.mbalib.com/w/images/math/2/5/9/259cbdf7228f0e8f33c66f48da956ce5.png" alt="{aQ(b)\over ab_i}">=0(i=0,…,n)來確定，即解關於b0,b1,…,bn的线性代數方程組
　　 $\text{[math]}$ tp://wiki.mbalib.com/w/images/math/c/6/6/c662ca0209e9a00d76df363f9470be6f.png" alt="\sum_{j=0}^n s_ij b_j=s_iy">(i=0,1,…，n),　　　(4)
　　式中　 $\text{[math]}$ tp://wiki.mbalib.com/w/images/math/9/0/4/904ced466ef5f5e3a1b0258c780253a3.png" alt="s_ij=\sum_{k=1}^m w_k g_i(x_k)g_j(x_k)">　　　 (i,j＝0,1,…，n),
　　 $\text{[math]}$ tp://wiki.mbalib.com/w/images/math/9/c/1/9c15ff1be6578986697a9507fd1562de.png" alt="R_1 = \frac{L \cdot \sin \theta_2}{\sin(\theta_2 - \theta_1)}">
　　方程組(4)通常稱爲法方程或正規方程，當m>n時一般有惟一解。
　　至於非线性模型以及非最小二乘原則的情形,參數b)可通過解非线性方程組或最優化計算中的有關方法來確定（見非线性方程組數值解法、最優化）。
模型的選擇
　　對於給定的離散數據(1),需恰當地選取一般模型(2)中函數f(x,b)的類別和具體形式,這是擬合效果的基礎。若已知(1)的實際背景規律，即因變量y對自變量 x的依賴關系已有表達式形式確定的經驗公式，則直接取相應的經驗公式爲擬合模型。反之，可通過對模型(3)中基函數g0,g1,…,gn(個數和種類)的不同選取，分別進行相應的擬合並擇其效果佳者。函數g0,g1,…,gn對模型的適應性起着測試的作用，故又稱爲測試函數。另一種途徑是:在模型(3)中納入個數和種類足夠多的測試函數，借助於數理統計方法中的相關性分析和顯著性檢驗，對所包含的測試函數逐個或依次進行篩選以建立較適合的模型（見回歸分析）。當然，上述方法還可對擬合的殘差（視爲新的離散數據）再次進行，以彌補初次擬合的不足。總之，當數據中變量之間的內在聯系不明確時，爲選擇到相適應的模型，一般需要反復地進行擬合試驗和分析鑑別。