生物統計


  

發展簡況

  最早提出生物統計思想的是比利時數學家L.A.J.凱特萊,他試圖把統計學的理論應用於解決生物學、醫學和社會學中的問題。1866年,揭示了遺傳的基本規律,這是最早運用數理統計於生物實驗的一個成功的範例(見)。1889年,在《自然的遺傳》一書中,通過對人體身高的研究指出,子代的身高不僅與親代的身高相關,而且有向平均值“回歸”的趨勢,由此提出了“回歸”和“相關”的概念和算法,從而奠定了生物統計的基礎。高爾頓的學生K.皮爾遜進一步把統計學應用於生物研究,提出了實際測定數與理論預期數之間的偏離度指數即卡方差()的概念和算法,這在屬性的統計分析上起了重要作用。1899年,

pic-info">生物統計

他創辦了《生物統計》雜志,還建立了一所數理統計學校。他的學生W.S.戈塞特對樣本標準差作了許多研究,並於1908年以“Student”的筆名將t-檢驗法發表於《生物統計》雜志上。此後,t-檢驗法就成了生物統計學中的基本工具之一。英國數學家指出,只注意事後的數據分析是不夠的,事先必須作好實驗設計。他使實驗設計成了生物統計的一個分支。他的學生G.W.斯奈迪格把變異來源不同的均方比值稱爲F值,並指出當值大於理論上 5%概率水準的值時,該項變異來源的必然性效應就從偶然性變量中分析出來了,這就是“方差分析法”。上述這些方法對於農業科學、生物學特別是的研究,起了重大的推動作用,20世紀20年代以來,各種數理統計方法陸續創立,它們在實驗室、田間、飼養和臨牀實驗中得到廣泛應用並日益擴大到整個工業界。70年代,隨着計算機的普及,使本來由於計算量過大而不得不放棄的統計方法又獲得了新的生命力,應用更爲廣泛,並在現代科技中佔有十分重要的地位。個體與總體參數
  一個觀測對象(如一個7歲男孩)的某些性狀(如身高等)的量度結果,稱爲一個個體。來源相同的各個個體(如各個 7歲男孩的身高值)之間的差異稱爲個體變異。總體是通過統計所欲了解的對象,其中的個體可以是有限的也可以是無限的。觀測數據可以是計數的(離散的)(如單位面積中的昆蟲數),也可以是計量的(如身高、體重、血壓、肺活量等)。總體最基本的參數有兩類:表示水平的稱爲位置參數或型值,如平均數中位數、率等;反映個體差異大小的稱爲分散度參數,如標準差極差等。總體參數是一個客觀存在但通常卻又是未知的常數。只能用樣本去估計它。這樣做自然會有誤差。

pic-info">生物統計

樣本平均數,即
  [1432-01]其中表示第 個個體的觀測值;爲樣本中的個體數,稱爲樣本大小;∑爲求和號,∑表示的合計凡是從樣本計算出來的數值都稱爲計量,它是對相應的總體值的一種估計例如是總體均數 的一種估計。若總體均數正好等於,則稱爲 的無偏估計,意謂用估計雖有誤差但平均來說是無偏的。此時又稱 爲 的期望,記作[1432-02]。率
  反映事物或現象出現的機會或頻度,常用百分率或小數表示。如:感染率、死亡率、男嬰率等。若以代表陽性率,則陰性率=1-。若將男嬰記作=1,女嬰記作=0,則個嬰兒的性別指標的均數=(∑/=就是男嬰率。可見,率可以看成是個體取值爲1或0的計數數據的均數。這種樣本的率也是對應的總體率的無偏估計。總體的率又稱爲概率
  中位數 是數據按大小排列後位於中央的數值。對於分布不對稱的指標(如機體內、外環境中的有害物質濃度等)往往會有少數特大值,此時,中位數比均數更具代表性,也更穩定。當爲偶數時,則取中央兩數的均數。
  衆數 即最常出現的數值。如正常妊娠天數的衆數爲280天。
  極差 即最大值與最小值之差。是用於表示數據分散度的簡單指標
  方差 比極差更全面地反映個體差異的大小。若總體中有個個體,則總體的方差爲
  [1432-05] (2)樣本方差 [1432-06] (3)是總體方差的無偏估計。若(3)式的分母改用,就不是無偏估計。-1是自由度:樣本中有個獨立的觀測指標,它們都是隨機變量,它們對於總體均數的離差平方和∑(-),是個獨立隨機變量之和,稱爲有個自由度;而(3)式中的∑(-),是用代替了,等於對個的值加了一個限制,即∑必須等於,換言之,∑(-)只相當於-1個獨立的隨機變量之和,所以它只有-1個自由度。一般地說,對計量每加上一種限制就用去了一個自由度。爲了運算上的方便,離均差平方和有時也記作:
  [1432-09] (4)
  標準差 是方差的平方根。它和觀測值有相同的單位。是最常用的表示數據分散程度的指標。對於正態分布的數據,它的用處尤大。樣本標準差是對總體標準差的一種估計。的值可在有統計功能的計算器上直接得出。計算值的功能鍵常用[on]表示。
  變異系數 即
  [1432-9a] (5)它是不受單位影響的量,可用於比較兩種單位不同的指標(如生物體的長度與重量)的個體變異大小。例如,三只小白鼠的體重=22,24,27(克)。它們的均數
  =(22+24+27)/3=24.3(克)[1432-11]標準差 [1432-21]變異系數 [1432-13]極差 Δ=27-22=5(克)。中位數是24克。
  概率 表示客觀事物可能發生的程度。它是實際觀察到的率(如男嬰率)的總體均值期望值。它的通用符號是。常用小數或分數表示其大小。例如用0≤≤1表示概率的取值範圍爲0~1:假定(男嬰)=22/43=0.512表示生男嬰的概率爲22/43或0.512,即略大於1/2。這一理論值是根據反復多次的大樣本統計結果歸納出來的。概率可以從量的方面來說明總體的性質。所謂“小概率事件”是指實際上不大可能發生的事件。
  爲充分地了解一個總體,就須知道個體的取值範圍,以及出現的各種可能值的概率,即概率分布,簡稱分布。
  正態分布 一種理想的對稱型分布。有些生物學指標遠非正態分布,而是呈左右不對稱的所謂偏態,但當樣本增大時,它們的均數卻趨向正態分布。這一性質有重要的實用價值
  直方圖 一種根據頻數表繪制的圖,它以橫軸上的長方形的面積表示各組的頻數,長方形在橫軸上的邊長相當於組距(圖1[1000名20歲男生的身高])。
  如果一步步地縮小直方圖的組距,同時增大樣本含量,最終將要趨於圖2[正態分布]那樣的極限。在圖2中,曲线以下橫軸以上的面積表示概率,這種曲线稱爲“(概率)分布曲线”。
  正態分布具有以下性質:以總體均數爲中心,在中心處的分布曲线最高;兩側與 距離相等的對稱區間的上方有相同的面積(概率);與 相距愈遠的區間的概率愈小;可以用與(總體標準差)這兩個參數來描述整個分布(圖3[標準差正態分布曲线])只要知道了 和,則個體落入任何區間的概率均可從(統計學書上)事先算好的正態分布表中查得。表1 [標準正態分布尾部概率簡表]是這種表的一個摘要。
  標準正態分布 凡是正態分布的數據,均可通過減去均數並除以標準差而使之成爲均數爲0、標準差爲1的標準正態分布。經過這種變換的指標記爲,
  [1433-11] (6) 遵從均數爲 標準差爲的正態分布,通常以簡單的符號來表示:~( ,)。故可用~(0,1)表示“遵從標準正態分布”。這種分布很常用,尤其是表1所列幾個界限值。
  當樣本含量增大時,不論原始數據是不是正態分布,它的大多數統計指標均趨向正態分布,從而可以進一步化爲標準正態分布,再根據 的界值來作出推斷(表1[標準正態分布尾部概率簡表])。
  正常範圍 生物界的正常範圍常用於診斷、鑑別和分類。制定正常範圍需要一些先決條件:原始數據必須來自同一總體;樣本對總體的代表性要好;儀器、試劑和方法都沒有偏性。理想的界限應有較高的靈敏度與特異度。前者是對異常者的識別率=1-假陽性率;後者是對正常者的識別率=1-假陰性率。當尚未掌握異常者的情況時,可暫將特異度定在0.95(即95%的正常者爲此範圍所覆蓋)的水平;待掌握了異常者的數據分布後,再酌情修改界限以便兼顧靈敏度與特異度這兩個方面。抽樣
  爲了估計總體的參數(如均數、率、標準差等)而從其中抽出一部分個體組成供分析的樣本稱爲抽樣抽樣方法應能防止主、客觀因素造成偏性(即系統誤差),保證樣本對總體的代表性。簡單隨機抽樣是以抽籤或相當於抽籤的方式從總體中抽取個體組成樣本。其要點是:總體中每個個體被抽中的機會必須均等。系統抽樣是將總體劃分爲時間或空間順序相等的個部分,再機械地取每一部分的第個個體組成樣本,是一次隨機抽定的。例如,欲抽查十分之一學生的成績,可從0到9這10個整數中隨機地抽定一個數,假設爲3,則凡學生證號最後一個數是 3者均爲被抽中的對象。分層抽樣是事先將總體分爲不同的層次(如地區、年齡、性別等),再分別從各層次中按適當比例抽樣。用此法可以從層間差異較大的總體中獲取代表性較好的樣本。整羣抽樣是以羣體爲單位進行抽樣,凡抽中的單位就全面調查。此法便於實施,但抽樣誤差較大,一般不可沿用基於簡單隨機抽樣的普通公式計算抽樣誤差。此外,還可以分階段地、混合地使用上述方法。如兩階段抽樣、多階段抽樣分層整羣抽樣、多階段等概率抽樣等。
  用樣本計量去估計總體參數難免會有抽樣誤差,它的大小與個體變異(標準差)的大小成正比;與樣本含量的平方根成反比。表示抽樣誤差大小的統計指標標準誤 [1434-01]或代以計量 [1434-02] (7)相當於將每一個樣本(設想有許多來自同一總體的樣本)的均數(或率)看成爲一個個體時的標準差,它反映了取自同一總體的不同樣本之間的差異(7)式適用於簡單隨機抽樣和系統抽樣。其他幾種抽樣方法的算式較繁。
  差異的顯著性 兩個或兩組數據相比,總會有或大或小的差異。問題是這種差異僅僅是抽樣誤差的反映呢還是由於它們來自不同的總體?即是否存在着實質性差異?用統計學的術語來說,就是要判斷數據間的差異是否“顯著”。用統計方法來推斷差異的性質稱爲差異的顯著性檢驗。顯著性檢驗的方法很多,基本步驟大體如下:先假定數據均來自同一總體,即假設要比較的數據並無實質性差異,稱爲零假設;根據原始數據計算因抽樣誤差而出現此種程度差異的概率;若甚小,則根據“小概率事件實際上不大可能發生”這一原理否定零假設,認爲“差異顯著”,即這種差異從統計學的角度來看是有意義的;反之,若不算小,就不否定零假設,認爲“差異不顯著”,即不能排除抽樣誤差範圍內的波動。正確地運用顯著性檢驗,可使實驗或調查的結論建立在更科學、穩妥的基礎之上,避免簡單化和絕對化。
  顯著性水準 概率的大小只能相對而言,在生物學數據的差異顯著性檢驗中,已習慣用=0.05爲小概率的上限。有時,爲嚴格起見,也規定=0.01。稱爲顯著性水準,它是當零假設正確時卻錯誤地將其否定(第Ⅰ類錯誤)的概率。但也不是 定得愈小愈好。倘若零假設是不對的卻未能否定,它(第Ⅱ類錯誤)的概率 將因規定得愈小而愈大。增大樣本可以減小出現第Ⅰ或第Ⅱ類錯誤的概率
  兩個計數數據的比較 最簡單的差異顯著性檢驗是比較按零假設系“來自同一總體”的兩個計數與。
  [1434-03] (8)服從標準正態分布。換言之,>1.96的概率<0.05(表1[標準正態分布尾部概率簡表])。
  例如,用“714”試治喘息型氣管炎,與用氨茶鹼進行比較:在每名患者身上交替使用這兩種藥各一療程。半數患者先服甲藥,另一半先服乙藥。結果16名患者用氨茶鹼效果較好(=16),5名用“714”較好(=5)。
  將上述結果代入(8)式
  [1434-03a]因>1.96,<0.05,故否定零假設,因此可以認爲兩藥的療效並不相同,即“714”的療效不及氨茶鹼。
  凡用標準正態分布計量進行的顯著性檢驗,均可稱爲檢驗。
  兩個均數的比較 也可用檢驗:
  [1434-04] (9)其中和分別表示第1個樣本的均值標準和含量,余類推。爲總體方差,通常是未知的,故常用右邊的近似式。當兩樣本的含量 +=<25時,(9)式的近似程度欠佳,最好用檢驗。
  檢驗是根據計量概率分布(稱爲分布,見表2[禾苗噴霧後淨增長度(cm)])而進行的顯著性檢驗。比較兩個均數時,
  [1434-05] (10)其中爲合並的方差,即
  [1434-06]
  [1434-07] (11)其中表示第1個樣本中的數據,表示第2個樣本中的數據,其余符號意義同前自由度=+-2用[tav]表示顯著性水準爲、自由度爲的臨界值,可從表 3中查得。若按(10)式算得的的絕對值大於[tav],則<,有顯著性差異。
  例如,在一塊小區田裏選20兜長勢均勻的禾苗作試驗,隨機抽取其中10兜噴以粗制“920”溶液,其余噴水作對照。三日後,測量禾苗淨增長度,結果如表2[禾苗噴霧後淨增長度(cm)]。
  由(11)式
  [1434-08]代入(10)式
  [1434-09]查表3[值表]值表" class=image>,當=0.01,=10+10-2=18,0.01,18=2.88;此例=4.55>2.88,<0.01,有顯著性差異。
  結論:粗制“920”有加速禾苗生長的作用。
  兩個率的比較 當樣本較大,以致兩個樣本的陽性數、陰性數都大於5時,可用檢驗:
  [1434-10] (12)、和,分別表示第1組的陽性率、陰性率和含量,余類推。若應用檢驗的上述條件不能滿足,可用近似程度較好的檢驗:
  [1434-11] (13)其中[p-1]=(1+1)(+2),1是第 1組的陽性數,[q-1]=1-[p-1],余類推。自由度=+-2。
  例如,甲組=23,其中兩個呈“+”反應,乙組=77,全爲“―”反應。現在來檢驗差異的顯著性。[p-1]=(2+1)/(23+2)=0.120,[q-1]=1-0.120=0.880;[p-2]=(0+1)/(77+2)=0.013,[q-2]=1-0.013=0.987。代入(13) 式得=1.65,=23+77-2=98,接近100,由表3[值表]值表" class=image>知[1435-33],>0.05,故無顯著性差異。
  置信限 由樣本估計總體,難免會有抽樣誤差,這就產生了計量的可信程度和可信範圍的問題。如果我們將計量(或)看成爲一個個體,的總體均數爲,標準差爲=/[1435-0];而且不論的分布是否正態,只要不是很小,就近似正態分布,亦即=(-)/近似標準正態分布。於是下式
  [1435-01] (14)成立的概率爲0.95。用代替其中的,稍作變換,即得由樣本計量 和來估計總體參數 的一個區間(範圍):
  [1435-02] (15)這一區間的實際計算值隨樣本而異,但它們覆蓋[u1]的機會──稱爲置信水準──是95%,所以稱(15)式爲95%置信區間,它的上、下限就是置信限。
  例如按表 4 [161名 7歲男孩身高的頻數分布]中數據可算出161名7歲男孩的身高均值=115.01(釐米),標準差=4.63,標準誤由(7)式得[1435-03]。由 (15)式得 7歲男孩身高總體均數 的95%置信限爲[114.95,115.73]。
  兩總體均數之差-的置信限可按下式計算:
  [1435-04] (16)式中符號意義同前當置信水準(1-)爲95%時,=0.05;=1+2-2;據此,從表2[禾苗噴霧後淨增長度(cm)]中即可查出[tav]的值。
  方差分析 也是基本的統計分析方法之一,較常用於分析實驗數據。用於檢驗多組均數間差異的顯著性和多因素的單獨效應與交互影響的顯著性等。基本思路:正態分布數據的變差,可分爲未能控制與未能解釋的“誤差”和來源明確與能夠解釋的“效應”這兩大部分。後者還可以進一步劃分成各種不同因素及其交互影響所引起的效應。
  按一個因素的不同水平分組的數據結構:
  觀測值=平均效應+該水平(組)效應+誤差 (17)當檢驗組數據間的差異顯著性時,零假設相當於“各組效應均爲零”;當零假設被否定時備選假設相當於“在種處理(水平)中至少有一種的效應不爲零”。
  一般用離均差平方和(記作)來衡量數據間的變異,再除以自由度()則稱爲均方,記作=/,它反映了平均的變異程度。設每組各有個數據,則組共有=個。它們的總變異[1435-05],表示第組的第個數據;各組之間的變異[1435-06],是第組的均數;組內變異(即誤差)[1435-07]。三者之間有以下關系: 
  =+ (18)它們的自由度也同樣可加:
  (-1)=(-1)+(-) (19)組間均方 =/(-1)與組內均方 =/(-)之比
  =/ (20)可用來檢驗組間差異的顯著性。的界值可從值表中查得。用於方差分析的軟件可以打印出包含 及相應的尾部概率值的表格(表6[表5中數據的方差分析表])。
  例如將 30名收縮壓在200毫米汞柱左右的高血壓患者隨機分爲3組,每組各用一種藥物,一個療程後測血壓,結果如表5[三組病人用藥後的血壓(mmHg)]。
  利用現成的計算機軟件打印的結果如表6[表5中數據的方差分析表]。表中<0.01,表明組間有顯著性差異。即自由變。
  按兩個因素分組的數據結構:
  觀測值=均數+行效應+列效應
  +交互影響+誤差 (21)其中“均數”指平均效應,行效應指按第1因素分組的組效應,列效應指按第2因素分組的組效應。交互影響的含義:當數據按兩個以上的因素分組時,如果這些因素的效應並不是彼此獨立的,即一個因素的效應隨另一因素的水平不同而異,則稱這兩個因素之間存在着交互影響。
  例如在三種病型的患者身上試用 4種藥物後的血壓改變如表7 [原始數據]所示。其中每個數據代表一個病人的用藥結果。
  表8[方差分析表]是計算機給出的結果。
  從 值可以看出:三種病型之間無顯著性差異;藥物間有顯著性差異;藥物與病型的交互影響無顯著性。“均數”除非來源於配對數據之差或兩均數之差,一般都是有顯著性的,即不爲零。
  只有進行了重復實驗,即兩因素的各種不同水平的搭配均有兩個以上數據,才有可能算出交互影響項的變異。這是在設計時應該想到的。
  上述內容不難推廣到三個以上因素的方差分析。
  理論的驗證──檢驗 生物科學注重實驗、調查。歸納得來的理論、演繹得來的假說,還須經過實踐來驗證。由於個體差異大是生物學數據的固有特點,所以這種驗證也只能是統計的。計量
  是 個獨立標準正態分布計量的平方和,它的分布與自由度V有關(表9[表]表" class=image>,圖4[分布]分布" class=image>)。在生物學研究中用處很大,常用於衡量某種理論與實際計數的吻合性,或按兩種指標分組的列聯表的獨立性。實際觀察到的分配在表中每個小格裏的計數數據,可以假定是服從泊松分布規律的數據──它的特點是方差等於平均數,且當樣本不很小時,近似於正態分布。由此可以理解下列這個常用的基本公式。
  =[1436-01] (22)其中的理論數可按欲檢驗的生物學理論或零假設計算,自由度 =中蕴含獨立計量的個數。對於普通的只有一行格的單向表──1×表,因受合計的約束,
  V=-1而雙向的有行列的×表,則因受行合計與列合計的約束,
  =(-1)(-1)對計算結果的分析可參照差異的顯著性檢驗。
  例如番茄的真實紫莖、缺刻葉植株AACC與真實綠莖、馬鈴薯葉植株aacc雜交,子2代得如下結果(株數):紫莖缺刻葉 紫莖馬鈴薯葉 綠莖缺刻葉 綠莖馬鈴薯葉
  247 90 83 34上述觀察頻數是否與遺傳學的獨立分配定律的理論比例:9:3:3:1相符,可用分布來衡量實驗觀察結果與理論頻數之間的吻合度。將上述理論比例改爲構成比即:
  [1436-02]或0.5625:0.1875:0.1875:0.0625子2代總株數爲247+90+83+34=454;理論頻數是總株數與構成比的乘積,故得255.375:85.125:85.125:28.375,代入(22)式:
  =[1437-01]自由度=4-1=3,查表9[表]表" class=image>,[x053]=2.37>1.72,故>0.5,高度吻合。衡量吻合度不能用小樣。列聯表
  即按兩種指標分成行列的所謂×表,常用於衡量指標間的聯系或獨立性,爲此亦可用(22)式。
  例如根據表10[白血病人按病型與血型分組]中數據分析血型與白血病病型間有無聯系。零假設是“二者沒有聯系”。括號中數據是根據零假設計算的理論頻數=行合計×列合計÷總計。代入(22)式得=1.84,=行數-1×列數-1=(2-1)×(4-1)=3。查表3,[x053]=2.37>1.84,>0.5,故不能否定零假設。即不能認爲血型與白血病病型有聯系。
  回歸與相關 用來建立或明確兩種指標之間的關系的統計技術。前者可用於分析一個變量受另一變量影響的程度;後者則用於分析兩個對稱或“平等”的指標之間的關聯程度。
  直线回歸是用簡單的直线方程=+來擬合依變量(表示它的估計值)受自變量影響的情形。式中的與可以在有回歸功能鍵的計算器上直接得出,但需按說明書將成對的觀測數據(,)輸入。計算程序的原理在於使 [1437-02]極小化。若自變量不止一個,則有=+++…,稱爲多元回歸,可用於預測、判別與指標的綜合等。一般的微電腦常有計算多元回歸系數等的程序。
  直线相關系數=/(其中爲回歸系數,、分別爲與的標準差),其絕對值反映兩個指標相關的程度。的取值範圍是-1到+1它也可以在計算器上直接得出。
  概率單位分析法 主要用於處理生物對化學或物理刺激的反應曲线。是一種以劑量的對數爲自變量,以反應率的概率單位爲依變量,從而使S型曲线直线化而便於分析的一種方法,可用於測定藥物、毒物或物理因素對機體作用的強度和分析它們的聯合作用。無分布法
  大多數統計分析方法都建立在“數據爲正態分布”這一基本假定之上,而許多生物學數據遠非正態分布,採用無分布法可以繞過這一困難。這類方法往往比較直觀,而且計算簡便。有時,一部分(或全部)觀測結果並不能直接用數據表示,只能用反映大小或程度的等級或秩次表示。例如,觀測結果是“-”,“±”,“+”及“++”以上,排序後的等級便是1,2,3,4……許多很有效的無分布法就是基於數據或觀測結果的大小順序的。由於無分布法通常並不涉及數據分布的參數(如平均數),所以有時也稱爲非參數方法。生存分析
  許多生物現象的動態觀察結果都比一次性的橫斷面觀察更能說明問題。例如:惡性腫瘤患者接受手術治療的效果,要看他們術後經過一段時間的生存率,或者有必要描繪出在不同條件下的生存率曲线(以時間爲橫軸,生存率爲縱軸),以便進行分析與比較;器官移植的效果,要看異體器官在體內正常工作和不被排斥的時間等。生存分析的用途是廣泛的。多元分析
  又稱多指標或多變量分析,是對多個觀測指標同時進行綜合性分析,所以比普通的一元統計分析更爲全面、有效。這是40年代就已出現的一系列好方法。由於涉及較深的數學知識和很復雜的計算,妨礙了它們的普及,隨着計算機和統計軟件包的日益完善,預料多元分析不久將會成爲生物科學研究的常規武器。多重回歸是指多個自變量和一個因變量的回歸;而多元回歸是指不止一個因變量的回歸。但二者常被混淆使用。它們可用於預測指標的綜合或自變量的篩選。判別分析是利用形如多重回歸方程的判別函數來進行個體種類的判斷或診斷。聚類分析是將許多個體或指標按它們的相似程度來歸類。對個體進行聚類稱爲Q型聚類;對指標進行聚類稱爲R型聚類。Q型聚類和判別分析是數量分類學的兩種基本方法。趨勢面是以地理上的經、緯度爲自變量的高次方程,可用於繪制研究對象在地理上的分布密度的等高线圖,亦可用於預測。主成分分析的目的在於將許多彼此相關指標變換成少數幾個彼此獨立的綜合指標,而且它們包含了原來那些指標的幾乎全部統計信息。因子分析的計算程序與主成分分析類似,但它不是研究指標的變換,而是分析個體間的內在聯系,此法爲心理學家所首創,也可用於研究復雜的疾病。統計模型
  幾乎所有的統計方法都有一個數學模型作爲背景。除了上述方法之外,在生物科學研究中用處較大的還有:捉放捉模型,用於個體總數的估計;對數线性模型,用於多維列聯表(即按多個指標分組的計數資料)的分析;Logit模型,既可用來同時排除多個混雜因素的影響,又可用於處理定量的混雜變量與危險因子。如果所有指標都是定性的,Logit模型就成了對數线性模型的一個特例。

熱門資訊更多