統計分組
1、統計分組體系
統計分組後所形成的一系列互相聯系、互相補充的組的整體稱分組體系。分組體系有平行分組體系和復合分組體系兩種。平行分組體系是選擇兩個或兩個以上的標志對總體進行一次次簡單分組後所形成的體系;復合分組體系就是復合分組後形成的體系。
2、分組標志的選擇
分組標志的選擇是統計分組的關鍵。分組標志,即將同質總體區分爲不同組的標準或依據。分組標志一旦選定,就必然突出了總體在該標志下的性質差別,其他的差別看不見了。分組標志選擇不當,不但無法顯示現象的根本特徵,甚至會混淆事物的性質,歪曲社會經濟的真實情況。
正確選擇分組標志,必須根據統計研究的任務目的,抓住反映現象本質區別和內在聯系的標志作爲分組標志。
類型分組的目的是劃分經濟類型,結構分類的目的是研究同質總體的構成,分析分組的目的是研究現象總體內部諸標志間的依從和制約關系。
2、按分組標志的多少,分爲簡單分組和復合分組。
簡單分組是將總體按一個標志進行分組,復合分組是將總體按兩個或兩個以上的標志重疊起來進行分組。
3、按分組標志的性質分爲品質分組和變量分組。
品質分組是將總體按品質標志進行分組,如企業按經濟成份、地理位置分組,職工按性別、文化程度分組等;變量分組是將總體按數量標志進行分組,如企業按職工人數、勞動生產率分組,職工按工齡、工資分組等。
統計分組的基本作用有:
1、劃分社會經濟類型。統計分組是確定社會經濟現象各種類型的基礎,例如將工業企業按所有制的不同、按輕重工業劃分,居民按城鎮、農村劃分,從而說明不同的經濟類型的特點。一般來說,社會經濟類型的分組多採用品質標志來劃分。
工人數(萬人) | 比重(%)工資總額(億元)比重(%)||||
---|---|---|---|---|
國有經濟單位 | 10765.9 | 73.40 | 7211.0 | 76.67 |
集體經濟單位 | 2817.0 | 19.2 | 1253.4 | 13.33 |
聯營經濟單位 | 42.6 | 0.29 | 30.0 | 0.33 |
股份制經濟單位 | 460.1 | 3.14 | 350.9 | 3.73 |
外商投資經濟單位 | 290.4 | 1.98 | 293.4 | 3.12 |
港澳臺投資經濟單位 | 274.8 | 1.87 | 253.4 | 2.69 |
其他經濟單位 | 17.5 | 0.12 | 12.2 | 0.13 |
合計 | 14668.3 | 100.0 | 9405.2 | 100.0 |
2、研究總體內部的結構。通過統計分組可以反映總體內部各部分之間的差別和相互關系,表明總體的內部結構。同時在各組的基礎上計算各組所佔總體的比重,從總體的構成上認識總體各部分的作用,並對總體作出正確的評價。
1987年 | 1997年||||
---|---|---|---|---|
從業人員數(萬人) | 比重(%) | 從業人員數(萬人) | 比重(%) | |
第一產業 | 31663 | 60.0 | 34730 | 49.9 |
第二產業 | 11726 | 22.2 | 16495 | 23.7 |
第三產業 | 9395 | 17.8 | 18375 | 26.4 |
合計 | 52784 | 100.0 | 69600 | 100.0 |
從表中可以看出 1987年~1997年從業人員的分布情況,通過分組表明了從業人員在三次產業中的分布,也顯示了人員在三次產業中的結構比重,說明這10年間中國的產業結構發生了很大的變化。
3、分析現象之間的依存關系。社會經濟現象之間存在着相互制約、相互聯系的關系,通過統計分組可以根據現象間的影響因素和結果因素的對應更好地揭示現象之間的這種依存關系。
統計分組根據分組標志的性質,分爲按品質標志分組和按數量標志分組。
品質標志上是說明事物的性質或屬性特徵的,它反映的是總體單位在性質上的差異,它不能用數值來表現。數量標志是直接反映事物的數量特徵的,它反映的是事物在數量上的差異。如人口的年齡、企業的產值等。統計分組方法就是指這兩種標志的具體分組方法。
1、品質標志分組方法
品質標志分組一般較簡單,分組標志一旦確定,組數、組名、組與組之間的界限也就確定。有些復雜的品質標志分組可根據統一規定的劃分標準和分類目錄進行。
2、數量標質分組方法
按數量標志分組的目的並不是單純確定各組在數量上的差別,而是要通過數量上的變化來區分各組的不同類型和性質。數量標志分組方法從以下幾個方面來說明:
對離散變量,如果變量值的變動幅度小,就可以一個變量值對應一組,稱單項式分組。如居民家庭按兒童數或人口數分組,均可採用單項式分組。
離散變量如果變量值的變動幅度很大,變量值的個數很多,則把整個變量值依次劃分爲幾個區間,各個變量值則按其大小確定所歸並的區間,區間的距離稱爲組距,這樣的分組稱爲組距式分組。
也就是說,離散變量根據情況既可用單項式分組,也可用組距式分組。在組距式分組中,相鄰組既可以有確定的上下限,也可將相鄰組的組限重疊。
連續變量由於不能一一列舉其變量值,只能採用組距式的分組方式,且相鄰的組限必須重疊。如以總產值、商品銷售額、勞動生產率、工資等爲標志進行分組,就只能是相鄰組限重疊的組距式分組。
在相鄰組組限重疊的組距式分組中,若某單位的標志值正好等於相鄰兩組的上下限的數值時,一般把此值歸並到作爲下限的那一組(適用於連續變量和離散變量)。
組距式分組使資料的真實性受到一定程度的損害。組距式分組的假定條件是:變量在各組內的分布都是均勻的(即各組標志值呈线性變化)。
通過組距式分組以後,把各組內部各單位的次要差異抽象去了,而把各組之間的主要差異突出出來,這樣,各組分配的規律性可以更容易顯示出來。根據這個道理,如組距太小,分組過細,容易將屬於同類的單位劃分到不同的組,因而顯示不出現象類型的特點;但如果組距太大,組數太少,會把不同性質的單位歸並到同一組中,失去區分事物的界限,達不到正確反映客觀事實的目的。因此,組距的大小、組數的確定應根據研究對象的經濟內容和標志值的分散程度等因素,不可強求一致。
2)等距分組和不等距分組
等距分組是各組保持相等的組距,也就是說各組標志值的變動都限於相同的範圍。不等距分組即各組組距不相等的分組。
統計分組時採用等距分組還是不等距分組,取決於研究對象的性質特點。在標志值變動比較均勻的情況下宜採用等距分組。等距分組便於各組單位數和標志值直接比較,也便於計算各項綜合指標。在標志值變動很不均勻的情況下宜採用不等距分組。不等距分組有時更能說明現象的本質特徵。
組距兩端的數值稱組限。其中,每組的起點數值稱爲下限,每組的終點數值稱爲上限。上限和下限的差稱組距,表示各組標志值變動的範圍。
組中值是上下限之間的中點數值,以代表各組標志值的一般水平。組中值並不是各組標志值的平均數,各組標志數的平均數在統計分組後很難計算出來,就常以組中值近似代替。組中值僅存在於組距式分組數列中,單項式分組中不存在組中值。
組中值的計算是有假定條件的,即假定各組標志值的變化是均勻的(與組距式分組的假定條件相同)。一般情況下,組中值=(上限+下限)÷2
對於第一組是 “多少以下”,最後一組是“多少以上”的开口組,組中值的計算可參照鄰組的組距來決定。即:缺下限开口組組中值=上限—1/2鄰組組距,缺上限开口組組中值=下限+1/2鄰組組距。 [1]