2010年統(tǒng)計(jì)師考試統(tǒng)計(jì)基礎(chǔ)理論輔導(dǎo):統(tǒng)計(jì)整理(3)

字號(hào):

①組數(shù)與組距
    編制組距數(shù)列,必須對(duì)總體進(jìn)行分組,針對(duì)一個(gè)總體,應(yīng)將其分為多少組,這要根據(jù)研究的目的來確定,同時(shí)要本著以能簡單明了地反映問題為原則。如果組數(shù)過多,必然會(huì)造成總體單位分布分散,同時(shí)還有可能把屬于同類的單位歸到不同的組中,不能真實(shí)反映出事物的本質(zhì)特點(diǎn)和規(guī)律性;如果組數(shù)過少,又會(huì)造成把不同性質(zhì)的單位歸到同一個(gè)組內(nèi),失去區(qū)別事物的界限,達(dá)不到正確反映客觀事實(shí)的目的。因此,必須恰當(dāng)?shù)卮_定組數(shù)。美國學(xué)者斯特奇斯(HASturges)提出,在總體各單位標(biāo)志值分布趨于正態(tài)的情況下,可根據(jù)總體單位數(shù)(N)來確定應(yīng)分組數(shù)(n),公式為:
    n=1+3.322lgN
    上式可供分組時(shí)參考,但也不能生搬硬套。當(dāng)總體單位數(shù)過少時(shí),按上述公式計(jì)算的組數(shù)可能偏多;而當(dāng)總體單位數(shù)很多時(shí),計(jì)算的組數(shù)又可能偏少。
    確定組數(shù)后,還應(yīng)確定組距。組數(shù)和組距之間存在著密切關(guān)系。在全距(變量值與最小變量值之差)一定的情況下,組距的大小和標(biāo)志變量數(shù)列的全距大小成正比變化,與組數(shù)多少成反比變化。
    組數(shù)越多,組距越小;組數(shù)越少,組距越大。由于組距數(shù)列有等距數(shù)列與異距數(shù)列之分,在采用等距分組的情況下,變量數(shù)列編制的組距(d)可采用下列公式確定:
    
    ②組限與組中值
    組距數(shù)列中,每個(gè)組都有兩個(gè)端點(diǎn),這兩個(gè)端點(diǎn)稱為組限。數(shù)值小的端點(diǎn)稱為組的下限,數(shù)值大的端點(diǎn)稱為組的上限。
    若一組內(nèi)有上限缺下限,或有下限缺上限稱為開口組;
    若一組內(nèi)的上限、下限都齊全稱為閉口組。
    組距數(shù)列掩蓋了組內(nèi)各單位的實(shí)際變量值,通常用組中值近似地代替每組變量值的一般水平。
    
    注意:用組中值來代表各組的一般水平時(shí),變量值在該組應(yīng)呈均勻分布,或在組中值兩側(cè)呈對(duì)稱分布,否則,用組中值作為一組的代表值會(huì)有一定的誤差。
    例如:某公司20個(gè)售貨小組的銷售額分布數(shù)列如下表
    表2-1 某公司20個(gè)售貨小組的銷售額分布數(shù)列
    銷售額/萬元
     組中值/萬元
     頻數(shù)
    100以下
    100~200
    200~300
    300~400
    400以上
     50
    150
    250
    350
    450
     2
    4
    8
    5
    1
    合計(jì)
     -
     20
    表中最上面和最下面的組為開口組,中間為閉口組。組距為100,對(duì)于表中第一組數(shù)據(jù)而言,只有上限沒有下限,故組中值=100(上限)-100/2=50(萬元),
    最下面一組數(shù)據(jù)只有下限沒有上限,故組中值=400(下限)+100/2=450(萬元)