①組數(shù)與組距
編制組距數(shù)列,必須對(duì)總體進(jìn)行分組,針對(duì)一個(gè)總體,應(yīng)將其分為多少組,這要根據(jù)研究的目的來確定,同時(shí)要本著以能簡單明了地反映問題為原則。如果組數(shù)過多,必然會(huì)造成總體單位分布分散,同時(shí)還有可能把屬于同類的單位歸到不同的組中,不能真實(shí)反映出事物的本質(zhì)特點(diǎn)和規(guī)律性;如果組數(shù)過少,又會(huì)造成把不同性質(zhì)的單位歸到同一個(gè)組內(nèi),失去區(qū)別事物的界限,達(dá)不到正確反映客觀事實(shí)的目的。因此,必須恰當(dāng)?shù)卮_定組數(shù)。美國學(xué)者斯特奇斯(HASturges)提出,在總體各單位標(biāo)志值分布趨于正態(tài)的情況下,可根據(jù)總體單位數(shù)(N)來確定應(yīng)分組數(shù)(n),公式為:
n=1+3.322lgN
上式可供分組時(shí)參考,但也不能生搬硬套。當(dāng)總體單位數(shù)過少時(shí),按上述公式計(jì)算的組數(shù)可能偏多;而當(dāng)總體單位數(shù)很多時(shí),計(jì)算的組數(shù)又可能偏少。
確定組數(shù)后,還應(yīng)確定組距。組數(shù)和組距之間存在著密切關(guān)系。在全距(變量值與最小變量值之差)一定的情況下,組距的大小和標(biāo)志變量數(shù)列的全距大小成正比變化,與組數(shù)多少成反比變化。
組數(shù)越多,組距越小;組數(shù)越少,組距越大。由于組距數(shù)列有等距數(shù)列與異距數(shù)列之分,在采用等距分組的情況下,變量數(shù)列編制的組距(d)可采用下列公式確定:

②組限與組中值
組距數(shù)列中,每個(gè)組都有兩個(gè)端點(diǎn),這兩個(gè)端點(diǎn)稱為組限。數(shù)值小的端點(diǎn)稱為組的下限,數(shù)值大的端點(diǎn)稱為組的上限。
若一組內(nèi)有上限缺下限,或有下限缺上限稱為開口組;
若一組內(nèi)的上限、下限都齊全稱為閉口組。
組距數(shù)列掩蓋了組內(nèi)各單位的實(shí)際變量值,通常用組中值近似地代替每組變量值的一般水平。

注意:用組中值來代表各組的一般水平時(shí),變量值在該組應(yīng)呈均勻分布,或在組中值兩側(cè)呈對(duì)稱分布,否則,用組中值作為一組的代表值會(huì)有一定的誤差。
例如:某公司20個(gè)售貨小組的銷售額分布數(shù)列如下表
表2-1 某公司20個(gè)售貨小組的銷售額分布數(shù)列
銷售額/萬元
組中值/萬元
頻數(shù)
100以下
100~200
200~300
300~400
400以上
50
150
250
350
450
2
4
8
5
1
合計(jì)
-
20
表中最上面和最下面的組為開口組,中間為閉口組。組距為100,對(duì)于表中第一組數(shù)據(jù)而言,只有上限沒有下限,故組中值=100(上限)-100/2=50(萬元),
最下面一組數(shù)據(jù)只有下限沒有上限,故組中值=400(下限)+100/2=450(萬元)
編制組距數(shù)列,必須對(duì)總體進(jìn)行分組,針對(duì)一個(gè)總體,應(yīng)將其分為多少組,這要根據(jù)研究的目的來確定,同時(shí)要本著以能簡單明了地反映問題為原則。如果組數(shù)過多,必然會(huì)造成總體單位分布分散,同時(shí)還有可能把屬于同類的單位歸到不同的組中,不能真實(shí)反映出事物的本質(zhì)特點(diǎn)和規(guī)律性;如果組數(shù)過少,又會(huì)造成把不同性質(zhì)的單位歸到同一個(gè)組內(nèi),失去區(qū)別事物的界限,達(dá)不到正確反映客觀事實(shí)的目的。因此,必須恰當(dāng)?shù)卮_定組數(shù)。美國學(xué)者斯特奇斯(HASturges)提出,在總體各單位標(biāo)志值分布趨于正態(tài)的情況下,可根據(jù)總體單位數(shù)(N)來確定應(yīng)分組數(shù)(n),公式為:
n=1+3.322lgN
上式可供分組時(shí)參考,但也不能生搬硬套。當(dāng)總體單位數(shù)過少時(shí),按上述公式計(jì)算的組數(shù)可能偏多;而當(dāng)總體單位數(shù)很多時(shí),計(jì)算的組數(shù)又可能偏少。
確定組數(shù)后,還應(yīng)確定組距。組數(shù)和組距之間存在著密切關(guān)系。在全距(變量值與最小變量值之差)一定的情況下,組距的大小和標(biāo)志變量數(shù)列的全距大小成正比變化,與組數(shù)多少成反比變化。
組數(shù)越多,組距越小;組數(shù)越少,組距越大。由于組距數(shù)列有等距數(shù)列與異距數(shù)列之分,在采用等距分組的情況下,變量數(shù)列編制的組距(d)可采用下列公式確定:

②組限與組中值
組距數(shù)列中,每個(gè)組都有兩個(gè)端點(diǎn),這兩個(gè)端點(diǎn)稱為組限。數(shù)值小的端點(diǎn)稱為組的下限,數(shù)值大的端點(diǎn)稱為組的上限。
若一組內(nèi)有上限缺下限,或有下限缺上限稱為開口組;
若一組內(nèi)的上限、下限都齊全稱為閉口組。
組距數(shù)列掩蓋了組內(nèi)各單位的實(shí)際變量值,通常用組中值近似地代替每組變量值的一般水平。

注意:用組中值來代表各組的一般水平時(shí),變量值在該組應(yīng)呈均勻分布,或在組中值兩側(cè)呈對(duì)稱分布,否則,用組中值作為一組的代表值會(huì)有一定的誤差。
例如:某公司20個(gè)售貨小組的銷售額分布數(shù)列如下表
表2-1 某公司20個(gè)售貨小組的銷售額分布數(shù)列
銷售額/萬元
組中值/萬元
頻數(shù)
100以下
100~200
200~300
300~400
400以上
50
150
250
350
450
2
4
8
5
1
合計(jì)
-
20
表中最上面和最下面的組為開口組,中間為閉口組。組距為100,對(duì)于表中第一組數(shù)據(jù)而言,只有上限沒有下限,故組中值=100(上限)-100/2=50(萬元),
最下面一組數(shù)據(jù)只有下限沒有上限,故組中值=400(下限)+100/2=450(萬元)