第二節(jié)、數(shù)值型數(shù)據(jù)的整理與顯示
學(xué)習(xí)要求:
1.掌握數(shù)據(jù)分組的方法
2.掌握組中值的作用和計(jì)算方法
3.掌握數(shù)據(jù)分組的具體步驟
4.掌握直方圖與條形圖的區(qū)別
具體內(nèi)容:
(一)數(shù)據(jù)的分組
1.數(shù)據(jù)分組的含義:
數(shù)據(jù)分組是根據(jù)統(tǒng)計(jì)研究的需要,將數(shù)據(jù)按照某種標(biāo)準(zhǔn)劃分成不同的組別。分組后再計(jì)算出各組中出現(xiàn)的次數(shù)或頻數(shù),形成一張頻數(shù)分布表。
2.數(shù)據(jù)分組的方法
分組的方法有單變量值分組和組距分組兩種。
(1)單變量值分組是把每一個(gè)變量值作為一組,這種分組方法通常只適合于離散變量且變量較少的情況。
(2)組距分組是將全部的變量值,劃分為若干個(gè)不同的區(qū)間。適合于連續(xù)變量或變量值較多的情況。
采用組距分組需要經(jīng)過以下幾個(gè)步驟:
第一步,確定分組的組數(shù)
確定分組組數(shù)時(shí)的要求:
①劃分的組數(shù)既不應(yīng)太多也不應(yīng)太少
②組數(shù)的確定,要盡量保證組間資料的差異性與組內(nèi)資料的同質(zhì)性;
③采用的分組辦法,要能夠充分顯示客觀現(xiàn)象本身存在的狀態(tài)。
第二步,對(duì)原始資料進(jìn)行排序。
第三步,求極差。
極差值=大觀察值-小觀察值
第四步,確定各組組距。

根據(jù)上式計(jì)算出來的組距,可能帶有小數(shù),為了編表和計(jì)算方便,也是審美習(xí)慣使然,好把它取成接近于5除盡的一個(gè)數(shù)。
組距與組數(shù)成反比例關(guān)系,組數(shù)越多,組距越小,組數(shù)越少,組距越大。
②組距是每組觀察值的大差,即每組的上限值與下限值之間的差。用公式表示就是:
組距=某組上限值-該組下限值
或:某組上限值=該組下限值+組距
某組下限值=該組上限值-組距
第五步,確定組限。
組限是組與組之間的界限,或者是每組觀察值的變化范圍。
一個(gè)組的小值稱為下限;大值稱為上限。
上限值與下限值的差值稱為組距
上限值與下限值的平均數(shù)稱為組中值。即:

確定組應(yīng)注意:
①第一組的下限值應(yīng)比小的觀察值小一點(diǎn),后一組的上限值應(yīng)比大的觀察值大一點(diǎn)。
②特別需要或不得已的情況除外,好不要使用開口組。
③ 組限應(yīng)取得美觀些,按數(shù)字編好,組限值應(yīng)能被5除盡,且一般要用整數(shù)表示。
第六步 確定各組觀察值出現(xiàn)的頻數(shù)
為解決“不重”的問題,統(tǒng)計(jì)分組時(shí)習(xí)慣上規(guī)定“上組限不在內(nèi)”,即當(dāng)相鄰兩組的上下限重疊時(shí),恰好等于某一組上限的觀察值不算在本組內(nèi),而計(jì)算在下一組內(nèi)。
第七步,制作頻數(shù)分布表。
二)數(shù)值型數(shù)據(jù)的圖示
1.直方圖
直方圖是用矩形的寬度和高度來表示頻數(shù)分布的圖形。
直方圖中,實(shí)際上用矩形的面積表示各組的頻數(shù)分布。
直方圖與條形圖不同:
www.examw.com (1)條形圖是用條形的長(zhǎng)度(橫置時(shí))表示各類別頻數(shù)的多少,其寬度(表示類別是)則是固定的;直方圖是用面積表示各組頻數(shù)的多少,矩形的高度表示每一組的頻數(shù)或百分比,寬度則表示各組的組距,因此其高度與寬度均有意義。
(2)由于分組數(shù)據(jù)具有連續(xù)性,直方圖的各矩形通常是連續(xù)排列,而條形圖則是分開排列。
2.折線圖(也稱為頻數(shù)多邊形圖)
折線圖也稱頻數(shù)多邊形圖,它是在直方圖的基礎(chǔ)上,把直方圖頂部的中點(diǎn)用直線連接起來,再把原來的直方圖抹掉就是折線圖。
【例題10:2004年單選題】一批數(shù)據(jù)分別為“60~70”、“70~80”、“80~90”、“90~100”四組,按統(tǒng)計(jì)表分組的習(xí)慣規(guī)定,90這一數(shù)值應(yīng)歸在( )這一組中。
A.“60~70”
B.“70~80”
C.“80~90”
D.“90~100”
【例題11:2007年單選題】對(duì)一組數(shù)據(jù)進(jìn)行分組,各組的組限依次是“10~20”、“20~30”、“30~40”、“40~50”、“50~60”、“60~70”。在以上這組數(shù)據(jù)中,50這一數(shù)值( )。
A.由于恰好等于組限,不需要分在某一組中
B.分在“50~60”一組中
C.分在“40~50”一組中
D.分在“40~50”或“50~60”任意一組中都可以
【例題12:2008年單選題】將一批數(shù)據(jù)進(jìn)行分組,各組的組限依次為“100-120”、“120-130”“130-140”“140-150”“150-160”,按統(tǒng)計(jì)分組的規(guī)定,140這一數(shù)值( )
A不計(jì)算在任何一組
B分在“140-150”這一組
C分在“130-140”這一組
D分在“130-140”或“140-150”均可
【例題13:2006年、2008年單選題】對(duì)數(shù)據(jù)實(shí)行等距分組的情況下,組距與組數(shù)的關(guān)系是( )。
A.無任何關(guān)系
B.反比關(guān)系
C.正比關(guān)系
D.組距總是組數(shù)的5倍
【例題14:2006年多選題】直方圖與條形圖的區(qū)別在于( )。
A.直方圖的各矩形通常是分開排列
B.直方圖用面積表示各組頻數(shù)的多少
C.直方圖的各矩形通常是連續(xù)排列
D.直方圖的矩形高度與寬度均有意義
E.直方圖的矩形高度有意義而寬度無意義
【例題15:課后題第14題】組距分組適用于下列情況( )
A.離散變量
B.變量值較少
C.連續(xù)變量
D.變量值較多
E.分類數(shù)據(jù)
【例題16:課后題第15題】在組距分組中,確定分組組數(shù)的時(shí)候要求( )。
A.組數(shù)盡可能少
B.組數(shù)盡可能多
C.盡量保證組間資料的差異性
D.盡量保證組內(nèi)資料的同質(zhì)性
E組數(shù)應(yīng)能被5除盡
【例題17:課后題第3題】為解決“不重”的問題,統(tǒng)計(jì)分組時(shí)習(xí)慣上規(guī)定( )
A不重不漏 B組限值應(yīng)能被5除盡 C下組限不在內(nèi) D 上組限不在內(nèi)
學(xué)習(xí)要求:
1.掌握數(shù)據(jù)分組的方法
2.掌握組中值的作用和計(jì)算方法
3.掌握數(shù)據(jù)分組的具體步驟
4.掌握直方圖與條形圖的區(qū)別
具體內(nèi)容:
(一)數(shù)據(jù)的分組
1.數(shù)據(jù)分組的含義:
數(shù)據(jù)分組是根據(jù)統(tǒng)計(jì)研究的需要,將數(shù)據(jù)按照某種標(biāo)準(zhǔn)劃分成不同的組別。分組后再計(jì)算出各組中出現(xiàn)的次數(shù)或頻數(shù),形成一張頻數(shù)分布表。
2.數(shù)據(jù)分組的方法
分組的方法有單變量值分組和組距分組兩種。
(1)單變量值分組是把每一個(gè)變量值作為一組,這種分組方法通常只適合于離散變量且變量較少的情況。
(2)組距分組是將全部的變量值,劃分為若干個(gè)不同的區(qū)間。適合于連續(xù)變量或變量值較多的情況。
采用組距分組需要經(jīng)過以下幾個(gè)步驟:
第一步,確定分組的組數(shù)
確定分組組數(shù)時(shí)的要求:
①劃分的組數(shù)既不應(yīng)太多也不應(yīng)太少
②組數(shù)的確定,要盡量保證組間資料的差異性與組內(nèi)資料的同質(zhì)性;
③采用的分組辦法,要能夠充分顯示客觀現(xiàn)象本身存在的狀態(tài)。
第二步,對(duì)原始資料進(jìn)行排序。
第三步,求極差。
極差值=大觀察值-小觀察值
第四步,確定各組組距。

根據(jù)上式計(jì)算出來的組距,可能帶有小數(shù),為了編表和計(jì)算方便,也是審美習(xí)慣使然,好把它取成接近于5除盡的一個(gè)數(shù)。
組距與組數(shù)成反比例關(guān)系,組數(shù)越多,組距越小,組數(shù)越少,組距越大。
②組距是每組觀察值的大差,即每組的上限值與下限值之間的差。用公式表示就是:
組距=某組上限值-該組下限值
或:某組上限值=該組下限值+組距
某組下限值=該組上限值-組距
第五步,確定組限。
組限是組與組之間的界限,或者是每組觀察值的變化范圍。
一個(gè)組的小值稱為下限;大值稱為上限。
上限值與下限值的差值稱為組距
上限值與下限值的平均數(shù)稱為組中值。即:

確定組應(yīng)注意:
①第一組的下限值應(yīng)比小的觀察值小一點(diǎn),后一組的上限值應(yīng)比大的觀察值大一點(diǎn)。
②特別需要或不得已的情況除外,好不要使用開口組。
③ 組限應(yīng)取得美觀些,按數(shù)字編好,組限值應(yīng)能被5除盡,且一般要用整數(shù)表示。
第六步 確定各組觀察值出現(xiàn)的頻數(shù)
為解決“不重”的問題,統(tǒng)計(jì)分組時(shí)習(xí)慣上規(guī)定“上組限不在內(nèi)”,即當(dāng)相鄰兩組的上下限重疊時(shí),恰好等于某一組上限的觀察值不算在本組內(nèi),而計(jì)算在下一組內(nèi)。
第七步,制作頻數(shù)分布表。
二)數(shù)值型數(shù)據(jù)的圖示
1.直方圖
直方圖是用矩形的寬度和高度來表示頻數(shù)分布的圖形。
直方圖中,實(shí)際上用矩形的面積表示各組的頻數(shù)分布。
直方圖與條形圖不同:
www.examw.com (1)條形圖是用條形的長(zhǎng)度(橫置時(shí))表示各類別頻數(shù)的多少,其寬度(表示類別是)則是固定的;直方圖是用面積表示各組頻數(shù)的多少,矩形的高度表示每一組的頻數(shù)或百分比,寬度則表示各組的組距,因此其高度與寬度均有意義。
(2)由于分組數(shù)據(jù)具有連續(xù)性,直方圖的各矩形通常是連續(xù)排列,而條形圖則是分開排列。
2.折線圖(也稱為頻數(shù)多邊形圖)
折線圖也稱頻數(shù)多邊形圖,它是在直方圖的基礎(chǔ)上,把直方圖頂部的中點(diǎn)用直線連接起來,再把原來的直方圖抹掉就是折線圖。
【例題10:2004年單選題】一批數(shù)據(jù)分別為“60~70”、“70~80”、“80~90”、“90~100”四組,按統(tǒng)計(jì)表分組的習(xí)慣規(guī)定,90這一數(shù)值應(yīng)歸在( )這一組中。
A.“60~70”
B.“70~80”
C.“80~90”
D.“90~100”
【例題11:2007年單選題】對(duì)一組數(shù)據(jù)進(jìn)行分組,各組的組限依次是“10~20”、“20~30”、“30~40”、“40~50”、“50~60”、“60~70”。在以上這組數(shù)據(jù)中,50這一數(shù)值( )。
A.由于恰好等于組限,不需要分在某一組中
B.分在“50~60”一組中
C.分在“40~50”一組中
D.分在“40~50”或“50~60”任意一組中都可以
【例題12:2008年單選題】將一批數(shù)據(jù)進(jìn)行分組,各組的組限依次為“100-120”、“120-130”“130-140”“140-150”“150-160”,按統(tǒng)計(jì)分組的規(guī)定,140這一數(shù)值( )
A不計(jì)算在任何一組
B分在“140-150”這一組
C分在“130-140”這一組
D分在“130-140”或“140-150”均可
【例題13:2006年、2008年單選題】對(duì)數(shù)據(jù)實(shí)行等距分組的情況下,組距與組數(shù)的關(guān)系是( )。
A.無任何關(guān)系
B.反比關(guān)系
C.正比關(guān)系
D.組距總是組數(shù)的5倍
【例題14:2006年多選題】直方圖與條形圖的區(qū)別在于( )。
A.直方圖的各矩形通常是分開排列
B.直方圖用面積表示各組頻數(shù)的多少
C.直方圖的各矩形通常是連續(xù)排列
D.直方圖的矩形高度與寬度均有意義
E.直方圖的矩形高度有意義而寬度無意義
【例題15:課后題第14題】組距分組適用于下列情況( )
A.離散變量
B.變量值較少
C.連續(xù)變量
D.變量值較多
E.分類數(shù)據(jù)
【例題16:課后題第15題】在組距分組中,確定分組組數(shù)的時(shí)候要求( )。
A.組數(shù)盡可能少
B.組數(shù)盡可能多
C.盡量保證組間資料的差異性
D.盡量保證組內(nèi)資料的同質(zhì)性
E組數(shù)應(yīng)能被5除盡
【例題17:課后題第3題】為解決“不重”的問題,統(tǒng)計(jì)分組時(shí)習(xí)慣上規(guī)定( )
A不重不漏 B組限值應(yīng)能被5除盡 C下組限不在內(nèi) D 上組限不在內(nèi)