2、數(shù)值型數(shù)據(jù)的整理與顯示
①數(shù)據(jù)的分組:分組的方法
分類方法
定義
適用范圍
單變量值分組
把每一個變量值作為一組
通常只適合于離散變量且變量值較少的情況。
組距分組
將全部變量值依次劃分為若干個區(qū)間,并將這一區(qū)間的變量值作為一組。
連續(xù)變量或變量值較多的情況
采用組距分組的步驟:
第一步,確定分組組數(shù)
確定分組組數(shù)的要求是:1)劃分的組數(shù),既不應太多也不應太少;2)組數(shù)的確定,要盡量保證組間資料的差異性與組內資料的同質性;3)采用的分組辦法,要能夠充分顯示客觀現(xiàn)象本身存在的狀態(tài)。
關于統(tǒng)計分組組數(shù)問題,斯特基給出的計算公式為:(了解即可)
k=log10N/log102
第二步,對原始資料進行排序;
第三步,求極差,將的觀察值與最小的觀察值相減便得到極差;
第四步,確定各組組距。在實行等距分組的情況下,組距的確定辦法為:
組距=極差÷組數(shù)把組距取成接近于能被5除盡的一個數(shù)。
掌握:組距與組數(shù)成反比關系,組數(shù)越多,組距越小,組數(shù)越少,組距越大。
組距是每組觀察值的差,即每組的上限值與下限值之間的差。
組距=某組的上限值-該組的下限值
第五步,確定組限
組限是組與組之間的界限,或者說是每組觀察值變化的范圍。組限有上限與下限之分;上限與下限的差值稱為組距;上限值與下限值的平均數(shù)稱為組中值。
組中值=(上限值+下限值)÷2
確定組應注意:1)第一組的下限值應比最小的觀察值小一點,最后一組的上限值應比的觀察值大一點;2)特別需要或不得已的情況除外,不要使用開口組;3)組限應取得美觀些,按數(shù)字偏好,組限值應能被5除盡,且一般要用整數(shù)表示。
第六步,確定各組觀察值出現(xiàn)的頻數(shù)
凡觀察值落在某一區(qū)間的,就計發(fā)生一次,最后統(tǒng)計各組觀察值發(fā)生的總次數(shù)。采用組距分組時,需要遵循“不重不漏”的原則。
為解決“不重”的問題,統(tǒng)計分組時習慣上規(guī)定“上組限不在內”,即當相鄰兩組的上下限重疊時,恰好等于某一組上限的觀察值不算在本組內,而計算在下一組內。
第七步,制作頻數(shù)分布表,并填上相關的內容,以及其他需要說明的事項。
☆數(shù)值型數(shù)據(jù)的圖示——直方圖、折線圖
①直方圖——直方圖是用矩形的寬度和高度來表示頻數(shù)分布的圖形。
在直方圖中,我們實際上用矩形的面積表示各組的頻數(shù)分布。
直方圖與條形圖的區(qū)別:1)條形圖是用條形的長度(橫置時)表示各類別頻數(shù)的多少,其寬度(表示類別)則是固定的;直方圖是用面積表示各組頻數(shù)的多少,矩形的高度表示每一組的頻數(shù)或百分比,寬度則表示各組的組距,因此其高度與寬度均有意義;2)直方圖的各矩形通常是連續(xù)排列,而條形圖則是分開排列。
②折線圖:也稱頻數(shù)多邊形圖,它是在直方圖的基礎上,把直方圖頂部的中點(即組中值)用直線連接起來,再把原來的直方圖抹掉就是折線圖。
數(shù)據(jù)的整理與顯示總結
數(shù)據(jù)類型
數(shù)據(jù)的整理
數(shù)據(jù)的顯示
分類數(shù)據(jù)
頻數(shù)、比例、比率、百分比
條形圖、圓形圖
順序數(shù)據(jù)
頻數(shù)、比例、比率、百分比、累積頻數(shù)、累積百分比
條形圖、圓形圖、累積分布圖
數(shù)值型數(shù)據(jù)
頻數(shù)、比例、比率、百分比、累積頻數(shù)、累積百分比、分組(單變量分組、組距分組)
條形圖、圓形圖、累積分布圖、直方圖、折線圖
①數(shù)據(jù)的分組:分組的方法
分類方法
定義
適用范圍
單變量值分組
把每一個變量值作為一組
通常只適合于離散變量且變量值較少的情況。
組距分組
將全部變量值依次劃分為若干個區(qū)間,并將這一區(qū)間的變量值作為一組。
連續(xù)變量或變量值較多的情況
采用組距分組的步驟:
第一步,確定分組組數(shù)
確定分組組數(shù)的要求是:1)劃分的組數(shù),既不應太多也不應太少;2)組數(shù)的確定,要盡量保證組間資料的差異性與組內資料的同質性;3)采用的分組辦法,要能夠充分顯示客觀現(xiàn)象本身存在的狀態(tài)。
關于統(tǒng)計分組組數(shù)問題,斯特基給出的計算公式為:(了解即可)
k=log10N/log102
第二步,對原始資料進行排序;
第三步,求極差,將的觀察值與最小的觀察值相減便得到極差;
第四步,確定各組組距。在實行等距分組的情況下,組距的確定辦法為:
組距=極差÷組數(shù)把組距取成接近于能被5除盡的一個數(shù)。
掌握:組距與組數(shù)成反比關系,組數(shù)越多,組距越小,組數(shù)越少,組距越大。
組距是每組觀察值的差,即每組的上限值與下限值之間的差。
組距=某組的上限值-該組的下限值
第五步,確定組限
組限是組與組之間的界限,或者說是每組觀察值變化的范圍。組限有上限與下限之分;上限與下限的差值稱為組距;上限值與下限值的平均數(shù)稱為組中值。
組中值=(上限值+下限值)÷2
確定組應注意:1)第一組的下限值應比最小的觀察值小一點,最后一組的上限值應比的觀察值大一點;2)特別需要或不得已的情況除外,不要使用開口組;3)組限應取得美觀些,按數(shù)字偏好,組限值應能被5除盡,且一般要用整數(shù)表示。
第六步,確定各組觀察值出現(xiàn)的頻數(shù)
凡觀察值落在某一區(qū)間的,就計發(fā)生一次,最后統(tǒng)計各組觀察值發(fā)生的總次數(shù)。采用組距分組時,需要遵循“不重不漏”的原則。
為解決“不重”的問題,統(tǒng)計分組時習慣上規(guī)定“上組限不在內”,即當相鄰兩組的上下限重疊時,恰好等于某一組上限的觀察值不算在本組內,而計算在下一組內。
第七步,制作頻數(shù)分布表,并填上相關的內容,以及其他需要說明的事項。
☆數(shù)值型數(shù)據(jù)的圖示——直方圖、折線圖
①直方圖——直方圖是用矩形的寬度和高度來表示頻數(shù)分布的圖形。
在直方圖中,我們實際上用矩形的面積表示各組的頻數(shù)分布。
直方圖與條形圖的區(qū)別:1)條形圖是用條形的長度(橫置時)表示各類別頻數(shù)的多少,其寬度(表示類別)則是固定的;直方圖是用面積表示各組頻數(shù)的多少,矩形的高度表示每一組的頻數(shù)或百分比,寬度則表示各組的組距,因此其高度與寬度均有意義;2)直方圖的各矩形通常是連續(xù)排列,而條形圖則是分開排列。
②折線圖:也稱頻數(shù)多邊形圖,它是在直方圖的基礎上,把直方圖頂部的中點(即組中值)用直線連接起來,再把原來的直方圖抹掉就是折線圖。
數(shù)據(jù)的整理與顯示總結
數(shù)據(jù)類型
數(shù)據(jù)的整理
數(shù)據(jù)的顯示
分類數(shù)據(jù)
頻數(shù)、比例、比率、百分比
條形圖、圓形圖
順序數(shù)據(jù)
頻數(shù)、比例、比率、百分比、累積頻數(shù)、累積百分比
條形圖、圓形圖、累積分布圖
數(shù)值型數(shù)據(jù)
頻數(shù)、比例、比率、百分比、累積頻數(shù)、累積百分比、分組(單變量分組、組距分組)
條形圖、圓形圖、累積分布圖、直方圖、折線圖

