第十二章 研究資料的審核、整理與統(tǒng)計分析
第一節(jié)
(一)資料審核,是指在著手整理調查資料之前,對原始資料進行審查與核實的工作過程,目的是保證資料的客觀性、準確性和完整性,為資料的整理打下堅實的基礎。
資料審核和資料收集工作同步進行,叫做實地審核或收集審核。
在收集資料后集中時間進行審核叫做系統(tǒng)審核。
對重要資料進行反復的各種形式的審核,叫做多次審核。
資料審核的原則有:
1、真實性原則
2、標準性原則
3、準確性原則
4、完整性原則
(二)資料的整理,是根據(jù)研究目的將經(jīng)過審核的資料進行分類匯總,使資料更加條理化和系統(tǒng)化,為進一步深入分析提供條件。
資料整理應遵循三條原則:
1、條理化
2、系統(tǒng)化
3、統(tǒng)計匯總
嚴禁來講,分類和分組都是一種定性分類方法。
調查資料的分類有兩種:
1、前分類
2、后分類
分類的方法有兩種:
1、現(xiàn)象分類方法
2、本質分類方法(又稱科學分類法)
分類標志可以分為品質標志和數(shù)量標志。
數(shù)量標志有兩種表現(xiàn)形式;
1、按單值分類;
2、按組距分類。
要選擇正確的分類標志,必須遵循四條原則:
1、從研究目的出發(fā)選擇標志;
2、從反映事物本質的需要去選擇標志;
3、根據(jù)具體的歷史條件去選擇標志;
4、分組標志的確立必須堅持窮盡性和互斥性的原則。
第二節(jié)
匯總的技術有兩種:
1、手工匯總
2、計算機匯總
(一)計算機匯總的步驟有:
1、編碼
2、登錄
3、錄入
4、程序編制
(二)計算機錄入有兩種方式:
1、固定格式錄入
2、自由格式錄入
計算機查錯的程序有兩種:
1、檢查輸入信息的有效性,即對數(shù)碼進行幅度檢查;
2、檢索輸入信息相互之間的一致性,即對數(shù)碼進行邏輯檢查。
(三)統(tǒng)計表的主要意義有兩點:
1、能有條理、有系統(tǒng)地排列統(tǒng)計資料,使人們在閱讀時一目了然;
2、能合理地、科學地組織統(tǒng)計資料,使人們在閱讀時便于對照比較。
統(tǒng)計表有三種類型;
1、簡單表
2、分組表
3、復合分組表
第三節(jié)
資料分析包括統(tǒng)計分析和理論分析。
(一)統(tǒng)計分析在社會研究中的必要性有三個方面:
1、統(tǒng)計分析的方法可以為社會研究提供一種清晰精確的形式化語言;
2、統(tǒng)計分析是進行科學預測,探索未來的重要方法;
3、統(tǒng)計分析技術是處理調查研究資料的必要工具。
統(tǒng)計分析的特點有兩點;1統(tǒng)計分析要以定性分析為基礎;2統(tǒng)計分析有一套專門的方法和技術。
(二)單變量統(tǒng)計分析包括集中量數(shù)分析、離中量數(shù)分析和相對差異量數(shù)分析。
常用的集中量數(shù)有平均數(shù)、中位數(shù)和眾數(shù)。
集中量數(shù)在統(tǒng)計分析中的作用有四個方面:
1、集中量數(shù)說明某一社會現(xiàn)象在一定條件下,其數(shù)量的一般水平;
2、集中量數(shù)可以對于在不同空間的同類現(xiàn)象進行比較;
3、集中量數(shù)可以對一定社會現(xiàn)象在不同時間中的變化進行比較,以說明這些現(xiàn)象的發(fā)展趨勢和規(guī)律;
4、集中量數(shù)可以用來分析某些社會現(xiàn)象之間的依存關系。
中位數(shù),是把一組數(shù)據(jù)按照其大小順序排列起來,處于最中間位置那個數(shù)。
眾數(shù),是指在一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的標志值。
從組距分組資料中計算眾數(shù)的方法有兩種:
1、組中值法;
2、摘補法。
簡單算術平均數(shù)計算公式是:
加權算術平均數(shù)計算公式是:
下限公式是:
離中量數(shù)包括異眾比率、四分位差、標準差。
差異程度越小,平均值的代表性越高;差異程度越大,平均數(shù)的代表性就越低。
描述數(shù)據(jù)離散程度的量數(shù)就是離中量數(shù),也稱差異量數(shù)。
異眾比率是指非眾數(shù)的次數(shù)與總體內全部總體單位的比率。
標準差又叫做均方差,是指資料中各個數(shù)值與算術平均數(shù)相減之間的平方和的算術平均數(shù)的平方根。 它是用得最多、也是最重要的離中量數(shù)。
相對差異量數(shù)有兩種;
1、離散系數(shù);
2、標準系數(shù)。
雙變量描述性統(tǒng)計分析是指對樣本資料中兩個變量之間關系的統(tǒng)計分析。
各種事物聯(lián)系的不同表現(xiàn)形式分為兩類:
1、指事物之間具有完全確定性的關系,成為函數(shù)關系;
2、另一類是事物之間的不完全確定關系,成為相關關系。
相關關系和回歸分析的關系及應注意的四個問題:
1、相關是回歸的必要條件,也就是說有相關關系未必有回歸關系,無相關關系必無回歸關系,因為無相關關系的兩個事物之間不會存在因果關系;
2、相關關系既可以說明變量之間關系的密切程度,還可以度量回歸方程對實際資料的擬全程度;
3、應用回歸方程進行預測時,不能使用超出資料所包括范圍的自變量數(shù)值;
4、預測的回歸方程只能反映一定時期內事物間的相互關系,使用歷史資料預測未來變化時要考慮時過境遷的問題。
推論統(tǒng)計是用樣本的統(tǒng)計值去推論總體的參數(shù)值的統(tǒng)計分析方法。
推論統(tǒng)計主要有兩種方法;
1、區(qū)間估計;
2、假設檢驗。
SPSS稱為常用統(tǒng)計分析軟件,是世界的統(tǒng)計分析軟件之一,也是社會科學領域最常用的統(tǒng)計分析軟件。
第一節(jié)
(一)資料審核,是指在著手整理調查資料之前,對原始資料進行審查與核實的工作過程,目的是保證資料的客觀性、準確性和完整性,為資料的整理打下堅實的基礎。
資料審核和資料收集工作同步進行,叫做實地審核或收集審核。
在收集資料后集中時間進行審核叫做系統(tǒng)審核。
對重要資料進行反復的各種形式的審核,叫做多次審核。
資料審核的原則有:
1、真實性原則
2、標準性原則
3、準確性原則
4、完整性原則
(二)資料的整理,是根據(jù)研究目的將經(jīng)過審核的資料進行分類匯總,使資料更加條理化和系統(tǒng)化,為進一步深入分析提供條件。
資料整理應遵循三條原則:
1、條理化
2、系統(tǒng)化
3、統(tǒng)計匯總
嚴禁來講,分類和分組都是一種定性分類方法。
調查資料的分類有兩種:
1、前分類
2、后分類
分類的方法有兩種:
1、現(xiàn)象分類方法
2、本質分類方法(又稱科學分類法)
分類標志可以分為品質標志和數(shù)量標志。
數(shù)量標志有兩種表現(xiàn)形式;
1、按單值分類;
2、按組距分類。
要選擇正確的分類標志,必須遵循四條原則:
1、從研究目的出發(fā)選擇標志;
2、從反映事物本質的需要去選擇標志;
3、根據(jù)具體的歷史條件去選擇標志;
4、分組標志的確立必須堅持窮盡性和互斥性的原則。
第二節(jié)
匯總的技術有兩種:
1、手工匯總
2、計算機匯總
(一)計算機匯總的步驟有:
1、編碼
2、登錄
3、錄入
4、程序編制
(二)計算機錄入有兩種方式:
1、固定格式錄入
2、自由格式錄入
計算機查錯的程序有兩種:
1、檢查輸入信息的有效性,即對數(shù)碼進行幅度檢查;
2、檢索輸入信息相互之間的一致性,即對數(shù)碼進行邏輯檢查。
(三)統(tǒng)計表的主要意義有兩點:
1、能有條理、有系統(tǒng)地排列統(tǒng)計資料,使人們在閱讀時一目了然;
2、能合理地、科學地組織統(tǒng)計資料,使人們在閱讀時便于對照比較。
統(tǒng)計表有三種類型;
1、簡單表
2、分組表
3、復合分組表
第三節(jié)
資料分析包括統(tǒng)計分析和理論分析。
(一)統(tǒng)計分析在社會研究中的必要性有三個方面:
1、統(tǒng)計分析的方法可以為社會研究提供一種清晰精確的形式化語言;
2、統(tǒng)計分析是進行科學預測,探索未來的重要方法;
3、統(tǒng)計分析技術是處理調查研究資料的必要工具。
統(tǒng)計分析的特點有兩點;1統(tǒng)計分析要以定性分析為基礎;2統(tǒng)計分析有一套專門的方法和技術。
(二)單變量統(tǒng)計分析包括集中量數(shù)分析、離中量數(shù)分析和相對差異量數(shù)分析。
常用的集中量數(shù)有平均數(shù)、中位數(shù)和眾數(shù)。
集中量數(shù)在統(tǒng)計分析中的作用有四個方面:
1、集中量數(shù)說明某一社會現(xiàn)象在一定條件下,其數(shù)量的一般水平;
2、集中量數(shù)可以對于在不同空間的同類現(xiàn)象進行比較;
3、集中量數(shù)可以對一定社會現(xiàn)象在不同時間中的變化進行比較,以說明這些現(xiàn)象的發(fā)展趨勢和規(guī)律;
4、集中量數(shù)可以用來分析某些社會現(xiàn)象之間的依存關系。
中位數(shù),是把一組數(shù)據(jù)按照其大小順序排列起來,處于最中間位置那個數(shù)。
眾數(shù),是指在一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的標志值。
從組距分組資料中計算眾數(shù)的方法有兩種:
1、組中值法;
2、摘補法。
簡單算術平均數(shù)計算公式是:
加權算術平均數(shù)計算公式是:
下限公式是:
離中量數(shù)包括異眾比率、四分位差、標準差。
差異程度越小,平均值的代表性越高;差異程度越大,平均數(shù)的代表性就越低。
描述數(shù)據(jù)離散程度的量數(shù)就是離中量數(shù),也稱差異量數(shù)。
異眾比率是指非眾數(shù)的次數(shù)與總體內全部總體單位的比率。
標準差又叫做均方差,是指資料中各個數(shù)值與算術平均數(shù)相減之間的平方和的算術平均數(shù)的平方根。 它是用得最多、也是最重要的離中量數(shù)。
相對差異量數(shù)有兩種;
1、離散系數(shù);
2、標準系數(shù)。
雙變量描述性統(tǒng)計分析是指對樣本資料中兩個變量之間關系的統(tǒng)計分析。
各種事物聯(lián)系的不同表現(xiàn)形式分為兩類:
1、指事物之間具有完全確定性的關系,成為函數(shù)關系;
2、另一類是事物之間的不完全確定關系,成為相關關系。
相關關系和回歸分析的關系及應注意的四個問題:
1、相關是回歸的必要條件,也就是說有相關關系未必有回歸關系,無相關關系必無回歸關系,因為無相關關系的兩個事物之間不會存在因果關系;
2、相關關系既可以說明變量之間關系的密切程度,還可以度量回歸方程對實際資料的擬全程度;
3、應用回歸方程進行預測時,不能使用超出資料所包括范圍的自變量數(shù)值;
4、預測的回歸方程只能反映一定時期內事物間的相互關系,使用歷史資料預測未來變化時要考慮時過境遷的問題。
推論統(tǒng)計是用樣本的統(tǒng)計值去推論總體的參數(shù)值的統(tǒng)計分析方法。
推論統(tǒng)計主要有兩種方法;
1、區(qū)間估計;
2、假設檢驗。
SPSS稱為常用統(tǒng)計分析軟件,是世界的統(tǒng)計分析軟件之一,也是社會科學領域最常用的統(tǒng)計分析軟件。

