第十二章 研究資料的審核,整理與統(tǒng)計(jì)分析
第一節(jié) 資料的審核與整理
1.S資料審核:是指在著手整理調(diào)查資料之前,對(duì)原始資料進(jìn)行審查與核實(shí)的工作過程,目的是保證資料的客觀性、準(zhǔn)確性和完整性,為資料的整理打下堅(jiān)實(shí)的基礎(chǔ)。
2.資料整理:是根據(jù)研究目的將經(jīng)過審核的資料進(jìn)行分類匯總,是資料更加條理化和系統(tǒng)化,為進(jìn)一步深入分析提供條件。
3.分類和分組:都是一種定性分類方法,即根據(jù)研究對(duì)象的某些特征將其區(qū)分為不同種類;分類適用于全部調(diào)查資料,分組只限于數(shù)量化的統(tǒng)計(jì)資料(分組也被稱為統(tǒng)計(jì)分組或統(tǒng)計(jì)分類);分類有兩種:前分類和后分類。p255
4.L資料審核的原則: 1.真實(shí)性原則。 2.標(biāo)準(zhǔn)性原則。 3.準(zhǔn)確性原則。 4.完整性原則。
5.資料整理的原則
a) 條理化:是指對(duì)資料進(jìn)行分類從而為進(jìn)一步的分析創(chuàng)造條件。(從對(duì)事物分類歸納著手)
b) 系統(tǒng)化:是指從整體上考察現(xiàn)在資料滿足研究目的的程度如何,有沒有必要吸收補(bǔ)充其他資料;(從整體綜合的角度考慮問題,首先,它要從整體上考慮現(xiàn)有資料是否系統(tǒng),完整,其次要考慮對(duì)調(diào)查中發(fā)行的新情況如何處理;)
c) 統(tǒng)計(jì)匯總:是指將調(diào)查得到的各種數(shù)據(jù)進(jìn)行初步的統(tǒng)計(jì)整理,以把握其總體上的數(shù)量特征
6. 分類的類型及意義;
a) 分類的方法有兩種:現(xiàn)象分類方法和本質(zhì)分類方法。根據(jù)事物外部特征或外在聯(lián)系進(jìn)行分類的方法稱為現(xiàn)象分類法;根據(jù)事物的本質(zhì)特征或內(nèi)部聯(lián)系進(jìn)行分類的方法稱為本質(zhì)分類法,本質(zhì)分類法也被稱為科學(xué)分類法。
b) 現(xiàn)象分類法可以幫助調(diào)查研究者建立資料存取系統(tǒng),便于資料的存取和查找、利用。本質(zhì)分類不僅是資料的存取、檢索系統(tǒng),而且是調(diào)查者對(duì)客觀事物和規(guī)律認(rèn)識(shí)的總結(jié)系統(tǒng)
7. 選擇分類標(biāo)志的原則:分類的關(guān)鍵在與選擇和確定分類標(biāo)志
1.從研究目的出發(fā)選擇標(biāo)志;2.從反映事物本質(zhì)的需要去選擇標(biāo)志; 3.根據(jù)具體的歷史條件去選擇標(biāo)志;4.分組標(biāo)志的確立必須堅(jiān)持窮盡性和互斥性的原則。
8. 分類標(biāo)志的類別:分為品質(zhì)標(biāo)志和數(shù)量標(biāo)志
a) 按品質(zhì)標(biāo)志分類就是選擇反映事物屬性差異的品質(zhì)標(biāo)志為分類標(biāo)準(zhǔn);如性別按男女分為兩類。
b) 按數(shù)量標(biāo)志分類就是選擇反映事物數(shù)量差異的數(shù)量標(biāo)志為分類標(biāo)準(zhǔn);如居民家庭按子女?dāng)?shù)分組,可分為無子女家庭,單子女家庭,雙子女家庭等。數(shù)量標(biāo)志有兩種表現(xiàn)形式:按單值分類(如按子女?dāng)?shù)分類)、按組距分類(如按年齡組距將人們分入不同年齡段中);注意如果某一數(shù)值正好與上限一致,則按上限不在內(nèi)的原則,將其劃入下一組中。
第二節(jié) 資料匯總
1.編碼:是將問卷中的信息數(shù)字化轉(zhuǎn)換成統(tǒng)計(jì)軟件和統(tǒng)計(jì)程序能夠識(shí)別的數(shù)字,是一種信息代換的過程,其主要是建立編碼手冊。
2.登錄:是將編好碼的問卷資料過錄到資料卡片上去,以便于將他們輸入到計(jì)算機(jī)的軟盤或硬盤等存儲(chǔ)設(shè)備上去。
3.錄入:是將登錄在資料卡片上的數(shù)據(jù)錄入到計(jì)算機(jī)的存儲(chǔ)設(shè)備上,其性質(zhì)同登錄相同。
4.統(tǒng)計(jì)表:即資料通過統(tǒng)計(jì)匯總,得出許多說明社會(huì)現(xiàn)象和過程的數(shù)字資料,把這些資料按照一定的目的,在表格上表現(xiàn)出來,這種表格就叫統(tǒng)計(jì)表;是資料整理的結(jié)果應(yīng)用最廣泛的形式。
5.L計(jì)算機(jī)資料匯總的步驟
第一,編碼。(主要是建立編碼手冊)第二,登錄。(過錄到資料卡片上) 第三,錄入。(錄入到計(jì)算機(jī)的存儲(chǔ)設(shè)備上)第四,程序編制。(計(jì)算機(jī)輸入指令,指令就是程序)
6. 編碼手冊包含哪些內(nèi)容;包含4個(gè)主要項(xiàng)目:1、序號(hào);2、問題編碼;3、項(xiàng)目名稱;4、編碼的內(nèi)容說明。
7. 研究資料的計(jì)算機(jī)錄入有哪兩類方式,各自有何優(yōu)缺點(diǎn),有兩種方式
a) 固定格式錄入:是指按照固定的位數(shù)和固定的位置去輸入代表每個(gè)變量取值的數(shù)碼;好處是資料錄入員可以集中精力敲擊鍵盤,而不必考慮每個(gè)數(shù)據(jù)應(yīng)該對(duì)應(yīng)哪個(gè)變量,可以提高錄入速度;缺點(diǎn)是先將調(diào)查數(shù)據(jù)轉(zhuǎn)化為固定格式,且卷面登錄和計(jì)算機(jī)錄入時(shí)都要嚴(yán)格注意每個(gè)變量上數(shù)碼的位數(shù)和位置,不能出錯(cuò)
b) 自由格式錄入:是指以一個(gè)個(gè)的變量值為單位直接將數(shù)據(jù)錄入到計(jì)算機(jī)電子表格中;其優(yōu)點(diǎn)是錄入比較直觀,不必轉(zhuǎn)化,而且錄入數(shù)據(jù)錯(cuò)誤也容易發(fā)現(xiàn);
8. 統(tǒng)計(jì)表的種類:按總體分組的情況分:簡單表、分組表(又分為單項(xiàng)分組表和組距分組表)和復(fù)合表(又稱交互分類表)。
9. 統(tǒng)計(jì)表的結(jié)構(gòu):;
a) 從外表形式上看,統(tǒng)計(jì)表由總標(biāo)題(上端中部)、橫行標(biāo)題(左端)、縱欄標(biāo)題(表上方)、指標(biāo)數(shù)值四部分組成。
b) 從內(nèi)容上看,統(tǒng)計(jì)表由主詞和賓詞兩部分構(gòu)成
10. 掌握設(shè)計(jì)統(tǒng)計(jì)表的方法:
1、統(tǒng)計(jì)表形式的設(shè)計(jì);
2、統(tǒng)計(jì)表的內(nèi)容設(shè)計(jì);
3統(tǒng)計(jì)表制表的要點(diǎn):
(在制作統(tǒng)計(jì)表時(shí)應(yīng)注意下列事項(xiàng):首先,文字書寫應(yīng)工整,字跡清晰,數(shù)字應(yīng)填寫整齊,數(shù)位對(duì)準(zhǔn)。其次,當(dāng)數(shù)字為“0”時(shí)要寫出來,如果不應(yīng)有數(shù)字時(shí)應(yīng)用橫短線“-”表示;當(dāng)缺某項(xiàng)數(shù)字或因數(shù)字小可忽略不計(jì)時(shí),用省略號(hào)“…”表示;當(dāng)某項(xiàng)資料應(yīng)免填時(shí),用符號(hào)“X”表示。統(tǒng)計(jì)數(shù)字部分不應(yīng)留下空白。)
第三節(jié) 定量研究資料的統(tǒng)計(jì)分析
1.S社會(huì)研究資料的統(tǒng)計(jì)分析:是采用數(shù)理統(tǒng)計(jì)的方法和技術(shù)對(duì)社會(huì)研究中獲得的資料進(jìn)行定量分析。
2.集中量數(shù):也稱集中趨勢量數(shù),它是用一個(gè)數(shù)值去代表一組數(shù)據(jù)的一般水平。常用的集中量數(shù)有平均數(shù),中位數(shù)和眾數(shù);
3.平均數(shù);是表面一組數(shù)據(jù)的平均水平的數(shù)值。
4.中位數(shù):把一組數(shù)據(jù)按照其大小順序排列起來,處于最中間位置的那個(gè)數(shù)就是中位數(shù),有時(shí)也稱位置平均數(shù);主要用于定序測量
資料中。
5.眾數(shù):是指在一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的標(biāo)志值。
6. 離中量數(shù):描述數(shù)據(jù)離散程度的量數(shù)就是離中量數(shù),也稱差異量數(shù);它是一個(gè)概括性量值,是研究現(xiàn)象差異程度的概括表現(xiàn);它的意義在于闡明被研究現(xiàn)象的差異特征;常用的離中量數(shù)有異眾比率,四分位差和標(biāo)準(zhǔn)差。
7. 異眾比率:是指非眾數(shù)的次數(shù)于總體內(nèi)全部總體單位的比率
8. 四分位差;把一組數(shù)據(jù)按照大小排列成序列,然后分成4個(gè)數(shù)據(jù)數(shù)目相等的段落,各個(gè)段落分界點(diǎn)上的數(shù)叫四分位數(shù);而四分位差就是第三個(gè)四分位數(shù)的值減去第一個(gè)四分?jǐn)?shù)位值
9. 標(biāo)準(zhǔn)差;又叫均方差,是指資料中各個(gè)數(shù)值與算術(shù)平均術(shù)相減之間的平方和的算數(shù)平均數(shù)的平方根;它是用得最多,也是最重要的離中量數(shù)
10. 離散系數(shù);是標(biāo)準(zhǔn)差與算術(shù)平均數(shù)的比值,用百分?jǐn)?shù)表示,它是一個(gè)相對(duì)數(shù),不受單位的限制
11.置信區(qū)間; 通過樣本統(tǒng)計(jì)值去推論總體參數(shù)值存在的范圍。范圍的大小標(biāo)志著推論的精確度。范圍越小,精確度越高
12.置信度; 對(duì)置信區(qū)間進(jìn)行推論時(shí)總體的實(shí)際參數(shù)值真正處于置信區(qū)間中的概率度,即這種推論的可靠性程度
13.抽樣誤差; 由于抽樣而導(dǎo)致的樣本與總體之間在被研究的變量上存在的差異。是隨機(jī)抽樣本身所固有的誤差
14.SPSS是世界的統(tǒng)計(jì)分析軟件之一,也是社會(huì)科學(xué)領(lǐng)域最常用的統(tǒng)計(jì)分析軟件。它于是1968年由3位美國斯坦福大學(xué)的學(xué)生開發(fā)。
第一節(jié) 資料的審核與整理
1.S資料審核:是指在著手整理調(diào)查資料之前,對(duì)原始資料進(jìn)行審查與核實(shí)的工作過程,目的是保證資料的客觀性、準(zhǔn)確性和完整性,為資料的整理打下堅(jiān)實(shí)的基礎(chǔ)。
2.資料整理:是根據(jù)研究目的將經(jīng)過審核的資料進(jìn)行分類匯總,是資料更加條理化和系統(tǒng)化,為進(jìn)一步深入分析提供條件。
3.分類和分組:都是一種定性分類方法,即根據(jù)研究對(duì)象的某些特征將其區(qū)分為不同種類;分類適用于全部調(diào)查資料,分組只限于數(shù)量化的統(tǒng)計(jì)資料(分組也被稱為統(tǒng)計(jì)分組或統(tǒng)計(jì)分類);分類有兩種:前分類和后分類。p255
4.L資料審核的原則: 1.真實(shí)性原則。 2.標(biāo)準(zhǔn)性原則。 3.準(zhǔn)確性原則。 4.完整性原則。
5.資料整理的原則
a) 條理化:是指對(duì)資料進(jìn)行分類從而為進(jìn)一步的分析創(chuàng)造條件。(從對(duì)事物分類歸納著手)
b) 系統(tǒng)化:是指從整體上考察現(xiàn)在資料滿足研究目的的程度如何,有沒有必要吸收補(bǔ)充其他資料;(從整體綜合的角度考慮問題,首先,它要從整體上考慮現(xiàn)有資料是否系統(tǒng),完整,其次要考慮對(duì)調(diào)查中發(fā)行的新情況如何處理;)
c) 統(tǒng)計(jì)匯總:是指將調(diào)查得到的各種數(shù)據(jù)進(jìn)行初步的統(tǒng)計(jì)整理,以把握其總體上的數(shù)量特征
6. 分類的類型及意義;
a) 分類的方法有兩種:現(xiàn)象分類方法和本質(zhì)分類方法。根據(jù)事物外部特征或外在聯(lián)系進(jìn)行分類的方法稱為現(xiàn)象分類法;根據(jù)事物的本質(zhì)特征或內(nèi)部聯(lián)系進(jìn)行分類的方法稱為本質(zhì)分類法,本質(zhì)分類法也被稱為科學(xué)分類法。
b) 現(xiàn)象分類法可以幫助調(diào)查研究者建立資料存取系統(tǒng),便于資料的存取和查找、利用。本質(zhì)分類不僅是資料的存取、檢索系統(tǒng),而且是調(diào)查者對(duì)客觀事物和規(guī)律認(rèn)識(shí)的總結(jié)系統(tǒng)
7. 選擇分類標(biāo)志的原則:分類的關(guān)鍵在與選擇和確定分類標(biāo)志
1.從研究目的出發(fā)選擇標(biāo)志;2.從反映事物本質(zhì)的需要去選擇標(biāo)志; 3.根據(jù)具體的歷史條件去選擇標(biāo)志;4.分組標(biāo)志的確立必須堅(jiān)持窮盡性和互斥性的原則。
8. 分類標(biāo)志的類別:分為品質(zhì)標(biāo)志和數(shù)量標(biāo)志
a) 按品質(zhì)標(biāo)志分類就是選擇反映事物屬性差異的品質(zhì)標(biāo)志為分類標(biāo)準(zhǔn);如性別按男女分為兩類。
b) 按數(shù)量標(biāo)志分類就是選擇反映事物數(shù)量差異的數(shù)量標(biāo)志為分類標(biāo)準(zhǔn);如居民家庭按子女?dāng)?shù)分組,可分為無子女家庭,單子女家庭,雙子女家庭等。數(shù)量標(biāo)志有兩種表現(xiàn)形式:按單值分類(如按子女?dāng)?shù)分類)、按組距分類(如按年齡組距將人們分入不同年齡段中);注意如果某一數(shù)值正好與上限一致,則按上限不在內(nèi)的原則,將其劃入下一組中。
第二節(jié) 資料匯總
1.編碼:是將問卷中的信息數(shù)字化轉(zhuǎn)換成統(tǒng)計(jì)軟件和統(tǒng)計(jì)程序能夠識(shí)別的數(shù)字,是一種信息代換的過程,其主要是建立編碼手冊。
2.登錄:是將編好碼的問卷資料過錄到資料卡片上去,以便于將他們輸入到計(jì)算機(jī)的軟盤或硬盤等存儲(chǔ)設(shè)備上去。
3.錄入:是將登錄在資料卡片上的數(shù)據(jù)錄入到計(jì)算機(jī)的存儲(chǔ)設(shè)備上,其性質(zhì)同登錄相同。
4.統(tǒng)計(jì)表:即資料通過統(tǒng)計(jì)匯總,得出許多說明社會(huì)現(xiàn)象和過程的數(shù)字資料,把這些資料按照一定的目的,在表格上表現(xiàn)出來,這種表格就叫統(tǒng)計(jì)表;是資料整理的結(jié)果應(yīng)用最廣泛的形式。
5.L計(jì)算機(jī)資料匯總的步驟
第一,編碼。(主要是建立編碼手冊)第二,登錄。(過錄到資料卡片上) 第三,錄入。(錄入到計(jì)算機(jī)的存儲(chǔ)設(shè)備上)第四,程序編制。(計(jì)算機(jī)輸入指令,指令就是程序)
6. 編碼手冊包含哪些內(nèi)容;包含4個(gè)主要項(xiàng)目:1、序號(hào);2、問題編碼;3、項(xiàng)目名稱;4、編碼的內(nèi)容說明。
7. 研究資料的計(jì)算機(jī)錄入有哪兩類方式,各自有何優(yōu)缺點(diǎn),有兩種方式
a) 固定格式錄入:是指按照固定的位數(shù)和固定的位置去輸入代表每個(gè)變量取值的數(shù)碼;好處是資料錄入員可以集中精力敲擊鍵盤,而不必考慮每個(gè)數(shù)據(jù)應(yīng)該對(duì)應(yīng)哪個(gè)變量,可以提高錄入速度;缺點(diǎn)是先將調(diào)查數(shù)據(jù)轉(zhuǎn)化為固定格式,且卷面登錄和計(jì)算機(jī)錄入時(shí)都要嚴(yán)格注意每個(gè)變量上數(shù)碼的位數(shù)和位置,不能出錯(cuò)
b) 自由格式錄入:是指以一個(gè)個(gè)的變量值為單位直接將數(shù)據(jù)錄入到計(jì)算機(jī)電子表格中;其優(yōu)點(diǎn)是錄入比較直觀,不必轉(zhuǎn)化,而且錄入數(shù)據(jù)錯(cuò)誤也容易發(fā)現(xiàn);
8. 統(tǒng)計(jì)表的種類:按總體分組的情況分:簡單表、分組表(又分為單項(xiàng)分組表和組距分組表)和復(fù)合表(又稱交互分類表)。
9. 統(tǒng)計(jì)表的結(jié)構(gòu):;
a) 從外表形式上看,統(tǒng)計(jì)表由總標(biāo)題(上端中部)、橫行標(biāo)題(左端)、縱欄標(biāo)題(表上方)、指標(biāo)數(shù)值四部分組成。
b) 從內(nèi)容上看,統(tǒng)計(jì)表由主詞和賓詞兩部分構(gòu)成
10. 掌握設(shè)計(jì)統(tǒng)計(jì)表的方法:
1、統(tǒng)計(jì)表形式的設(shè)計(jì);
2、統(tǒng)計(jì)表的內(nèi)容設(shè)計(jì);
3統(tǒng)計(jì)表制表的要點(diǎn):
(在制作統(tǒng)計(jì)表時(shí)應(yīng)注意下列事項(xiàng):首先,文字書寫應(yīng)工整,字跡清晰,數(shù)字應(yīng)填寫整齊,數(shù)位對(duì)準(zhǔn)。其次,當(dāng)數(shù)字為“0”時(shí)要寫出來,如果不應(yīng)有數(shù)字時(shí)應(yīng)用橫短線“-”表示;當(dāng)缺某項(xiàng)數(shù)字或因數(shù)字小可忽略不計(jì)時(shí),用省略號(hào)“…”表示;當(dāng)某項(xiàng)資料應(yīng)免填時(shí),用符號(hào)“X”表示。統(tǒng)計(jì)數(shù)字部分不應(yīng)留下空白。)
第三節(jié) 定量研究資料的統(tǒng)計(jì)分析
1.S社會(huì)研究資料的統(tǒng)計(jì)分析:是采用數(shù)理統(tǒng)計(jì)的方法和技術(shù)對(duì)社會(huì)研究中獲得的資料進(jìn)行定量分析。
2.集中量數(shù):也稱集中趨勢量數(shù),它是用一個(gè)數(shù)值去代表一組數(shù)據(jù)的一般水平。常用的集中量數(shù)有平均數(shù),中位數(shù)和眾數(shù);
3.平均數(shù);是表面一組數(shù)據(jù)的平均水平的數(shù)值。
4.中位數(shù):把一組數(shù)據(jù)按照其大小順序排列起來,處于最中間位置的那個(gè)數(shù)就是中位數(shù),有時(shí)也稱位置平均數(shù);主要用于定序測量
資料中。
5.眾數(shù):是指在一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的標(biāo)志值。
6. 離中量數(shù):描述數(shù)據(jù)離散程度的量數(shù)就是離中量數(shù),也稱差異量數(shù);它是一個(gè)概括性量值,是研究現(xiàn)象差異程度的概括表現(xiàn);它的意義在于闡明被研究現(xiàn)象的差異特征;常用的離中量數(shù)有異眾比率,四分位差和標(biāo)準(zhǔn)差。
7. 異眾比率:是指非眾數(shù)的次數(shù)于總體內(nèi)全部總體單位的比率
8. 四分位差;把一組數(shù)據(jù)按照大小排列成序列,然后分成4個(gè)數(shù)據(jù)數(shù)目相等的段落,各個(gè)段落分界點(diǎn)上的數(shù)叫四分位數(shù);而四分位差就是第三個(gè)四分位數(shù)的值減去第一個(gè)四分?jǐn)?shù)位值
9. 標(biāo)準(zhǔn)差;又叫均方差,是指資料中各個(gè)數(shù)值與算術(shù)平均術(shù)相減之間的平方和的算數(shù)平均數(shù)的平方根;它是用得最多,也是最重要的離中量數(shù)
10. 離散系數(shù);是標(biāo)準(zhǔn)差與算術(shù)平均數(shù)的比值,用百分?jǐn)?shù)表示,它是一個(gè)相對(duì)數(shù),不受單位的限制
11.置信區(qū)間; 通過樣本統(tǒng)計(jì)值去推論總體參數(shù)值存在的范圍。范圍的大小標(biāo)志著推論的精確度。范圍越小,精確度越高
12.置信度; 對(duì)置信區(qū)間進(jìn)行推論時(shí)總體的實(shí)際參數(shù)值真正處于置信區(qū)間中的概率度,即這種推論的可靠性程度
13.抽樣誤差; 由于抽樣而導(dǎo)致的樣本與總體之間在被研究的變量上存在的差異。是隨機(jī)抽樣本身所固有的誤差
14.SPSS是世界的統(tǒng)計(jì)分析軟件之一,也是社會(huì)科學(xué)領(lǐng)域最常用的統(tǒng)計(jì)分析軟件。它于是1968年由3位美國斯坦福大學(xué)的學(xué)生開發(fā)。