四、統(tǒng)計描述與統(tǒng)計推斷
統(tǒng)計的主要工作就是對統(tǒng)計數(shù)據(jù)進行統(tǒng)計描述和統(tǒng)計推斷。統(tǒng)計描述是統(tǒng)計分析的最基本內(nèi)容,是指應(yīng)用統(tǒng)計指標(biāo)、統(tǒng)計表、統(tǒng)計圖等方法,對資料的數(shù)量特征及其分布規(guī)律進行測定和描述;而統(tǒng)計推斷是指通過抽樣等方式進行樣本估計總體特征的過程,包括參數(shù)估計和假設(shè)檢驗兩項內(nèi)容。
(一)統(tǒng)計描述
1.計量資料的統(tǒng)計描述
計量資料的統(tǒng)計描述主要通過編制頻數(shù)分布表、計算集中趨勢指標(biāo)和離散趁勢指標(biāo)以及統(tǒng)計圖表來進行。
(1)集中趨勢。指頻數(shù)表中頻數(shù)分布表現(xiàn)為頻數(shù)向某一位置集中的趨勢。
集中趨勢的描述指標(biāo):
1)算術(shù)平均數(shù)。
直接法:
x為觀察值,,z為個數(shù) 加權(quán)法又稱頻數(shù)表法,適用于頻數(shù)表資料,當(dāng)觀察例數(shù)較多時用。
f為各組段的頻數(shù)。
2)幾何平均數(shù)(8e.mebic mean)。幾何平均數(shù)用符號G表示。用于反映一組經(jīng)對數(shù)轉(zhuǎn)換后呈對稱分布的變量值在數(shù)量上的平均水平。
直接法:
加權(quán)法又稱頻數(shù)表法,當(dāng)觀察例數(shù)n較大時,可先編制頻數(shù)分布表,用此法計算幾何平均數(shù):
3)百分位數(shù)(percendle)與中位數(shù)(median)。百分位數(shù)是一種位置指標(biāo),用符號Px表示常用的百分位數(shù)有p2.5、p5、p25、p50、p95、p95、p99.5等,其中p25、p50、p75又稱為四分位數(shù)。百分位數(shù)常用于描述一組觀察值在某百分位置上的水平,多個百分位結(jié)合使用,可更全面地描述資料的分布特征。
中位數(shù)是一個特定的百分位數(shù)即尸s.,用符號M表示。把一組觀察值按從小到大(或從大到?。┑拇涡蚺帕?,位置居于最中央的那個數(shù)據(jù)就是中位數(shù)。中位數(shù)也是反映頻數(shù)分布集中位置的統(tǒng)計指標(biāo),但它只由所處中間位置的部分變量值計算所得,不能反映所有數(shù)值的變化,故中位數(shù)缺乏敏感性。中位數(shù)理論上可用于任何分布類型的資料,但實踐中常用于偏態(tài)分布資料和分布兩端無確定值的資料。其計算方法有直接法和頻數(shù)表法兩種。
直接法:當(dāng)觀察例數(shù)n不大時,此法常用。先將觀察值按大小順序排列,選用下列公式求M.
頻數(shù)表法:當(dāng)觀察例數(shù)n較多時,可先編制頻數(shù)表,再通過頻數(shù)表計算中位數(shù)。
公式為:
式中i是該組段的組距,L為其下限,∑fI為小于L各組的累計頻數(shù),fX為中位數(shù)所在組段的頻數(shù)。
(2)離散趨勢。指頻數(shù)雖然向某一位置集中,但頻數(shù)分布表現(xiàn)為各組段都有頻數(shù)分布,而不是所有頻數(shù)分布在集中位置的趨勢。
常用表示集中趨勢的指標(biāo)有:
1)全距(range)計算公式為:
及=xMAX-Xmin.
全距越大,說明變量的變異程度越大。其度量單位與原變量單位相同。
2)四分位數(shù)間距(quartile)是一組數(shù)值變量值中上四分?jǐn)?shù)(即P75,記為Qu)與下四分
數(shù)(即P25,記為QL)之差,用符號QR表示。計算公式為:
QR=P75一P25
它一般和中位數(shù)一起描述偏態(tài)分布資料的分布特征。
2.計數(shù)資料的統(tǒng)計描述
計數(shù)資料與計量資料的統(tǒng)計描述有所不同,通常采用比、構(gòu)成比、率3類指標(biāo)來描述,這些指標(biāo)都是由兩個指標(biāo)之比構(gòu)成的,所以稱為相對數(shù)。
(1)比(又稱為相對比)。是兩個相關(guān)指標(biāo)之比,說明甲為乙的若干倍或百分之幾。
(2)構(gòu)成比。也叫構(gòu)成指標(biāo),是指一事物內(nèi)部某一組成部分的觀察單位數(shù)與該事物
各組成部分的觀察單位總數(shù)之比,用以說明某一事物內(nèi)部各組成部分所占的比重或分布。
注意:各組成部分的構(gòu)成比之和為100%,某一部分比重增大,則其他部分相應(yīng)減少。
(3)率。是指某種現(xiàn)象在一定條件下,實際發(fā)生的觀察單位數(shù)與可能發(fā)生該現(xiàn)象的總觀察單位數(shù)之比,用以說明某種現(xiàn)象發(fā)生的頻率大小或強度
例如:發(fā)病率、患病率、死亡率、病死率等。
注意:不受其他指標(biāo)的影響;各率相互獨立,其之和不為1(如是則屬巧合)。
應(yīng)用相對數(shù)的注意事項:
1)分析時不能以(構(gòu)成)比代(替)率。
2)計算相對數(shù)時分母不能太小。
3)總率(平均率)的計算:不能直接相加求和。
4)資料的可比性:兩個率要在相同的條件下進行。如研究方法相同、研究對象同質(zhì)觀察時間相等、地區(qū)、民族、年齡、性別等。
(二)統(tǒng)計推斷
通過樣本信息來推斷總體特征就叫統(tǒng)計推斷。參數(shù)估計和假設(shè)檢驗是統(tǒng)計推斷的兩個重要方面。
1.參數(shù)估計
參數(shù)估計就是通過樣本估計總體特征,包括點值估計和區(qū)間估計兩種方法。
(1)點值估計。即直接用樣本均數(shù)作為總體均數(shù)的估計值。
(2)區(qū)間估計??傮w均數(shù)95%可信區(qū)間的含義為由樣本均數(shù)確定的總體均數(shù)所在·
圍包含總體均數(shù)的可能性為95%。根據(jù)樣本均數(shù)符合t分布的特點,利用f分布曲線下的面積規(guī)律估計出總體均數(shù)可能落在的區(qū)間和范圍。當(dāng)樣本含量較大時,可用u分布代替。
2.假設(shè)檢驗
假設(shè)檢驗是用來判斷樣本與樣本,樣本與總體的差異是由抽樣誤差引起還是本質(zhì)差別造成的統(tǒng)計推斷方法。
(1)假設(shè)檢驗的基本思想。假設(shè)檢驗的基本思想是小概率反證法思想。小概率思想是指小概率事件(P30)時,樣本均數(shù)符合正態(tài)分布,故可用U檢驗進行分析。當(dāng)樣本含量n小時,若觀察值x符合正態(tài)分布,則用t檢驗(因此時樣本均數(shù)符合t分布),當(dāng)x為未知分布時應(yīng)采用秩和檢驗。
(1)樣本均數(shù)與總體均數(shù)比較的t檢驗。樣本均數(shù)與總體均數(shù)比較的t檢驗實際上是推斷該樣本來自的總體均數(shù)μ與已知的某一總體均數(shù)μ0(常為理論值或標(biāo)準(zhǔn)值)有無差別。如根據(jù)大量調(diào)查,已知健康成年男性的脈搏均數(shù)為72次/分,某醫(yī)生在一山區(qū)隨即抽查了25名健康男性,求得其脈搏均數(shù)為74.2次/分,標(biāo)準(zhǔn)差為6.0次/分,問是否能據(jù)此認(rèn)為該山區(qū)成年男性的脈搏均數(shù)高于一般成年男性。
上述兩個均數(shù)不等既可能是抽樣誤差所致,也有可能真是環(huán)境差異的影響,為此,可用t檢驗進行判斷,檢驗過程如下:
1)建立假設(shè)
h0:μ=μo=72次/分,H1:μ>盧μ0,檢驗水準(zhǔn)為單側(cè)0.05.
2)計算統(tǒng)計量。進行樣本均數(shù)與總體均數(shù)比較的t檢驗時t值為樣本均數(shù)與總體均數(shù)差值的絕對值除以標(biāo)準(zhǔn)誤的商,其中標(biāo)準(zhǔn)誤為標(biāo)準(zhǔn)差除以樣本含量算術(shù)平方根的商。
3)確定概率,作出判斷。以自由度v(樣本含量n減1)查t界值表,0.025
應(yīng)注意的是,當(dāng)樣本含量“較大時,可用”檢驗代替f檢驗。
(2)配對設(shè)計的,檢驗。配對設(shè)計是一種比較特殊的設(shè)計方式,能夠很好地控制非實驗因素對結(jié)果的影響,有自身配對和非自身配對之分。配對設(shè)計資料的,檢驗實際上是用配對差值與總體均數(shù)“o”進行比較,即推斷差數(shù)的總體均數(shù)是否為“o”。故其檢驗過程與樣本均數(shù)與總體均數(shù)比較的f檢驗類似,即:
1)建立假設(shè)
Ho:ud=0,即差值的總體均數(shù)為“0”,H1:μd>0或μd=0.05,則還不能拒絕Ho.
(3)成組設(shè)計兩樣本均數(shù)比較的,檢驗。成組設(shè)計兩樣本均數(shù)比較的t檢驗又稱成組比較或完全隨機設(shè)計的t檢驗,其目的是推斷兩個樣本分別代表的總體均數(shù)是否相等。其檢驗過程與上述兩種;檢驗也沒有大的差別,只是假設(shè)的表達和t值的計算公式不同。
兩樣本均數(shù)比較的,檢驗,其假設(shè)一般為:Ho:μ1=μ2,即兩樣本來自的總體均數(shù)相等,H1:μ1>μ2或μ1<μ2,即兩樣本來自的總體均數(shù)不相等,檢驗水準(zhǔn)為0.05.
計算t統(tǒng)計量時是用兩樣本均數(shù)差值的絕對值除以兩樣本均數(shù)差值的標(biāo)準(zhǔn)誤。
應(yīng)注意的是當(dāng)樣本含量n較大時(如大于100時)可用“檢驗代替,檢驗,此時”值的汁算公式較,值的計算公式要簡單的多,
(4)t檢驗的應(yīng)用條件和注意事項,兩個小樣本均數(shù)比較的,檢驗有以下應(yīng)用條件:
1)兩樣本來白的總體均符合正態(tài)分布。
2)兩樣本來白的總體方差齊。
故在進行兩小樣本均數(shù)比較的f檢驗之前,要用方差齊性檢驗來推斷兩樣本代表的總體方差是否相等,方差齊性檢驗的方法使用F檢驗,其原理是看較大樣本方差與較小樣本方差的商是否接近“1”。若接近“1”,則可認(rèn)為兩樣本代表的總體方差齊。判斷兩樣本來白的總體是否符合正態(tài)分布,可用正態(tài)性檢驗的方法。
若兩樣本來白的總體方差不齊,也不符合正態(tài)分布,對符合對數(shù)正態(tài)分布的資料可用其幾何均數(shù)進行,檢驗,對其他資料可用f,檢驗或秩和檢驗進行分析。
(二)計數(shù)資料的統(tǒng)計分析
計數(shù)資料可采用的分析方法有相對數(shù)計算、二項分布、x2檢驗,下面以x2檢驗為例進行介紹,
1.x2檢驗
卡方檢驗是用途很廣的一種假設(shè)檢驗方法,這里主要介紹它在分類資料統(tǒng)計推斷中的應(yīng)用,包括:兩個率或兩個構(gòu)成比比較的卡方檢驗;多個率或多個構(gòu)成比比較的卡方檢驗
以及分類資料的相關(guān)分析等。
(1)卡方檢驗基本思想。在分類資料統(tǒng)計分析中常會遇到這樣的資料。
(2)四格表資料的卡方檢驗。四格表資料的卡方檢驗用于進行兩個率或兩個構(gòu)成比的比較。
1)專用公式。若四格表資料四個格子的頻數(shù)分別為o,b,c,d,則四格表資料卡方檢驗的卡方值=(ad-bc)2xn/(a+b)(c+d)(a+c)(b+d),自由度v=(行數(shù)-1)(列數(shù)-1)。
2)應(yīng)用條件。要求樣本含量應(yīng)大于40且每個格子中的理論頻數(shù)不應(yīng)小于5.當(dāng)樣本含量大于40但理論頻數(shù)有小于5的情況時卡方值需要校正,當(dāng)樣本含量小于40時只能用確切概率法計算概率,
(3)行x列表資料的卡方檢驗
行x列表資料的卡方檢驗用于多個率或多個構(gòu)成比的比較。
1)專用公式。r行c列表資料卡方檢驗的卡方陣n((A11/nlnl+A12/nih2+……+Arc/nrnc)-l
2)應(yīng)用條件。要求每個格子中的理論頻數(shù)了均大于5或1 (4)列聯(lián)表資料的卡方檢驗。同一組對象,觀察每一個個體對兩種分類方法的表現(xiàn),
結(jié)果構(gòu)成雙向交叉排列的統(tǒng)計表就是列聯(lián)表。
①只xC列聯(lián)表的卡方檢驗。只xC列聯(lián)表的卡方檢驗用于RxC列聯(lián)表的相關(guān)分析卡方值的計算和檢驗過程與行x列表資料的卡方檢驗相同。
②2X2列聯(lián)表的卡方檢驗:
2x2列聯(lián)表的卡方檢驗又稱配對記數(shù)資料或配對四格表資料的卡方檢驗,根據(jù)卡方值計算公式的不同,可以達到不同的目的。當(dāng)用一般四格表的卡方檢驗計算時,卡方值:(ad-bc)2n/(a+b)(c+d)(a+c)(b+d),此時用于進行配對四格表的相關(guān)分析,如考察兩種檢驗方法的結(jié)果有無關(guān)系;當(dāng)卡方值:(1b-cl-1)2/(b+c)時,此時卡方檢驗用來進行四格表的差異檢驗,如考察兩種檢驗方法的檢出率有無差別。
列聯(lián)表卡方檢驗應(yīng)用中的注意事項同及XC表的卡方檢驗相同。
小結(jié):本講講述了“統(tǒng)計基礎(chǔ)”和“職業(yè)衛(wèi)生統(tǒng)計”的有關(guān)內(nèi)容。要求重點學(xué)習(xí):統(tǒng)計的原理和方法;常用統(tǒng)計圖表的編制;職業(yè)危害統(tǒng)計指標(biāo)等內(nèi)容。
統(tǒng)計的主要工作就是對統(tǒng)計數(shù)據(jù)進行統(tǒng)計描述和統(tǒng)計推斷。統(tǒng)計描述是統(tǒng)計分析的最基本內(nèi)容,是指應(yīng)用統(tǒng)計指標(biāo)、統(tǒng)計表、統(tǒng)計圖等方法,對資料的數(shù)量特征及其分布規(guī)律進行測定和描述;而統(tǒng)計推斷是指通過抽樣等方式進行樣本估計總體特征的過程,包括參數(shù)估計和假設(shè)檢驗兩項內(nèi)容。
(一)統(tǒng)計描述
1.計量資料的統(tǒng)計描述
計量資料的統(tǒng)計描述主要通過編制頻數(shù)分布表、計算集中趨勢指標(biāo)和離散趁勢指標(biāo)以及統(tǒng)計圖表來進行。
(1)集中趨勢。指頻數(shù)表中頻數(shù)分布表現(xiàn)為頻數(shù)向某一位置集中的趨勢。
集中趨勢的描述指標(biāo):
1)算術(shù)平均數(shù)。
直接法:
x為觀察值,,z為個數(shù) 加權(quán)法又稱頻數(shù)表法,適用于頻數(shù)表資料,當(dāng)觀察例數(shù)較多時用。
f為各組段的頻數(shù)。
2)幾何平均數(shù)(8e.mebic mean)。幾何平均數(shù)用符號G表示。用于反映一組經(jīng)對數(shù)轉(zhuǎn)換后呈對稱分布的變量值在數(shù)量上的平均水平。
直接法:
加權(quán)法又稱頻數(shù)表法,當(dāng)觀察例數(shù)n較大時,可先編制頻數(shù)分布表,用此法計算幾何平均數(shù):
3)百分位數(shù)(percendle)與中位數(shù)(median)。百分位數(shù)是一種位置指標(biāo),用符號Px表示常用的百分位數(shù)有p2.5、p5、p25、p50、p95、p95、p99.5等,其中p25、p50、p75又稱為四分位數(shù)。百分位數(shù)常用于描述一組觀察值在某百分位置上的水平,多個百分位結(jié)合使用,可更全面地描述資料的分布特征。
中位數(shù)是一個特定的百分位數(shù)即尸s.,用符號M表示。把一組觀察值按從小到大(或從大到?。┑拇涡蚺帕?,位置居于最中央的那個數(shù)據(jù)就是中位數(shù)。中位數(shù)也是反映頻數(shù)分布集中位置的統(tǒng)計指標(biāo),但它只由所處中間位置的部分變量值計算所得,不能反映所有數(shù)值的變化,故中位數(shù)缺乏敏感性。中位數(shù)理論上可用于任何分布類型的資料,但實踐中常用于偏態(tài)分布資料和分布兩端無確定值的資料。其計算方法有直接法和頻數(shù)表法兩種。
直接法:當(dāng)觀察例數(shù)n不大時,此法常用。先將觀察值按大小順序排列,選用下列公式求M.
頻數(shù)表法:當(dāng)觀察例數(shù)n較多時,可先編制頻數(shù)表,再通過頻數(shù)表計算中位數(shù)。
公式為:
式中i是該組段的組距,L為其下限,∑fI為小于L各組的累計頻數(shù),fX為中位數(shù)所在組段的頻數(shù)。
(2)離散趨勢。指頻數(shù)雖然向某一位置集中,但頻數(shù)分布表現(xiàn)為各組段都有頻數(shù)分布,而不是所有頻數(shù)分布在集中位置的趨勢。
常用表示集中趨勢的指標(biāo)有:
1)全距(range)計算公式為:
及=xMAX-Xmin.
全距越大,說明變量的變異程度越大。其度量單位與原變量單位相同。
2)四分位數(shù)間距(quartile)是一組數(shù)值變量值中上四分?jǐn)?shù)(即P75,記為Qu)與下四分
數(shù)(即P25,記為QL)之差,用符號QR表示。計算公式為:
QR=P75一P25
它一般和中位數(shù)一起描述偏態(tài)分布資料的分布特征。
2.計數(shù)資料的統(tǒng)計描述
計數(shù)資料與計量資料的統(tǒng)計描述有所不同,通常采用比、構(gòu)成比、率3類指標(biāo)來描述,這些指標(biāo)都是由兩個指標(biāo)之比構(gòu)成的,所以稱為相對數(shù)。
(1)比(又稱為相對比)。是兩個相關(guān)指標(biāo)之比,說明甲為乙的若干倍或百分之幾。
(2)構(gòu)成比。也叫構(gòu)成指標(biāo),是指一事物內(nèi)部某一組成部分的觀察單位數(shù)與該事物
各組成部分的觀察單位總數(shù)之比,用以說明某一事物內(nèi)部各組成部分所占的比重或分布。
注意:各組成部分的構(gòu)成比之和為100%,某一部分比重增大,則其他部分相應(yīng)減少。
(3)率。是指某種現(xiàn)象在一定條件下,實際發(fā)生的觀察單位數(shù)與可能發(fā)生該現(xiàn)象的總觀察單位數(shù)之比,用以說明某種現(xiàn)象發(fā)生的頻率大小或強度
例如:發(fā)病率、患病率、死亡率、病死率等。
注意:不受其他指標(biāo)的影響;各率相互獨立,其之和不為1(如是則屬巧合)。
應(yīng)用相對數(shù)的注意事項:
1)分析時不能以(構(gòu)成)比代(替)率。
2)計算相對數(shù)時分母不能太小。
3)總率(平均率)的計算:不能直接相加求和。
4)資料的可比性:兩個率要在相同的條件下進行。如研究方法相同、研究對象同質(zhì)觀察時間相等、地區(qū)、民族、年齡、性別等。
(二)統(tǒng)計推斷
通過樣本信息來推斷總體特征就叫統(tǒng)計推斷。參數(shù)估計和假設(shè)檢驗是統(tǒng)計推斷的兩個重要方面。
1.參數(shù)估計
參數(shù)估計就是通過樣本估計總體特征,包括點值估計和區(qū)間估計兩種方法。
(1)點值估計。即直接用樣本均數(shù)作為總體均數(shù)的估計值。
(2)區(qū)間估計??傮w均數(shù)95%可信區(qū)間的含義為由樣本均數(shù)確定的總體均數(shù)所在·
圍包含總體均數(shù)的可能性為95%。根據(jù)樣本均數(shù)符合t分布的特點,利用f分布曲線下的面積規(guī)律估計出總體均數(shù)可能落在的區(qū)間和范圍。當(dāng)樣本含量較大時,可用u分布代替。
2.假設(shè)檢驗
假設(shè)檢驗是用來判斷樣本與樣本,樣本與總體的差異是由抽樣誤差引起還是本質(zhì)差別造成的統(tǒng)計推斷方法。
(1)假設(shè)檢驗的基本思想。假設(shè)檢驗的基本思想是小概率反證法思想。小概率思想是指小概率事件(P30)時,樣本均數(shù)符合正態(tài)分布,故可用U檢驗進行分析。當(dāng)樣本含量n小時,若觀察值x符合正態(tài)分布,則用t檢驗(因此時樣本均數(shù)符合t分布),當(dāng)x為未知分布時應(yīng)采用秩和檢驗。
(1)樣本均數(shù)與總體均數(shù)比較的t檢驗。樣本均數(shù)與總體均數(shù)比較的t檢驗實際上是推斷該樣本來自的總體均數(shù)μ與已知的某一總體均數(shù)μ0(常為理論值或標(biāo)準(zhǔn)值)有無差別。如根據(jù)大量調(diào)查,已知健康成年男性的脈搏均數(shù)為72次/分,某醫(yī)生在一山區(qū)隨即抽查了25名健康男性,求得其脈搏均數(shù)為74.2次/分,標(biāo)準(zhǔn)差為6.0次/分,問是否能據(jù)此認(rèn)為該山區(qū)成年男性的脈搏均數(shù)高于一般成年男性。
上述兩個均數(shù)不等既可能是抽樣誤差所致,也有可能真是環(huán)境差異的影響,為此,可用t檢驗進行判斷,檢驗過程如下:
1)建立假設(shè)
h0:μ=μo=72次/分,H1:μ>盧μ0,檢驗水準(zhǔn)為單側(cè)0.05.
2)計算統(tǒng)計量。進行樣本均數(shù)與總體均數(shù)比較的t檢驗時t值為樣本均數(shù)與總體均數(shù)差值的絕對值除以標(biāo)準(zhǔn)誤的商,其中標(biāo)準(zhǔn)誤為標(biāo)準(zhǔn)差除以樣本含量算術(shù)平方根的商。
3)確定概率,作出判斷。以自由度v(樣本含量n減1)查t界值表,0.025
應(yīng)注意的是,當(dāng)樣本含量“較大時,可用”檢驗代替f檢驗。
(2)配對設(shè)計的,檢驗。配對設(shè)計是一種比較特殊的設(shè)計方式,能夠很好地控制非實驗因素對結(jié)果的影響,有自身配對和非自身配對之分。配對設(shè)計資料的,檢驗實際上是用配對差值與總體均數(shù)“o”進行比較,即推斷差數(shù)的總體均數(shù)是否為“o”。故其檢驗過程與樣本均數(shù)與總體均數(shù)比較的f檢驗類似,即:
1)建立假設(shè)
Ho:ud=0,即差值的總體均數(shù)為“0”,H1:μd>0或μd=0.05,則還不能拒絕Ho.
(3)成組設(shè)計兩樣本均數(shù)比較的,檢驗。成組設(shè)計兩樣本均數(shù)比較的t檢驗又稱成組比較或完全隨機設(shè)計的t檢驗,其目的是推斷兩個樣本分別代表的總體均數(shù)是否相等。其檢驗過程與上述兩種;檢驗也沒有大的差別,只是假設(shè)的表達和t值的計算公式不同。
兩樣本均數(shù)比較的,檢驗,其假設(shè)一般為:Ho:μ1=μ2,即兩樣本來自的總體均數(shù)相等,H1:μ1>μ2或μ1<μ2,即兩樣本來自的總體均數(shù)不相等,檢驗水準(zhǔn)為0.05.
計算t統(tǒng)計量時是用兩樣本均數(shù)差值的絕對值除以兩樣本均數(shù)差值的標(biāo)準(zhǔn)誤。
應(yīng)注意的是當(dāng)樣本含量n較大時(如大于100時)可用“檢驗代替,檢驗,此時”值的汁算公式較,值的計算公式要簡單的多,
(4)t檢驗的應(yīng)用條件和注意事項,兩個小樣本均數(shù)比較的,檢驗有以下應(yīng)用條件:
1)兩樣本來白的總體均符合正態(tài)分布。
2)兩樣本來白的總體方差齊。
故在進行兩小樣本均數(shù)比較的f檢驗之前,要用方差齊性檢驗來推斷兩樣本代表的總體方差是否相等,方差齊性檢驗的方法使用F檢驗,其原理是看較大樣本方差與較小樣本方差的商是否接近“1”。若接近“1”,則可認(rèn)為兩樣本代表的總體方差齊。判斷兩樣本來白的總體是否符合正態(tài)分布,可用正態(tài)性檢驗的方法。
若兩樣本來白的總體方差不齊,也不符合正態(tài)分布,對符合對數(shù)正態(tài)分布的資料可用其幾何均數(shù)進行,檢驗,對其他資料可用f,檢驗或秩和檢驗進行分析。
(二)計數(shù)資料的統(tǒng)計分析
計數(shù)資料可采用的分析方法有相對數(shù)計算、二項分布、x2檢驗,下面以x2檢驗為例進行介紹,
1.x2檢驗
卡方檢驗是用途很廣的一種假設(shè)檢驗方法,這里主要介紹它在分類資料統(tǒng)計推斷中的應(yīng)用,包括:兩個率或兩個構(gòu)成比比較的卡方檢驗;多個率或多個構(gòu)成比比較的卡方檢驗
以及分類資料的相關(guān)分析等。
(1)卡方檢驗基本思想。在分類資料統(tǒng)計分析中常會遇到這樣的資料。
(2)四格表資料的卡方檢驗。四格表資料的卡方檢驗用于進行兩個率或兩個構(gòu)成比的比較。
1)專用公式。若四格表資料四個格子的頻數(shù)分別為o,b,c,d,則四格表資料卡方檢驗的卡方值=(ad-bc)2xn/(a+b)(c+d)(a+c)(b+d),自由度v=(行數(shù)-1)(列數(shù)-1)。
2)應(yīng)用條件。要求樣本含量應(yīng)大于40且每個格子中的理論頻數(shù)不應(yīng)小于5.當(dāng)樣本含量大于40但理論頻數(shù)有小于5的情況時卡方值需要校正,當(dāng)樣本含量小于40時只能用確切概率法計算概率,
(3)行x列表資料的卡方檢驗
行x列表資料的卡方檢驗用于多個率或多個構(gòu)成比的比較。
1)專用公式。r行c列表資料卡方檢驗的卡方陣n((A11/nlnl+A12/nih2+……+Arc/nrnc)-l
2)應(yīng)用條件。要求每個格子中的理論頻數(shù)了均大于5或1 (4)列聯(lián)表資料的卡方檢驗。同一組對象,觀察每一個個體對兩種分類方法的表現(xiàn),
結(jié)果構(gòu)成雙向交叉排列的統(tǒng)計表就是列聯(lián)表。
①只xC列聯(lián)表的卡方檢驗。只xC列聯(lián)表的卡方檢驗用于RxC列聯(lián)表的相關(guān)分析卡方值的計算和檢驗過程與行x列表資料的卡方檢驗相同。
②2X2列聯(lián)表的卡方檢驗:
2x2列聯(lián)表的卡方檢驗又稱配對記數(shù)資料或配對四格表資料的卡方檢驗,根據(jù)卡方值計算公式的不同,可以達到不同的目的。當(dāng)用一般四格表的卡方檢驗計算時,卡方值:(ad-bc)2n/(a+b)(c+d)(a+c)(b+d),此時用于進行配對四格表的相關(guān)分析,如考察兩種檢驗方法的結(jié)果有無關(guān)系;當(dāng)卡方值:(1b-cl-1)2/(b+c)時,此時卡方檢驗用來進行四格表的差異檢驗,如考察兩種檢驗方法的檢出率有無差別。
列聯(lián)表卡方檢驗應(yīng)用中的注意事項同及XC表的卡方檢驗相同。
小結(jié):本講講述了“統(tǒng)計基礎(chǔ)”和“職業(yè)衛(wèi)生統(tǒng)計”的有關(guān)內(nèi)容。要求重點學(xué)習(xí):統(tǒng)計的原理和方法;常用統(tǒng)計圖表的編制;職業(yè)危害統(tǒng)計指標(biāo)等內(nèi)容。