2011年統(tǒng)計師《統(tǒng)計相關(guān)知識》之相關(guān)分析與回歸分析(5)

字號:

(4)相關(guān)系數(shù)的顯著性檢驗
    在實際的客觀分析中,相關(guān)系數(shù)一般都是利用樣本數(shù)據(jù)計算的,因而帶有一定的隨機性。樣本容量越小其可信度就越差,因此也需要進行檢驗。相關(guān)系數(shù)的顯著性檢驗問題可分為兩類:一是對總體的相關(guān)系數(shù)是否等于0進行檢驗;二是對總體的相關(guān)系數(shù)是否等于某一個給定的不為0的數(shù)值進行檢驗。限于篇幅,本教材,只對總體相關(guān)系數(shù) 是否等于0進行檢驗。
    數(shù)學(xué)上可以證明,在隨機變量X和Y都服從正態(tài)分布,并且又有p=0的條件下,可以采用t檢驗法來確定r的顯著性。其步驟如下:
    
    3.簡單線性相關(guān)分析的特點
    (1)相關(guān)分析主要是計算一個統(tǒng)計指標(biāo),即相關(guān)系數(shù),反映變量之間關(guān)系的密切程度;
    (2)分析時把兩個變量的地位可以看成是對等的,不用分哪個是自變量,哪個是因變量。直接根據(jù)兩個變量的數(shù)值即可計算相關(guān)系數(shù);
    (3)在存在互為因果關(guān)系的條件下,相關(guān)系數(shù)也只有一個。
    (4)相關(guān)系數(shù)有正負(fù)號,表示相關(guān)的方向;
    (5)計算相關(guān)系數(shù)時,所需的兩個變量的資料都可以是隨機的。
    4.相關(guān)分析中應(yīng)注意的問題
    (1)相關(guān)系數(shù)不能解釋兩變量間的因果關(guān)系
    相關(guān)系數(shù)只是表明兩個變量間互相影響的程度和方向,它并不能說明兩變量間是否有因果關(guān)系,以及何為因,何為果,即使是在相關(guān)系數(shù)非常大時,也并不意味著兩變量間具有顯著的因果關(guān)系。例如,根據(jù)一些人的研究,發(fā)現(xiàn)抽煙與學(xué)習(xí)成績有負(fù)相關(guān)關(guān)系,但不能由此推斷是抽煙導(dǎo)致了成績差。
    因與果在很多情況下是可以互換的。比如,研究發(fā)現(xiàn)收入水平與股票的持有額正相關(guān),并且可以用收入水平作為解釋股票持有額的因素,但是否存在這樣的情況,你賺的錢越多,買的股票也越多,而買的股票越多,賺的錢也就越多,何為因?何為果?眾所周知,經(jīng)濟增長與人口增長相關(guān),可是究竟是經(jīng)濟增長引起人口增長,還是人口增長引起經(jīng)濟增長呢?不能從相關(guān)系數(shù)中得出結(jié)論。
    (2)警惕虛假相關(guān)導(dǎo)致的錯誤結(jié)論
    有時兩變量之間并不存在相關(guān)關(guān)系,但卻可能出現(xiàn)較高的相關(guān)系數(shù)。
    如存在另一個共同影響兩變量的因素。在時間序列資料中往往就會出現(xiàn)這種情況,有人曾對教師薪金的提高和酒價的上漲作了相關(guān)分析,計算得到一個較大的相關(guān)系數(shù),這是否表明教師薪金提高導(dǎo)致酒的消費量增加,從而導(dǎo)致酒價上漲呢?經(jīng)分析,事實是由于經(jīng)濟繁榮導(dǎo)致教師薪金和酒價的上漲,而教師薪金增長和酒價之間并沒有什么直接關(guān)系。
    原因的混雜也可能導(dǎo)致錯誤的結(jié)論。如有人做過計算,發(fā)現(xiàn):在美國,經(jīng)濟學(xué)學(xué)位越高的人,收入越低,籠統(tǒng)地計算學(xué)位與收入之間的相關(guān)系數(shù)會得到負(fù)值。但分別對大學(xué)、政府機構(gòu)、企業(yè)各類別,計算學(xué)位與收入之間的相關(guān)系數(shù)得到的則是正值,即對同一行業(yè)而言,學(xué)位高,收入也高。
    另外,注意不要在相關(guān)關(guān)系據(jù)以成立的數(shù)據(jù)范圍以外,推論這種相關(guān)關(guān)系仍然保持。雨下的多,農(nóng)作物長的好,在缺水地區(qū),干旱季節(jié)雨是一種福音,但雨量太大,卻可能損壞莊稼。又如,廣告投入多,銷售額上漲,利潤增加,但盲目加大廣告投入,卻未必使銷售額再增長,利潤還可能減少。正相關(guān)達到某個極限,就可能變成負(fù)相關(guān)。這個道理似乎人人都明白,但在分析問題時卻容易忽視。