統(tǒng)計師《統(tǒng)計基礎(chǔ)知識》輔導(dǎo):相關(guān)分析與回歸分析(4)

字號:

(4)相關(guān)系數(shù)的顯著性檢驗
    在實際的客觀分析中,相關(guān)系數(shù)一般都是利用樣本數(shù)據(jù)計算的,因而帶有一定的隨機性。樣本容量越小其可信度就越差,因此也需要進行檢驗。相關(guān)系數(shù)的顯著性檢驗問題可分為兩類:一是對總體的相關(guān)系數(shù)是否等于0進行檢驗;二是對總體的相關(guān)系數(shù)是否等于某一個給定的不為0的數(shù)值進行檢驗。限于篇幅,本教材,只對總體相關(guān)系數(shù)p是否等于0進行檢驗。
    數(shù)學(xué)上可以證明,在隨機變量X和Y都服從正態(tài)分布,并且又有p=0的條件下,可以采用t檢驗法來確定r的顯著性。其步驟如下:
    ①提出假設(shè): :r = 0 ; : r ¹ 0
    
    
    3.簡單線性相關(guān)分析的特點
    (1)相關(guān)分析主要是計算一個統(tǒng)計指標(biāo),即相關(guān)系數(shù),反映變量之間關(guān)系的密切程度;
    (2)分析時把兩個變量的地位可以看成是對等的,不用分哪個是自變量,哪個是因變量。直接根據(jù)兩個變量的數(shù)值即可計算相關(guān)系數(shù);
    (3)在存在互為因果關(guān)系的條件下,相關(guān)系數(shù)也只有一個。
    (4)相關(guān)系數(shù)有正負(fù)號,表示相關(guān)的方向;
    (5)計算相關(guān)系數(shù)時,所需的兩個變量的資料都可以是隨機的。
    4.相關(guān)分析中應(yīng)注意的問題
    (1)相關(guān)系數(shù)不能解釋兩變量間的因果關(guān)系
    相關(guān)系數(shù)只是表明兩個變量間互相影響的程度和方向,它并不能說明兩變量間是否有因果關(guān)系,以及何為因,何為果,即使是在相關(guān)系數(shù)非常大時,也并不意味著兩變量間具有顯著的因果關(guān)系。例如,根據(jù)一些人的研究,發(fā)現(xiàn)抽煙與學(xué)習(xí)成績有負(fù)相關(guān)關(guān)系,但不能由此推斷是抽煙導(dǎo)致了成績差。
    因與果在很多情況下是可以互換的。比如,研究發(fā)現(xiàn)收入水平與股票的持有額正相關(guān),并且可以用收入水平作為解釋股票持有額的因素,但是否存在這樣的情況,你賺的錢越多,買的股票也越多,而買的股票越多,賺的錢也就越多,何為因?何為果?眾所周知,經(jīng)濟增長與人口增長相關(guān),可是究竟是經(jīng)濟增長引起人口增長,還是人口增長引起經(jīng)濟增長呢?不能從相關(guān)系數(shù)中得出結(jié)論。
    (2)警惕虛假相關(guān)導(dǎo)致的錯誤結(jié)論
    有時兩變量之間并不存在相關(guān)關(guān)系,但卻可能出現(xiàn)較高的相關(guān)系數(shù)。
    如存在另一個共同影響兩變量的因素。在時間序列資料中往往就會出現(xiàn)這種情況,有人曾對教師薪金的提高和酒價的上漲作了相關(guān)分析,計算得到一個較大的相關(guān)系數(shù),這是否表明教師薪金提高導(dǎo)致酒的消費量增加,從而導(dǎo)致酒價上漲呢?經(jīng)分析,事實是由于經(jīng)濟繁榮導(dǎo)致教師薪金和酒價的上漲,而教師薪金增長和酒價之間并沒有什么直接關(guān)系。