(4)相關(guān)系數(shù)的顯著性檢驗(yàn)
在實(shí)際的客觀分析中,相關(guān)系數(shù)一般都是利用樣本數(shù)據(jù)計(jì)算的,因而帶有一定的隨機(jī)性。樣本容量越小其可信度就越差,因此也需要進(jìn)行檢驗(yàn)。相關(guān)系數(shù)的顯著性檢驗(yàn)問題可分為兩類:一是對(duì)總體的相關(guān)系數(shù)是否等于0進(jìn)行檢驗(yàn);二是對(duì)總體的相關(guān)系數(shù)是否等于某一個(gè)給定的不為0的數(shù)值進(jìn)行檢驗(yàn)。限于篇幅,本教材,只對(duì)總體相關(guān)系數(shù) 是否等于0進(jìn)行檢驗(yàn)。
數(shù)學(xué)上可以證明,在隨機(jī)變量X和Y都服從正態(tài)分布,并且又有p=0的條件下,可以采用t檢驗(yàn)法來確定r的顯著性。其步驟如下:

3.簡單線性相關(guān)分析的特點(diǎn)
(1)相關(guān)分析主要是計(jì)算一個(gè)統(tǒng)計(jì)指標(biāo),即相關(guān)系數(shù),反映變量之間關(guān)系的密切程度;
(2)分析時(shí)把兩個(gè)變量的地位可以看成是對(duì)等的,不用分哪個(gè)是自變量,哪個(gè)是因變量。直接根據(jù)兩個(gè)變量的數(shù)值即可計(jì)算相關(guān)系數(shù);
(3)在存在互為因果關(guān)系的條件下,相關(guān)系數(shù)也只有一個(gè)。
(4)相關(guān)系數(shù)有正負(fù)號(hào),表示相關(guān)的方向;
(5)計(jì)算相關(guān)系數(shù)時(shí),所需的兩個(gè)變量的資料都可以是隨機(jī)的。
4.相關(guān)分析中應(yīng)注意的問題
(1)相關(guān)系數(shù)不能解釋兩變量間的因果關(guān)系
相關(guān)系數(shù)只是表明兩個(gè)變量間互相影響的程度和方向,它并不能說明兩變量間是否有因果關(guān)系,以及何為因,何為果,即使是在相關(guān)系數(shù)非常大時(shí),也并不意味著兩變量間具有顯著的因果關(guān)系。例如,根據(jù)一些人的研究,發(fā)現(xiàn)抽煙與學(xué)習(xí)成績有負(fù)相關(guān)關(guān)系,但不能由此推斷是抽煙導(dǎo)致了成績差。
因與果在很多情況下是可以互換的。比如,研究發(fā)現(xiàn)收入水平與股票的持有額正相關(guān),并且可以用收入水平作為解釋股票持有額的因素,但是否存在這樣的情況,你賺的錢越多,買的股票也越多,而買的股票越多,賺的錢也就越多,何為因?何為果?眾所周知,經(jīng)濟(jì)增長與人口增長相關(guān),可是究竟是經(jīng)濟(jì)增長引起人口增長,還是人口增長引起經(jīng)濟(jì)增長呢?不能從相關(guān)系數(shù)中得出結(jié)論。
(2)警惕虛假相關(guān)導(dǎo)致的錯(cuò)誤結(jié)論
有時(shí)兩變量之間并不存在相關(guān)關(guān)系,但卻可能出現(xiàn)較高的相關(guān)系數(shù)。
如存在另一個(gè)共同影響兩變量的因素。在時(shí)間序列資料中往往就會(huì)出現(xiàn)這種情況,有人曾對(duì)教師薪金的提高和酒價(jià)的上漲作了相關(guān)分析,計(jì)算得到一個(gè)較大的相關(guān)系數(shù),這是否表明教師薪金提高導(dǎo)致酒的消費(fèi)量增加,從而導(dǎo)致酒價(jià)上漲呢?經(jīng)分析,事實(shí)是由于經(jīng)濟(jì)繁榮導(dǎo)致教師薪金和酒價(jià)的上漲,而教師薪金增長和酒價(jià)之間并沒有什么直接關(guān)系。
原因的混雜也可能導(dǎo)致錯(cuò)誤的結(jié)論。如有人做過計(jì)算,發(fā)現(xiàn):在美國,經(jīng)濟(jì)學(xué)學(xué)位越高的人,收入越低,籠統(tǒng)地計(jì)算學(xué)位與收入之間的相關(guān)系數(shù)會(huì)得到負(fù)值。但分別對(duì)大學(xué)、政府機(jī)構(gòu)、企業(yè)各類別,計(jì)算學(xué)位與收入之間的相關(guān)系數(shù)得到的則是正值,即對(duì)同一行業(yè)而言,學(xué)位高,收入也高。
另外,注意不要在相關(guān)關(guān)系據(jù)以成立的數(shù)據(jù)范圍以外,推論這種相關(guān)關(guān)系仍然保持。雨下的多,農(nóng)作物長的好,在缺水地區(qū),干旱季節(jié)雨是一種福音,但雨量太大,卻可能損壞莊稼。又如,廣告投入多,銷售額上漲,利潤增加,但盲目加大廣告投入,卻未必使銷售額再增長,利潤還可能減少。正相關(guān)達(dá)到某個(gè)極限,就可能變成負(fù)相關(guān)。這個(gè)道理似乎人人都明白,但在分析問題時(shí)卻容易忽視。
在實(shí)際的客觀分析中,相關(guān)系數(shù)一般都是利用樣本數(shù)據(jù)計(jì)算的,因而帶有一定的隨機(jī)性。樣本容量越小其可信度就越差,因此也需要進(jìn)行檢驗(yàn)。相關(guān)系數(shù)的顯著性檢驗(yàn)問題可分為兩類:一是對(duì)總體的相關(guān)系數(shù)是否等于0進(jìn)行檢驗(yàn);二是對(duì)總體的相關(guān)系數(shù)是否等于某一個(gè)給定的不為0的數(shù)值進(jìn)行檢驗(yàn)。限于篇幅,本教材,只對(duì)總體相關(guān)系數(shù) 是否等于0進(jìn)行檢驗(yàn)。
數(shù)學(xué)上可以證明,在隨機(jī)變量X和Y都服從正態(tài)分布,并且又有p=0的條件下,可以采用t檢驗(yàn)法來確定r的顯著性。其步驟如下:

3.簡單線性相關(guān)分析的特點(diǎn)
(1)相關(guān)分析主要是計(jì)算一個(gè)統(tǒng)計(jì)指標(biāo),即相關(guān)系數(shù),反映變量之間關(guān)系的密切程度;
(2)分析時(shí)把兩個(gè)變量的地位可以看成是對(duì)等的,不用分哪個(gè)是自變量,哪個(gè)是因變量。直接根據(jù)兩個(gè)變量的數(shù)值即可計(jì)算相關(guān)系數(shù);
(3)在存在互為因果關(guān)系的條件下,相關(guān)系數(shù)也只有一個(gè)。
(4)相關(guān)系數(shù)有正負(fù)號(hào),表示相關(guān)的方向;
(5)計(jì)算相關(guān)系數(shù)時(shí),所需的兩個(gè)變量的資料都可以是隨機(jī)的。
4.相關(guān)分析中應(yīng)注意的問題
(1)相關(guān)系數(shù)不能解釋兩變量間的因果關(guān)系
相關(guān)系數(shù)只是表明兩個(gè)變量間互相影響的程度和方向,它并不能說明兩變量間是否有因果關(guān)系,以及何為因,何為果,即使是在相關(guān)系數(shù)非常大時(shí),也并不意味著兩變量間具有顯著的因果關(guān)系。例如,根據(jù)一些人的研究,發(fā)現(xiàn)抽煙與學(xué)習(xí)成績有負(fù)相關(guān)關(guān)系,但不能由此推斷是抽煙導(dǎo)致了成績差。
因與果在很多情況下是可以互換的。比如,研究發(fā)現(xiàn)收入水平與股票的持有額正相關(guān),并且可以用收入水平作為解釋股票持有額的因素,但是否存在這樣的情況,你賺的錢越多,買的股票也越多,而買的股票越多,賺的錢也就越多,何為因?何為果?眾所周知,經(jīng)濟(jì)增長與人口增長相關(guān),可是究竟是經(jīng)濟(jì)增長引起人口增長,還是人口增長引起經(jīng)濟(jì)增長呢?不能從相關(guān)系數(shù)中得出結(jié)論。
(2)警惕虛假相關(guān)導(dǎo)致的錯(cuò)誤結(jié)論
有時(shí)兩變量之間并不存在相關(guān)關(guān)系,但卻可能出現(xiàn)較高的相關(guān)系數(shù)。
如存在另一個(gè)共同影響兩變量的因素。在時(shí)間序列資料中往往就會(huì)出現(xiàn)這種情況,有人曾對(duì)教師薪金的提高和酒價(jià)的上漲作了相關(guān)分析,計(jì)算得到一個(gè)較大的相關(guān)系數(shù),這是否表明教師薪金提高導(dǎo)致酒的消費(fèi)量增加,從而導(dǎo)致酒價(jià)上漲呢?經(jīng)分析,事實(shí)是由于經(jīng)濟(jì)繁榮導(dǎo)致教師薪金和酒價(jià)的上漲,而教師薪金增長和酒價(jià)之間并沒有什么直接關(guān)系。
原因的混雜也可能導(dǎo)致錯(cuò)誤的結(jié)論。如有人做過計(jì)算,發(fā)現(xiàn):在美國,經(jīng)濟(jì)學(xué)學(xué)位越高的人,收入越低,籠統(tǒng)地計(jì)算學(xué)位與收入之間的相關(guān)系數(shù)會(huì)得到負(fù)值。但分別對(duì)大學(xué)、政府機(jī)構(gòu)、企業(yè)各類別,計(jì)算學(xué)位與收入之間的相關(guān)系數(shù)得到的則是正值,即對(duì)同一行業(yè)而言,學(xué)位高,收入也高。
另外,注意不要在相關(guān)關(guān)系據(jù)以成立的數(shù)據(jù)范圍以外,推論這種相關(guān)關(guān)系仍然保持。雨下的多,農(nóng)作物長的好,在缺水地區(qū),干旱季節(jié)雨是一種福音,但雨量太大,卻可能損壞莊稼。又如,廣告投入多,銷售額上漲,利潤增加,但盲目加大廣告投入,卻未必使銷售額再增長,利潤還可能減少。正相關(guān)達(dá)到某個(gè)極限,就可能變成負(fù)相關(guān)。這個(gè)道理似乎人人都明白,但在分析問題時(shí)卻容易忽視。

