相關(guān)分析與回歸分析
一、本講要求
(一)相關(guān)關(guān)系的概念和種類
熟悉相關(guān)關(guān)系的基本概念和特點(diǎn);
熟悉相關(guān)關(guān)系的種類;
(二)相關(guān)分析
熟悉相關(guān)關(guān)系的描述方法——相關(guān)表與相關(guān)圖;
熟悉相關(guān)系數(shù)的含義、相關(guān)系數(shù)的特點(diǎn);
熟悉相關(guān)系數(shù)的計(jì)算方法和相關(guān)系數(shù)的顯著性檢驗(yàn)方法。
(三)回歸分析的概念
熟悉回歸分析的概率和回歸分析包括的主要內(nèi)容;
熟悉回歸分析與相關(guān)分析的區(qū)別
二、本講內(nèi)容
(一) 相關(guān)關(guān)系的概念與種類
1.相關(guān)關(guān)系的概念
在現(xiàn)實(shí)世界中,任何事物或現(xiàn)象都不是孤立存在的,而是相互聯(lián)系、相互制約、相互依存的。當(dāng)某些現(xiàn)象發(fā)生變化時,另一現(xiàn)象也會隨之發(fā)生變化。如商品價格的變化會刺激或抑制商品銷售量的變化;勞動力素質(zhì)的高低會影響企業(yè)的效益;直接材料、直接人工的價格變化會對產(chǎn)品銷售成本有直接的影響;居民收入的高低會影響對該企業(yè)產(chǎn)品的需求量等等。研究這些現(xiàn)象之間的依存關(guān)系,找出它們之間的變化規(guī)律,是對經(jīng)搜集、整理過的統(tǒng)計(jì)數(shù)據(jù)進(jìn)行數(shù)據(jù)分析,為客觀、科學(xué)地統(tǒng)計(jì)提供依據(jù)。
現(xiàn)象間的依存關(guān)系大致可以分成兩種類型: 一類是函數(shù)關(guān)系,另一類是相關(guān)關(guān)系。
(1)函數(shù)關(guān)系。函數(shù)是指現(xiàn)象之間有一種嚴(yán)格的確定性的依存關(guān)系。表現(xiàn)為某一現(xiàn)象發(fā)生變化另一現(xiàn)象也隨之發(fā)生變化,而且有確定的值與之相對應(yīng)。例如,銀行的1年期存款利率為年息1.98%,存入的本金用x表示,到期本息用y表示,則y=x+1.98%x(不考慮利息稅);再如,某種股票的成交額Y與該股票的成交量X、成交價格P之間的關(guān)系可以用Y=PX來表示,這都是函數(shù)關(guān)系。
(2)相關(guān)關(guān)系。相關(guān)關(guān)系是指客觀現(xiàn)象之間確實(shí)存在的,但數(shù)量上不是嚴(yán)格對應(yīng)的依存關(guān)系。在這種關(guān)系中,對于某一現(xiàn)象的每一數(shù)值,可以有另一現(xiàn)象的若干數(shù)值與之相對應(yīng)。例如成本的高低與利潤的多少有密切關(guān)系,但某一確定的成本與相對應(yīng)的利潤的數(shù)量關(guān)系卻是不確定的。這是因?yàn)橛绊懤麧櫟囊蛩爻顺杀就?,還有價格、供求平衡、消費(fèi)嗜好等因素以及其他偶然因素的影響;再如,生育率與人均GDP的關(guān)系也屬于典型的相關(guān)關(guān)系:人均GDP高的國家,生育率往往較低,但二者沒有惟一確定的關(guān)系,這是因?yàn)槌私?jīng)濟(jì)因素外,生育水平還受教育水平、城市化水平以及不易測量的民族風(fēng)俗、宗教和其他隨機(jī)因素的共同影響。
具有相關(guān)關(guān)系的某些現(xiàn)象可表現(xiàn)為因果關(guān)系,即某一或若干現(xiàn)象的變化是引起另一現(xiàn)象變化的原因,它是可以控制、給定的值,將其稱為自變量;另一個現(xiàn)象的變化是自變量變化的結(jié)果,它是不確定的值,將其稱為因變量。如資金投入與產(chǎn)值之間,前者為自變量,后者為因變量。但具有相關(guān)關(guān)系的現(xiàn)象并不都表現(xiàn)為因果關(guān)系,如生產(chǎn)費(fèi)用和生產(chǎn)量、商品的供求與價格等。這是由于相關(guān)關(guān)系比因果關(guān)系包括的范圍更廣泛。
相關(guān)關(guān)系和函數(shù)關(guān)系既有區(qū)別,又有聯(lián)系。有些函數(shù)關(guān)系往往因?yàn)橛杏^察或測量誤差以及各種隨機(jī)因素的干擾等原因,在實(shí)際中常常通過相關(guān)關(guān)系表現(xiàn)出來;而在研究相關(guān)關(guān)系時,當(dāng)對其數(shù)量間的規(guī)律性了解得越深刻的時候,其相關(guān)關(guān)系就越有可能轉(zhuǎn)化為函數(shù)關(guān)系或借助函數(shù)關(guān)系來表現(xiàn)。
(3)相關(guān)關(guān)系的兩個特點(diǎn)
①現(xiàn)象之間確實(shí)存在著數(shù)量上的依存關(guān)系。就是說,一個現(xiàn)象發(fā)生數(shù)量上的變化,另一個現(xiàn)象也會相應(yīng)地發(fā)生數(shù)量上的變化。
②現(xiàn)象間的數(shù)量依存關(guān)系值是不確定的。就是說,一個現(xiàn)象發(fā)生數(shù)量上的變化,另一個現(xiàn)象會有幾個可能值與之對應(yīng),而不是確定的值。
2.相關(guān)關(guān)系的種類
現(xiàn)象之間的相關(guān)關(guān)系從不同的角度可以區(qū)分為不同類型。
(1)按照相關(guān)的方向不同分為:正相關(guān)和負(fù)相關(guān)。
正相關(guān)——當(dāng)一個變量的值增加或減少,另一個變量的值也隨之增加或減少。如工人勞動生產(chǎn)率提高,產(chǎn)品產(chǎn)量也隨之增加;居民的消費(fèi)水平隨個人所支配收入的增加而增加。
負(fù)相關(guān)——當(dāng)一個變量的值增加或減少時,另一變量的值反而減少或增加。如商品流轉(zhuǎn)額越大,商品流通費(fèi)用越低;利潤隨單位成本的降低而增加。
(2) 按照相關(guān)形式不同分為:線性相關(guān)和非線性相關(guān)。
線性相關(guān)——又稱直線相關(guān),是指當(dāng)一個變量變動時,另一變量隨之發(fā)生大致均等的變動,從圖形上看,其觀察點(diǎn)的分布近似地表現(xiàn)為一條直線;例如,人均消費(fèi)水平與人均收入水平通常呈線性關(guān)系。
非線性相關(guān)——一個變量變動時,另一變量也隨之發(fā)生變動,但這種變動不是均等的,從圖形上看,其觀察點(diǎn)的分布近似地表現(xiàn)為一條曲線,如拋物線、指數(shù)曲線等,因此也稱為曲線相關(guān)。例如,工人加班加點(diǎn)在一定數(shù)量界限內(nèi),產(chǎn)量增加,但一旦超過一定限度,產(chǎn)量反而可能下降,這就是一種非線性關(guān)系。
(3)按相關(guān)程度分為:完全相關(guān)、不完全相關(guān)和不相關(guān)。
完全相關(guān)——當(dāng)一個變量的數(shù)量完全由另一個變量的數(shù)量變化所確定時,二者之間即為完全相關(guān)。例如,在價格不變的條件下,銷售額與銷售量之間的正比例函數(shù)關(guān)系即為完全相關(guān),此時相關(guān)關(guān)系便成為函數(shù)關(guān)系,因此也可以說函數(shù)關(guān)系是相關(guān)關(guān)系的一個特例。
不相關(guān)——又稱零相關(guān),當(dāng)變量之間彼此互不影響,其數(shù)量變化各自獨(dú)立時,則變量之間為不相關(guān)。例如,股票價格的高低與氣溫的高低一般情況下是不相關(guān)的。
不完全相關(guān)——如果兩個變量的關(guān)系介于完全相關(guān)和不相關(guān)之間,稱為不完全相關(guān)。由于完全相關(guān)和不相關(guān)的數(shù)量關(guān)系是確定的或相互獨(dú)立的,因此統(tǒng)計(jì)學(xué)中相關(guān)分析的主要研究對象是不完全相關(guān)。
(4)按研究的變量(或因素)的多少分為:單相關(guān)、復(fù)相關(guān)和偏相關(guān)。
單相關(guān)——又稱一元相關(guān),是指兩個變量之間的相關(guān)關(guān)系,如廣告費(fèi)支出與產(chǎn)品銷售量之間的相關(guān)關(guān)系;
復(fù)相關(guān)——又稱多元相關(guān),是指三個或三個以上變量之間的相關(guān)關(guān)系,如商品銷售額與居民收入、商品價格之間的相關(guān)關(guān)系。
偏相關(guān)——在一個變量與兩個或兩個以上的變量相關(guān)的條件下,當(dāng)假定其他變量不變時,其中兩個變量的相關(guān)關(guān)系稱為偏相關(guān)。例如,在假定商品價格不變的條件下,該商品的需求量與消費(fèi)者收入水平的相關(guān)關(guān)系即為偏相關(guān)。
3.相關(guān)關(guān)系分析的基本內(nèi)容
統(tǒng)計(jì)對現(xiàn)象之間相關(guān)關(guān)系的分析,主要從兩方面進(jìn)行:一是測定變量之間的相關(guān)關(guān)系的密切程度,稱為相關(guān)分析;另一是根據(jù)變量之間的關(guān)系形式,用一個數(shù)學(xué)表達(dá)式,來反映有相關(guān)關(guān)系的變量之間的數(shù)值變化關(guān)系,據(jù)此由一個或若干個自變量的數(shù)值推斷出因變量的可能值,這種分析稱為回歸分析。相關(guān)分析與回歸分析既有區(qū)別又有聯(lián)系,兩種分析構(gòu)成了相關(guān)關(guān)系分析的基本內(nèi)容。
(二)相關(guān)分析
1.相關(guān)分析的描述——相關(guān)表與相關(guān)圖
在進(jìn)行相關(guān)分析之前,首先要判斷現(xiàn)象之間是否存在相關(guān)關(guān)系,是何種形式的相關(guān)關(guān)系。這種判斷,最初是要對研究對象進(jìn)行定性分析,在初步確認(rèn)有相關(guān)關(guān)系后,還要運(yùn)用大量的實(shí)際觀察資料,編出相關(guān)表、繪出相關(guān)圖,利用相關(guān)圖表,再進(jìn)一步判斷相關(guān)關(guān)系的形式,為相關(guān)分析奠定基礎(chǔ)。
3.簡單線性相關(guān)分析的特點(diǎn)
(1)相關(guān)分析主要是計(jì)算一個統(tǒng)計(jì)指標(biāo),即相關(guān)系數(shù),反映變量之間關(guān)系的密切程度;
(2)分析時把兩個變量的地位可以看成是對等的,不用分哪個是自變量,哪個是因變量。直接根據(jù)兩個變量的數(shù)值即可計(jì)算相關(guān)系數(shù);
(3)在存在互為因果關(guān)系的條件下,相關(guān)系數(shù)也只有一個。
(4)相關(guān)系數(shù)有正負(fù)號,表示相關(guān)的方向;
(5)計(jì)算相關(guān)系數(shù)時,所需的兩個變量的資料都可以是隨機(jī)的。
(三)回歸分析的概念
1.回歸分析的概念
計(jì)算相關(guān)系數(shù)只能說明現(xiàn)象間相關(guān)關(guān)系的方向和程度,關(guān)系密切與否,但不能說明一個現(xiàn)象發(fā)生一定量的變化,另一個現(xiàn)象一般也會發(fā)生多大的變化。如銷售收入每增加一萬元時,銷售利潤一般會增加多少?施肥量增加一斤,一般地會增加多少產(chǎn)量?
為了測定現(xiàn)象之間數(shù)量變化上的一般關(guān)系要使用數(shù)學(xué)方法,這類數(shù)學(xué)方法稱為回歸分析?!盎貧w”這個詞的意思,就是指的變量之間的一般數(shù)量關(guān)系。根據(jù)現(xiàn)象之間相關(guān)關(guān)系的表現(xiàn)形式,配合一條直線或曲線,用這條直線或曲線來代表自變量和因變量相隨變動的一般數(shù)量關(guān)系。也就是要建立并求解直線或曲線的數(shù)學(xué)方程式,從而求得變量間的一般關(guān)系值。
回歸有不同種類,按照自變量的個數(shù)分,有一元回歸和多元回歸。只有一個自變量的叫一元回歸,有兩個或兩個以上自變量的叫多元回歸;按照回歸曲線的形態(tài)分,有線性(直線)回歸和非線性(曲線)回歸。實(shí)際分析時應(yīng)根據(jù)客觀現(xiàn)象的性質(zhì)、特點(diǎn)、研究目的和任務(wù)選取回歸分析的方法。本節(jié)僅討論一元線性回歸分析。
與直線相關(guān)分析的特點(diǎn)相比,簡單直線回歸分析有以下特點(diǎn)。
(1)兩個變量之間不是對等關(guān)系,一個是自變量,一個是因變量,在進(jìn)行回歸分析時,首先加以確定。
(2)相關(guān)系數(shù)是個抽象的系數(shù),而回歸方程是利用自變量的給定值來推算因變量值,它反映的是變量之間的具體的變動關(guān)系。
(3)有些現(xiàn)象因果關(guān)系不明顯,x、y兩個變量可以互換,從方程式看,存在著兩個回歸方程:一個是以x為自變量,y為因變量,求出的回歸方程稱“y倚x回歸方程”;另一個是以y為自變量,x為因變量,求出的回歸方程稱“x倚 y回歸方程”。畫出圖來,是兩條斜率不同的回歸直線。
(4)直線回歸方程中的回歸系數(shù)也有正負(fù)號,回歸系數(shù)為正號,表示兩個變量之間的變動方向相同,為負(fù)號則表示兩變量之間的變動方向相反。
(5)回歸分析中的自變量是給定數(shù)值,不是隨機(jī)的,而因變量是隨機(jī)的,代入給定的自變量值,求出因變量的估計(jì)值,這個估計(jì)值是許多可能數(shù)值的平均值,存在著估計(jì)標(biāo)準(zhǔn)誤差。
2.相關(guān)分析與回歸分析的關(guān)系
相關(guān)分析是回歸分析的基礎(chǔ)和前提,回歸分析則是相關(guān)分析的深入和繼續(xù)。相關(guān)分析需要依靠回歸分析來表現(xiàn)變量之間數(shù)量相關(guān)的具體形式,而回歸分析則需要依靠相關(guān)分析來表現(xiàn)變量之間數(shù)量變化的相關(guān)程度。只有當(dāng)變量之間存在高度相關(guān)時,進(jìn)行回歸分析尋求其相關(guān)的具體形式才有意義。如果在沒有對變量之間是否相關(guān)以及相關(guān)方向和程度做出正確判斷之前,就進(jìn)行回歸分析,很容易造成“虛假回歸”。與此同時,相關(guān)分析只研究變量之間相關(guān)的方向和程度,不能推斷變量之間相互關(guān)系的具體形式,也無法從一個變量的變化來推測另一個變量的變化情況,因此,在具體應(yīng)用過程中,只有把相關(guān)分析和回歸分析結(jié)合起來,才能達(dá)到研究和分析的目的。
二者的區(qū)別主要體現(xiàn)在以下三個方面:
1.相關(guān)分析主要通過相關(guān)系數(shù)來判斷兩個變量之間是否存在著相互關(guān)系及其關(guān)系的密切程度,其前提條件是兩個變量都是隨機(jī)變量,且變量之間不必區(qū)別自變量和因變量。而回歸分析研究一個隨機(jī)變量(Y)與另一個非隨機(jī)變量(X)之間的相互關(guān)系,且變量之間必須區(qū)別自變量和因變量。
2.相關(guān)系數(shù)只能觀察變量間相關(guān)關(guān)系的密切程度和方向,不能估計(jì)推算具體數(shù)值。而回歸分析可以根據(jù)回歸方程,用自變量數(shù)值推算因變量的估計(jì)值。
3.互為因果關(guān)系的兩個變量,可以擬合兩個回歸方程,且互相獨(dú)立、不能互相替換。而相關(guān)系數(shù)卻只有一個,即自變量與因變量互換相關(guān)系數(shù)不變。
需要指出的是,變量之間是否存在“真實(shí)相關(guān)”,是由變量之間的內(nèi)在聯(lián)系所決定的。相關(guān)分析和回歸分析只是定量分析的手段,通過相關(guān)分析和回歸分析,雖然可以從數(shù)量上反映變量之間的聯(lián)系形式及其密切程度,但是無法準(zhǔn)確判斷變量之間內(nèi)在聯(lián)系的存在與否,也無法判斷變量之間的因果關(guān)系。因此,在具體應(yīng)用過程中,一定要始終注意把定性分析和定量分析結(jié)合起來,在準(zhǔn)確的定性分析的基礎(chǔ)上展開定量分析。
一、本講要求
(一)相關(guān)關(guān)系的概念和種類
熟悉相關(guān)關(guān)系的基本概念和特點(diǎn);
熟悉相關(guān)關(guān)系的種類;
(二)相關(guān)分析
熟悉相關(guān)關(guān)系的描述方法——相關(guān)表與相關(guān)圖;
熟悉相關(guān)系數(shù)的含義、相關(guān)系數(shù)的特點(diǎn);
熟悉相關(guān)系數(shù)的計(jì)算方法和相關(guān)系數(shù)的顯著性檢驗(yàn)方法。
(三)回歸分析的概念
熟悉回歸分析的概率和回歸分析包括的主要內(nèi)容;
熟悉回歸分析與相關(guān)分析的區(qū)別
二、本講內(nèi)容
(一) 相關(guān)關(guān)系的概念與種類
1.相關(guān)關(guān)系的概念
在現(xiàn)實(shí)世界中,任何事物或現(xiàn)象都不是孤立存在的,而是相互聯(lián)系、相互制約、相互依存的。當(dāng)某些現(xiàn)象發(fā)生變化時,另一現(xiàn)象也會隨之發(fā)生變化。如商品價格的變化會刺激或抑制商品銷售量的變化;勞動力素質(zhì)的高低會影響企業(yè)的效益;直接材料、直接人工的價格變化會對產(chǎn)品銷售成本有直接的影響;居民收入的高低會影響對該企業(yè)產(chǎn)品的需求量等等。研究這些現(xiàn)象之間的依存關(guān)系,找出它們之間的變化規(guī)律,是對經(jīng)搜集、整理過的統(tǒng)計(jì)數(shù)據(jù)進(jìn)行數(shù)據(jù)分析,為客觀、科學(xué)地統(tǒng)計(jì)提供依據(jù)。
現(xiàn)象間的依存關(guān)系大致可以分成兩種類型: 一類是函數(shù)關(guān)系,另一類是相關(guān)關(guān)系。
(1)函數(shù)關(guān)系。函數(shù)是指現(xiàn)象之間有一種嚴(yán)格的確定性的依存關(guān)系。表現(xiàn)為某一現(xiàn)象發(fā)生變化另一現(xiàn)象也隨之發(fā)生變化,而且有確定的值與之相對應(yīng)。例如,銀行的1年期存款利率為年息1.98%,存入的本金用x表示,到期本息用y表示,則y=x+1.98%x(不考慮利息稅);再如,某種股票的成交額Y與該股票的成交量X、成交價格P之間的關(guān)系可以用Y=PX來表示,這都是函數(shù)關(guān)系。
(2)相關(guān)關(guān)系。相關(guān)關(guān)系是指客觀現(xiàn)象之間確實(shí)存在的,但數(shù)量上不是嚴(yán)格對應(yīng)的依存關(guān)系。在這種關(guān)系中,對于某一現(xiàn)象的每一數(shù)值,可以有另一現(xiàn)象的若干數(shù)值與之相對應(yīng)。例如成本的高低與利潤的多少有密切關(guān)系,但某一確定的成本與相對應(yīng)的利潤的數(shù)量關(guān)系卻是不確定的。這是因?yàn)橛绊懤麧櫟囊蛩爻顺杀就?,還有價格、供求平衡、消費(fèi)嗜好等因素以及其他偶然因素的影響;再如,生育率與人均GDP的關(guān)系也屬于典型的相關(guān)關(guān)系:人均GDP高的國家,生育率往往較低,但二者沒有惟一確定的關(guān)系,這是因?yàn)槌私?jīng)濟(jì)因素外,生育水平還受教育水平、城市化水平以及不易測量的民族風(fēng)俗、宗教和其他隨機(jī)因素的共同影響。
具有相關(guān)關(guān)系的某些現(xiàn)象可表現(xiàn)為因果關(guān)系,即某一或若干現(xiàn)象的變化是引起另一現(xiàn)象變化的原因,它是可以控制、給定的值,將其稱為自變量;另一個現(xiàn)象的變化是自變量變化的結(jié)果,它是不確定的值,將其稱為因變量。如資金投入與產(chǎn)值之間,前者為自變量,后者為因變量。但具有相關(guān)關(guān)系的現(xiàn)象并不都表現(xiàn)為因果關(guān)系,如生產(chǎn)費(fèi)用和生產(chǎn)量、商品的供求與價格等。這是由于相關(guān)關(guān)系比因果關(guān)系包括的范圍更廣泛。
相關(guān)關(guān)系和函數(shù)關(guān)系既有區(qū)別,又有聯(lián)系。有些函數(shù)關(guān)系往往因?yàn)橛杏^察或測量誤差以及各種隨機(jī)因素的干擾等原因,在實(shí)際中常常通過相關(guān)關(guān)系表現(xiàn)出來;而在研究相關(guān)關(guān)系時,當(dāng)對其數(shù)量間的規(guī)律性了解得越深刻的時候,其相關(guān)關(guān)系就越有可能轉(zhuǎn)化為函數(shù)關(guān)系或借助函數(shù)關(guān)系來表現(xiàn)。
(3)相關(guān)關(guān)系的兩個特點(diǎn)
①現(xiàn)象之間確實(shí)存在著數(shù)量上的依存關(guān)系。就是說,一個現(xiàn)象發(fā)生數(shù)量上的變化,另一個現(xiàn)象也會相應(yīng)地發(fā)生數(shù)量上的變化。
②現(xiàn)象間的數(shù)量依存關(guān)系值是不確定的。就是說,一個現(xiàn)象發(fā)生數(shù)量上的變化,另一個現(xiàn)象會有幾個可能值與之對應(yīng),而不是確定的值。
2.相關(guān)關(guān)系的種類
現(xiàn)象之間的相關(guān)關(guān)系從不同的角度可以區(qū)分為不同類型。
(1)按照相關(guān)的方向不同分為:正相關(guān)和負(fù)相關(guān)。
正相關(guān)——當(dāng)一個變量的值增加或減少,另一個變量的值也隨之增加或減少。如工人勞動生產(chǎn)率提高,產(chǎn)品產(chǎn)量也隨之增加;居民的消費(fèi)水平隨個人所支配收入的增加而增加。
負(fù)相關(guān)——當(dāng)一個變量的值增加或減少時,另一變量的值反而減少或增加。如商品流轉(zhuǎn)額越大,商品流通費(fèi)用越低;利潤隨單位成本的降低而增加。
(2) 按照相關(guān)形式不同分為:線性相關(guān)和非線性相關(guān)。
線性相關(guān)——又稱直線相關(guān),是指當(dāng)一個變量變動時,另一變量隨之發(fā)生大致均等的變動,從圖形上看,其觀察點(diǎn)的分布近似地表現(xiàn)為一條直線;例如,人均消費(fèi)水平與人均收入水平通常呈線性關(guān)系。
非線性相關(guān)——一個變量變動時,另一變量也隨之發(fā)生變動,但這種變動不是均等的,從圖形上看,其觀察點(diǎn)的分布近似地表現(xiàn)為一條曲線,如拋物線、指數(shù)曲線等,因此也稱為曲線相關(guān)。例如,工人加班加點(diǎn)在一定數(shù)量界限內(nèi),產(chǎn)量增加,但一旦超過一定限度,產(chǎn)量反而可能下降,這就是一種非線性關(guān)系。
(3)按相關(guān)程度分為:完全相關(guān)、不完全相關(guān)和不相關(guān)。
完全相關(guān)——當(dāng)一個變量的數(shù)量完全由另一個變量的數(shù)量變化所確定時,二者之間即為完全相關(guān)。例如,在價格不變的條件下,銷售額與銷售量之間的正比例函數(shù)關(guān)系即為完全相關(guān),此時相關(guān)關(guān)系便成為函數(shù)關(guān)系,因此也可以說函數(shù)關(guān)系是相關(guān)關(guān)系的一個特例。
不相關(guān)——又稱零相關(guān),當(dāng)變量之間彼此互不影響,其數(shù)量變化各自獨(dú)立時,則變量之間為不相關(guān)。例如,股票價格的高低與氣溫的高低一般情況下是不相關(guān)的。
不完全相關(guān)——如果兩個變量的關(guān)系介于完全相關(guān)和不相關(guān)之間,稱為不完全相關(guān)。由于完全相關(guān)和不相關(guān)的數(shù)量關(guān)系是確定的或相互獨(dú)立的,因此統(tǒng)計(jì)學(xué)中相關(guān)分析的主要研究對象是不完全相關(guān)。
(4)按研究的變量(或因素)的多少分為:單相關(guān)、復(fù)相關(guān)和偏相關(guān)。
單相關(guān)——又稱一元相關(guān),是指兩個變量之間的相關(guān)關(guān)系,如廣告費(fèi)支出與產(chǎn)品銷售量之間的相關(guān)關(guān)系;
復(fù)相關(guān)——又稱多元相關(guān),是指三個或三個以上變量之間的相關(guān)關(guān)系,如商品銷售額與居民收入、商品價格之間的相關(guān)關(guān)系。
偏相關(guān)——在一個變量與兩個或兩個以上的變量相關(guān)的條件下,當(dāng)假定其他變量不變時,其中兩個變量的相關(guān)關(guān)系稱為偏相關(guān)。例如,在假定商品價格不變的條件下,該商品的需求量與消費(fèi)者收入水平的相關(guān)關(guān)系即為偏相關(guān)。
3.相關(guān)關(guān)系分析的基本內(nèi)容
統(tǒng)計(jì)對現(xiàn)象之間相關(guān)關(guān)系的分析,主要從兩方面進(jìn)行:一是測定變量之間的相關(guān)關(guān)系的密切程度,稱為相關(guān)分析;另一是根據(jù)變量之間的關(guān)系形式,用一個數(shù)學(xué)表達(dá)式,來反映有相關(guān)關(guān)系的變量之間的數(shù)值變化關(guān)系,據(jù)此由一個或若干個自變量的數(shù)值推斷出因變量的可能值,這種分析稱為回歸分析。相關(guān)分析與回歸分析既有區(qū)別又有聯(lián)系,兩種分析構(gòu)成了相關(guān)關(guān)系分析的基本內(nèi)容。
(二)相關(guān)分析
1.相關(guān)分析的描述——相關(guān)表與相關(guān)圖
在進(jìn)行相關(guān)分析之前,首先要判斷現(xiàn)象之間是否存在相關(guān)關(guān)系,是何種形式的相關(guān)關(guān)系。這種判斷,最初是要對研究對象進(jìn)行定性分析,在初步確認(rèn)有相關(guān)關(guān)系后,還要運(yùn)用大量的實(shí)際觀察資料,編出相關(guān)表、繪出相關(guān)圖,利用相關(guān)圖表,再進(jìn)一步判斷相關(guān)關(guān)系的形式,為相關(guān)分析奠定基礎(chǔ)。
3.簡單線性相關(guān)分析的特點(diǎn)
(1)相關(guān)分析主要是計(jì)算一個統(tǒng)計(jì)指標(biāo),即相關(guān)系數(shù),反映變量之間關(guān)系的密切程度;
(2)分析時把兩個變量的地位可以看成是對等的,不用分哪個是自變量,哪個是因變量。直接根據(jù)兩個變量的數(shù)值即可計(jì)算相關(guān)系數(shù);
(3)在存在互為因果關(guān)系的條件下,相關(guān)系數(shù)也只有一個。
(4)相關(guān)系數(shù)有正負(fù)號,表示相關(guān)的方向;
(5)計(jì)算相關(guān)系數(shù)時,所需的兩個變量的資料都可以是隨機(jī)的。
(三)回歸分析的概念
1.回歸分析的概念
計(jì)算相關(guān)系數(shù)只能說明現(xiàn)象間相關(guān)關(guān)系的方向和程度,關(guān)系密切與否,但不能說明一個現(xiàn)象發(fā)生一定量的變化,另一個現(xiàn)象一般也會發(fā)生多大的變化。如銷售收入每增加一萬元時,銷售利潤一般會增加多少?施肥量增加一斤,一般地會增加多少產(chǎn)量?
為了測定現(xiàn)象之間數(shù)量變化上的一般關(guān)系要使用數(shù)學(xué)方法,這類數(shù)學(xué)方法稱為回歸分析?!盎貧w”這個詞的意思,就是指的變量之間的一般數(shù)量關(guān)系。根據(jù)現(xiàn)象之間相關(guān)關(guān)系的表現(xiàn)形式,配合一條直線或曲線,用這條直線或曲線來代表自變量和因變量相隨變動的一般數(shù)量關(guān)系。也就是要建立并求解直線或曲線的數(shù)學(xué)方程式,從而求得變量間的一般關(guān)系值。
回歸有不同種類,按照自變量的個數(shù)分,有一元回歸和多元回歸。只有一個自變量的叫一元回歸,有兩個或兩個以上自變量的叫多元回歸;按照回歸曲線的形態(tài)分,有線性(直線)回歸和非線性(曲線)回歸。實(shí)際分析時應(yīng)根據(jù)客觀現(xiàn)象的性質(zhì)、特點(diǎn)、研究目的和任務(wù)選取回歸分析的方法。本節(jié)僅討論一元線性回歸分析。
與直線相關(guān)分析的特點(diǎn)相比,簡單直線回歸分析有以下特點(diǎn)。
(1)兩個變量之間不是對等關(guān)系,一個是自變量,一個是因變量,在進(jìn)行回歸分析時,首先加以確定。
(2)相關(guān)系數(shù)是個抽象的系數(shù),而回歸方程是利用自變量的給定值來推算因變量值,它反映的是變量之間的具體的變動關(guān)系。
(3)有些現(xiàn)象因果關(guān)系不明顯,x、y兩個變量可以互換,從方程式看,存在著兩個回歸方程:一個是以x為自變量,y為因變量,求出的回歸方程稱“y倚x回歸方程”;另一個是以y為自變量,x為因變量,求出的回歸方程稱“x倚 y回歸方程”。畫出圖來,是兩條斜率不同的回歸直線。
(4)直線回歸方程中的回歸系數(shù)也有正負(fù)號,回歸系數(shù)為正號,表示兩個變量之間的變動方向相同,為負(fù)號則表示兩變量之間的變動方向相反。
(5)回歸分析中的自變量是給定數(shù)值,不是隨機(jī)的,而因變量是隨機(jī)的,代入給定的自變量值,求出因變量的估計(jì)值,這個估計(jì)值是許多可能數(shù)值的平均值,存在著估計(jì)標(biāo)準(zhǔn)誤差。
2.相關(guān)分析與回歸分析的關(guān)系
相關(guān)分析是回歸分析的基礎(chǔ)和前提,回歸分析則是相關(guān)分析的深入和繼續(xù)。相關(guān)分析需要依靠回歸分析來表現(xiàn)變量之間數(shù)量相關(guān)的具體形式,而回歸分析則需要依靠相關(guān)分析來表現(xiàn)變量之間數(shù)量變化的相關(guān)程度。只有當(dāng)變量之間存在高度相關(guān)時,進(jìn)行回歸分析尋求其相關(guān)的具體形式才有意義。如果在沒有對變量之間是否相關(guān)以及相關(guān)方向和程度做出正確判斷之前,就進(jìn)行回歸分析,很容易造成“虛假回歸”。與此同時,相關(guān)分析只研究變量之間相關(guān)的方向和程度,不能推斷變量之間相互關(guān)系的具體形式,也無法從一個變量的變化來推測另一個變量的變化情況,因此,在具體應(yīng)用過程中,只有把相關(guān)分析和回歸分析結(jié)合起來,才能達(dá)到研究和分析的目的。
二者的區(qū)別主要體現(xiàn)在以下三個方面:
1.相關(guān)分析主要通過相關(guān)系數(shù)來判斷兩個變量之間是否存在著相互關(guān)系及其關(guān)系的密切程度,其前提條件是兩個變量都是隨機(jī)變量,且變量之間不必區(qū)別自變量和因變量。而回歸分析研究一個隨機(jī)變量(Y)與另一個非隨機(jī)變量(X)之間的相互關(guān)系,且變量之間必須區(qū)別自變量和因變量。
2.相關(guān)系數(shù)只能觀察變量間相關(guān)關(guān)系的密切程度和方向,不能估計(jì)推算具體數(shù)值。而回歸分析可以根據(jù)回歸方程,用自變量數(shù)值推算因變量的估計(jì)值。
3.互為因果關(guān)系的兩個變量,可以擬合兩個回歸方程,且互相獨(dú)立、不能互相替換。而相關(guān)系數(shù)卻只有一個,即自變量與因變量互換相關(guān)系數(shù)不變。
需要指出的是,變量之間是否存在“真實(shí)相關(guān)”,是由變量之間的內(nèi)在聯(lián)系所決定的。相關(guān)分析和回歸分析只是定量分析的手段,通過相關(guān)分析和回歸分析,雖然可以從數(shù)量上反映變量之間的聯(lián)系形式及其密切程度,但是無法準(zhǔn)確判斷變量之間內(nèi)在聯(lián)系的存在與否,也無法判斷變量之間的因果關(guān)系。因此,在具體應(yīng)用過程中,一定要始終注意把定性分析和定量分析結(jié)合起來,在準(zhǔn)確的定性分析的基礎(chǔ)上展開定量分析。