07年基礎理論與相關知識-相關分析與回歸分析

字號:

一、本講要求
    (一)相關關系的概念和種類
    熟悉相關關系的基本概念和特點;
    熟悉相關關系的種類;
    (二)相關分析
    熟悉相關關系的描述方法——相關表與相關圖;
    熟悉相關系數(shù)的含義、相關系數(shù)的特點;
    熟悉相關系數(shù)的計算方法和相關系數(shù)的顯著性檢驗方法。
    (三)回歸分析的概念
    熟悉回歸分析的概率和回歸分析包括的主要內(nèi)容;
    熟悉回歸分析與相關分析的區(qū)別
    二、本講內(nèi)容
    (一) 相關關系的概念與種類
    1.相關關系的概念
    在現(xiàn)實世界中,任何事物或現(xiàn)象都不是孤立存在的,而是相互聯(lián)系、相互制約、相互依存的。當某些現(xiàn)象發(fā)生變化時,另一現(xiàn)象也會隨之發(fā)生變化。如商品價格的變化會刺激或抑制商品銷售量的變化;勞動力素質的高低會影響企業(yè)的效益;直接材料、直接人工的價格變化會對產(chǎn)品銷售成本有直接的影響;居民收入的高低會影響對該企業(yè)產(chǎn)品的需求量等等。研究這些現(xiàn)象之間的依存關系,找出它們之間的變化規(guī)律,是對經(jīng)搜集、整理過的統(tǒng)計數(shù)據(jù)進行數(shù)據(jù)分析,為客觀、科學地統(tǒng)計提供依據(jù)。
    現(xiàn)象間的依存關系大致可以分成兩種類型: 一類是函數(shù)關系,另一類是相關關系。
    (1)函數(shù)關系。函數(shù)是指現(xiàn)象之間有一種嚴格的確定性的依存關系。表現(xiàn)為某一現(xiàn)象發(fā)生變化另一現(xiàn)象也隨之發(fā)生變化,而且有確定的值與之相對應。例如,銀行的1年期存款利率為年息1.98%,存入的本金用x表示,到期本息用y表示,則y=x+1.98%x(不考慮利息稅);再如,某種股票的成交額Y與該股票的成交量X、成交價格P之間的關系可以用Y=PX來表示,這都是函數(shù)關系。
    (2)相關關系。相關關系是指客觀現(xiàn)象之間確實存在的,但數(shù)量上不是嚴格對應的依存關系。在這種關系中,對于某一現(xiàn)象的每一數(shù)值,可以有另一現(xiàn)象的若干數(shù)值與之相對應。例如成本的高低與利潤的多少有密切關系,但某一確定的成本與相對應的利潤的數(shù)量關系卻是不確定的。這是因為影響利潤的因素除了成本外,還有價格、供求平衡、消費嗜好等因素以及其他偶然因素的影響;再如,生育率與人均GDP的關系也屬于典型的相關關系:人均GDP高的國家,生育率往往較低,但二者沒有惟一確定的關系,這是因為除了經(jīng)濟因素外,生育水平還受教育水平、城市化水平以及不易測量的民族風俗、宗教和其他隨機因素的共同影響。
    具有相關關系的某些現(xiàn)象可表現(xiàn)為因果關系,即某一或若干現(xiàn)象的變化是引起另一現(xiàn)象變化的原因,它是可以控制、給定的值,將其稱為自變量;另一個現(xiàn)象的變化是自變量變化的結果,它是不確定的值,將其稱為因變量。如資金投入與產(chǎn)值之間,前者為自變量,后者為因變量。但具有相關關系的現(xiàn)象并不都表現(xiàn)為因果關系,如生產(chǎn)費用和生產(chǎn)量、商品的供求與價格等。這是由于相關關系比因果關系包括的范圍更廣泛。
    相關關系和函數(shù)關系既有區(qū)別,又有聯(lián)系。有些函數(shù)關系往往因為有觀察或測量誤差以及各種隨機因素的干擾等原因,在實際中常常通過相關關系表現(xiàn)出來;而在研究相關關系時,當對其數(shù)量間的規(guī)律性了解得越深刻的時候,其相關關系就越有可能轉化為函數(shù)關系或借助函數(shù)關系來表現(xiàn)。
    (3)相關關系的兩個特點
    ①現(xiàn)象之間確實存在著數(shù)量上的依存關系。就是說,一個現(xiàn)象發(fā)生數(shù)量上的變化,另一個現(xiàn)象也會相應地發(fā)生數(shù)量上的變化。
    ②現(xiàn)象間的數(shù)量依存關系值是不確定的。就是說,一個現(xiàn)象發(fā)生數(shù)量上的變化,另一個現(xiàn)象會有幾個可能值與之對應,而不是確定的值。
    2.相關關系的種類
    現(xiàn)象之間的相關關系從不同的角度可以區(qū)分為不同類型。
    (1)按照相關的方向不同分為:正相關和負相關。
    正相關——當一個變量的值增加或減少,另一個變量的值也隨之增加或減少。如工人勞動生產(chǎn)率提高,產(chǎn)品產(chǎn)量也隨之增加;居民的消費水平隨個人所支配收入的增加而增加。
    負相關——當一個變量的值增加或減少時,另一變量的值反而減少或增加。如商品流轉額越大,商品流通費用越低;利潤隨單位成本的降低而增加。
    (2) 按照相關形式不同分為:線性相關和非線性相關。
    線性相關——又稱直線相關,是指當一個變量變動時,另一變量隨之發(fā)生大致均等的變動,從圖形上看,其觀察點的分布近似地表現(xiàn)為一條直線;例如,人均消費水平與人均收入水平通常呈線性關系。
    非線性相關——一個變量變動時,另一變量也隨之發(fā)生變動,但這種變動不是均等的,從圖形上看,其觀察點的分布近似地表現(xiàn)為一條曲線,如拋物線、指數(shù)曲線等,因此也稱為曲線相關。例如,工人加班加點在一定數(shù)量界限內(nèi),產(chǎn)量增加,但一旦超過一定限度,產(chǎn)量反而可能下降,這就是一種非線性關系。
    (3)按相關程度分為:完全相關、不完全相關和不相關。
    完全相關——當一個變量的數(shù)量完全由另一個變量的數(shù)量變化所確定時,二者之間即為完全相關。例如,在價格不變的條件下,銷售額與銷售量之間的正比例函數(shù)關系即為完全相關,此時相關關系便成為函數(shù)關系,因此也可以說函數(shù)關系是相關關系的一個特例。
    不相關——又稱零相關,當變量之間彼此互不影響,其數(shù)量變化各自獨立時,則變量之間為不相關。例如,股票價格的高低與氣溫的高低一般情況下是不相關的。
    不完全相關——如果兩個變量的關系介于完全相關和不相關之間,稱為不完全相關。由于完全相關和不相關的數(shù)量關系是確定的或相互獨立的,因此統(tǒng)計學中相關分析的主要研究對象是不完全相關。
    (4)按研究的變量(或因素)的多少分為:單相關、復相關和偏相關。
    單相關——又稱一元相關,是指兩個變量之間的相關關系,如廣告費支出與產(chǎn)品銷售量之間的相關關系;
    復相關——又稱多元相關,是指三個或三個以上變量之間的相關關系,如商品銷售額與居民收入、商品價格之間的相關關系。
    偏相關——在一個變量與兩個或兩個以上的變量相關的條件下,當假定其他變量不變時,其中兩個變量的相關關系稱為偏相關。例如,在假定商品價格不變的條件下,該商品的需求量與消費者收入水平的相關關系即為偏相關。
    3.相關關系分析的基本內(nèi)容
    統(tǒng)計對現(xiàn)象之間相關關系的分析,主要從兩方面進行:一是測定變量之間的相關關系的密切程度,稱為相關分析;另一是根據(jù)變量之間的關系形式,用一個數(shù)學表達式,來反映有相關關系的變量之間的數(shù)值變化關系,據(jù)此由一個或若干個自變量的數(shù)值推斷出因變量的可能值,這種分析稱為回歸分析。相關分析與回歸分析既有區(qū)別又有聯(lián)系,兩種分析構成了相關關系分析的基本內(nèi)容。   (二)相關分析
    1.相關分析的描述——相關表與相關圖
    在進行相關分析之前,首先要判斷現(xiàn)象之間是否存在相關關系,是何種形式的相關關系。這種判斷,最初是要對研究對象進行定性分析,在初步確認有相關關系后,還要運用大量的實際觀察資料,編出相關表、繪出相關圖,利用相關圖表,再進一步判斷相關關系的形式,為相關分析奠定基礎。
    3.簡單線性相關分析的特點
    (1)相關分析主要是計算一個統(tǒng)計指標,即相關系數(shù),反映變量之間關系的密切程度;
    (2)分析時把兩個變量的地位可以看成是對等的,不用分哪個是自變量,哪個是因變量。直接根據(jù)兩個變量的數(shù)值即可計算相關系數(shù);
    (3)在存在互為因果關系的條件下,相關系數(shù)也只有一個。
    (4)相關系數(shù)有正負號,表示相關的方向;
    (5)計算相關系數(shù)時,所需的兩個變量的資料都可以是隨機的。
    (三)回歸分析的概念
    1.回歸分析的概念
    計算相關系數(shù)只能說明現(xiàn)象間相關關系的方向和程度,關系密切與否,但不能說明一個現(xiàn)象發(fā)生一定量的變化,另一個現(xiàn)象一般也會發(fā)生多大的變化。如銷售收入每增加一萬元時,銷售利潤一般會增加多少?施肥量增加一斤,一般地會增加多少產(chǎn)量?
    為了測定現(xiàn)象之間數(shù)量變化上的一般關系要使用數(shù)學方法,這類數(shù)學方法稱為回歸分析?!盎貧w”這個詞的意思,就是指的變量之間的一般數(shù)量關系。根據(jù)現(xiàn)象之間相關關系的表現(xiàn)形式,配合一條直線或曲線,用這條直線或曲線來代表自變量和因變量相隨變動的一般數(shù)量關系。也就是要建立并求解直線或曲線的數(shù)學方程式,從而求得變量間的一般關系值。
    回歸有不同種類,按照自變量的個數(shù)分,有一元回歸和多元回歸。只有一個自變量的叫一元回歸,有兩個或兩個以上自變量的叫多元回歸;按照回歸曲線的形態(tài)分,有線性(直線)回歸和非線性(曲線)回歸。實際分析時應根據(jù)客觀現(xiàn)象的性質、特點、研究目的和任務選取回歸分析的方法。本節(jié)僅討論一元線性回歸分析。
    與直線相關分析的特點相比,簡單直線回歸分析有以下特點。
    (1)兩個變量之間不是對等關系,一個是自變量,一個是因變量,在進行回歸分析時,首先加以確定。
    (2)相關系數(shù)是個抽象的系數(shù),而回歸方程是利用自變量的給定值來推算因變量值,它反映的是變量之間的具體的變動關系。
    (3)有些現(xiàn)象因果關系不明顯,x、y兩個變量可以互換,從方程式看,存在著兩個回歸方程:一個是以x為自變量,y為因變量,求出的回歸方程稱“y倚x回歸方程”;另一個是以y為自變量,x為因變量,求出的回歸方程稱“x倚 y回歸方程”。畫出圖來,是兩條斜率不同的回歸直線。
    (4)直線回歸方程中的回歸系數(shù)也有正負號,回歸系數(shù)為正號,表示兩個變量之間的變動方向相同,為負號則表示兩變量之間的變動方向相反。
    (5)回歸分析中的自變量是給定數(shù)值,不是隨機的,而因變量是隨機的,代入給定的自變量值,求出因變量的估計值,這個估計值是許多可能數(shù)值的平均值,存在著估計標準誤差。
    2.相關分析與回歸分析的關系
    相關分析是回歸分析的基礎和前提,回歸分析則是相關分析的深入和繼續(xù)。相關分析需要依靠回歸分析來表現(xiàn)變量之間數(shù)量相關的具體形式,而回歸分析則需要依靠相關分析來表現(xiàn)變量之間數(shù)量變化的相關程度。只有當變量之間存在高度相關時,進行回歸分析尋求其相關的具體形式才有意義。如果在沒有對變量之間是否相關以及相關方向和程度做出正確判斷之前,就進行回歸分析,很容易造成“虛假回歸”。與此同時,相關分析只研究變量之間相關的方向和程度,不能推斷變量之間相互關系的具體形式,也無法從一個變量的變化來推測另一個變量的變化情況,因此,在具體應用過程中,只有把相關分析和回歸分析結合起來,才能達到研究和分析的目的。
    二者的區(qū)別主要體現(xiàn)在以下三個方面:
    1.相關分析主要通過相關系數(shù)來判斷兩個變量之間是否存在著相互關系及其關系的密切程度,其前提條件是兩個變量都是隨機變量,且變量之間不必區(qū)別自變量和因變量。而回歸分析研究一個隨機變量(Y)與另一個非隨機變量(X)之間的相互關系,且變量之間必須區(qū)別自變量和因變量。
    2.相關系數(shù)只能觀察變量間相關關系的密切程度和方向,不能估計推算具體數(shù)值。而回歸分析可以根據(jù)回歸方程,用自變量數(shù)值推算因變量的估計值。
    3.互為因果關系的兩個變量,可以擬合兩個回歸方程,且互相獨立、不能互相替換。而相關系數(shù)卻只有一個,即自變量與因變量互換相關系數(shù)不變。
    需要指出的是,變量之間是否存在“真實相關”,是由變量之間的內(nèi)在聯(lián)系所決定的。相關分析和回歸分析只是定量分析的手段,通過相關分析和回歸分析,雖然可以從數(shù)量上反映變量之間的聯(lián)系形式及其密切程度,但是無法準確判斷變量之間內(nèi)在聯(lián)系的存在與否,也無法判斷變量之間的因果關系。因此,在具體應用過程中,一定要始終注意把定性分析和定量分析結合起來,在準確的定性分析的基礎上展開定量分析。