四、多元統(tǒng)計(jì)分析
(一)多元回歸分析
指的是多個(gè)因變量對(duì)多個(gè)自變量的回歸。其中最常用的是只限于一個(gè)因變量y(被解釋變量)但有多個(gè)自變量x1,x2···xn(解釋變量)的情況,也叫多重回歸。模型見(jiàn)P96
為了方便地進(jìn)行模型的參數(shù)估計(jì),對(duì)回歸方程要做如下一些基本假定:(1)自變量與因變量之間存在線性關(guān)系;(2)隨機(jī)誤差項(xiàng)具有0均值和等方差;
(3)E(e)=0;(4)無(wú)自相關(guān);(5)殘差與自變量之間相互獨(dú)立;(6)無(wú)共線性。
在計(jì)算過(guò)程中應(yīng)注意的問(wèn)題是:(1)樣本量不得少于30條記錄;(2)自變量與因變都應(yīng)該是連續(xù)性數(shù)字型變量;(3)分類/等級(jí)變量可以采取啞變量(通常取值為0或1)。
計(jì)算出結(jié)果之后,要進(jìn)行檢驗(yàn)。常用的檢驗(yàn)方法有R(復(fù)相關(guān)系數(shù))檢驗(yàn)、F檢驗(yàn)、t檢驗(yàn)、DW檢驗(yàn)等。
(二)方差分析
又稱“變異數(shù)分析”或“F檢驗(yàn)”,用于兩個(gè)或兩個(gè)以上樣本均數(shù)差別的顯著性檢驗(yàn)。在市場(chǎng)調(diào)研中,方差分析適用于實(shí)驗(yàn)數(shù)據(jù)、調(diào)查數(shù)據(jù)和觀察數(shù)據(jù)的分析,目的是找出對(duì)該事物有顯著影響的因素及顯著影響因素的水平。
由于各種因素的影響,研究所得的數(shù)據(jù)呈現(xiàn)波動(dòng)狀。造成波動(dòng)的原因可分成兩類:一類是隨機(jī)的不可控因素,一類是研究中施加的對(duì)結(jié)果形成影響的可控因素。
在方差分析中,若涉及的因素只有一個(gè),稱為單因素方差分析;若涉及的因素為兩個(gè)或兩個(gè)以上,稱為多因素方差分析。例如,某連鎖店對(duì)其自主品牌商品的價(jià)格彈性的測(cè)量,見(jiàn)P97。
無(wú)論是單因素方差分析還是多因素方差分析,其步驟一般為:(1)明確因變量與自變量,建立原假設(shè);(2)計(jì)算總方差、組間方差、組內(nèi)方差,建立方差表;(3)顯著性檢驗(yàn),即用F檢驗(yàn);(4)分析結(jié)果。對(duì)于給定的顯著性水平a(通常取0.05或0.01),求得臨界值Fa,。如果由樣本觀測(cè)值計(jì)算得到的F值大于Fa。則在a水平下拒絕原假設(shè)H。;否則,接受Ho。
(三)列聯(lián)表分析
列聯(lián)表是觀測(cè)數(shù)據(jù)按兩個(gè)或更多屬性(定性變量)分類時(shí)所列出的頻數(shù)表。
一般來(lái)說(shuō),如果總體中的個(gè)體可按兩個(gè)屬性A與B分類, A有r個(gè)等級(jí),B有c個(gè)等級(jí),從總體中抽取大小為n的樣本,設(shè)其中有nij個(gè)個(gè)體的屬性屬于等級(jí)Xi和Yj,nij稱為頻數(shù),將r×c個(gè)nij排列為一個(gè)r行c列的二維列聯(lián)表,簡(jiǎn)稱,r×c表。例如,抽取1000人按性別和色覺(jué)兩個(gè)屬性分類可列出2×2列聯(lián)表:
男
女
正常
442
514
色盲
38
6
若所考慮的屬性多于兩個(gè),也可按類似的方式作出列聯(lián)表,稱為多維列聯(lián)表。由于屬性或定性變量的取值是離散的,因此多維列聯(lián)表分析屬于離散多元分析的范疇。列聯(lián)表只是檢驗(yàn)所考察的各屬性變量之間是否相關(guān),而非檢驗(yàn)變量之間的因果關(guān)系。一般使用c2分布來(lái)進(jìn)行獨(dú)立性檢驗(yàn)。
(一)多元回歸分析
指的是多個(gè)因變量對(duì)多個(gè)自變量的回歸。其中最常用的是只限于一個(gè)因變量y(被解釋變量)但有多個(gè)自變量x1,x2···xn(解釋變量)的情況,也叫多重回歸。模型見(jiàn)P96
為了方便地進(jìn)行模型的參數(shù)估計(jì),對(duì)回歸方程要做如下一些基本假定:(1)自變量與因變量之間存在線性關(guān)系;(2)隨機(jī)誤差項(xiàng)具有0均值和等方差;
(3)E(e)=0;(4)無(wú)自相關(guān);(5)殘差與自變量之間相互獨(dú)立;(6)無(wú)共線性。
在計(jì)算過(guò)程中應(yīng)注意的問(wèn)題是:(1)樣本量不得少于30條記錄;(2)自變量與因變都應(yīng)該是連續(xù)性數(shù)字型變量;(3)分類/等級(jí)變量可以采取啞變量(通常取值為0或1)。
計(jì)算出結(jié)果之后,要進(jìn)行檢驗(yàn)。常用的檢驗(yàn)方法有R(復(fù)相關(guān)系數(shù))檢驗(yàn)、F檢驗(yàn)、t檢驗(yàn)、DW檢驗(yàn)等。
(二)方差分析
又稱“變異數(shù)分析”或“F檢驗(yàn)”,用于兩個(gè)或兩個(gè)以上樣本均數(shù)差別的顯著性檢驗(yàn)。在市場(chǎng)調(diào)研中,方差分析適用于實(shí)驗(yàn)數(shù)據(jù)、調(diào)查數(shù)據(jù)和觀察數(shù)據(jù)的分析,目的是找出對(duì)該事物有顯著影響的因素及顯著影響因素的水平。
由于各種因素的影響,研究所得的數(shù)據(jù)呈現(xiàn)波動(dòng)狀。造成波動(dòng)的原因可分成兩類:一類是隨機(jī)的不可控因素,一類是研究中施加的對(duì)結(jié)果形成影響的可控因素。
在方差分析中,若涉及的因素只有一個(gè),稱為單因素方差分析;若涉及的因素為兩個(gè)或兩個(gè)以上,稱為多因素方差分析。例如,某連鎖店對(duì)其自主品牌商品的價(jià)格彈性的測(cè)量,見(jiàn)P97。
無(wú)論是單因素方差分析還是多因素方差分析,其步驟一般為:(1)明確因變量與自變量,建立原假設(shè);(2)計(jì)算總方差、組間方差、組內(nèi)方差,建立方差表;(3)顯著性檢驗(yàn),即用F檢驗(yàn);(4)分析結(jié)果。對(duì)于給定的顯著性水平a(通常取0.05或0.01),求得臨界值Fa,。如果由樣本觀測(cè)值計(jì)算得到的F值大于Fa。則在a水平下拒絕原假設(shè)H。;否則,接受Ho。
(三)列聯(lián)表分析
列聯(lián)表是觀測(cè)數(shù)據(jù)按兩個(gè)或更多屬性(定性變量)分類時(shí)所列出的頻數(shù)表。
一般來(lái)說(shuō),如果總體中的個(gè)體可按兩個(gè)屬性A與B分類, A有r個(gè)等級(jí),B有c個(gè)等級(jí),從總體中抽取大小為n的樣本,設(shè)其中有nij個(gè)個(gè)體的屬性屬于等級(jí)Xi和Yj,nij稱為頻數(shù),將r×c個(gè)nij排列為一個(gè)r行c列的二維列聯(lián)表,簡(jiǎn)稱,r×c表。例如,抽取1000人按性別和色覺(jué)兩個(gè)屬性分類可列出2×2列聯(lián)表:
男
女
正常
442
514
色盲
38
6
若所考慮的屬性多于兩個(gè),也可按類似的方式作出列聯(lián)表,稱為多維列聯(lián)表。由于屬性或定性變量的取值是離散的,因此多維列聯(lián)表分析屬于離散多元分析的范疇。列聯(lián)表只是檢驗(yàn)所考察的各屬性變量之間是否相關(guān),而非檢驗(yàn)變量之間的因果關(guān)系。一般使用c2分布來(lái)進(jìn)行獨(dú)立性檢驗(yàn)。