總體參數(shù)估計(jì)概述
統(tǒng)計(jì)推斷(Statistical inference)就是根據(jù)樣本的實(shí)際數(shù)據(jù),對總體的數(shù)量特征作出具有一定可靠程度的估計(jì)和判斷。統(tǒng)計(jì)推斷的基本內(nèi)容有參數(shù)估計(jì)和假設(shè)檢驗(yàn)兩方面。概括地說,研究一個(gè)隨機(jī)變量,推斷它具有什么樣的數(shù)量特征,按什么樣的模式來變動(dòng),這屬于估計(jì)理論的內(nèi)容,而推測這些隨機(jī)變量的數(shù)量特征和變動(dòng)模式是否符合我們事先所作的假設(shè),這屬于檢驗(yàn)理論的內(nèi)容。參數(shù)估計(jì)和假設(shè)檢驗(yàn)的共同點(diǎn)是它們都對總體無知或不很了解,都是利用部分觀察值所提供的信息,對總體的數(shù)量特征作出估計(jì)和判斷,但兩者所要解決問題的著重點(diǎn)的所有方法有所不同。本節(jié)先研究總體參數(shù)估計(jì)的問題。
總體參數(shù)估計(jì)是以樣本統(tǒng)計(jì)量(即樣本數(shù)字特征)作為未知總體參數(shù)(即總體數(shù)字特征)的估計(jì)量,并通過對樣本單位的實(shí)際觀察取得樣本數(shù)據(jù),計(jì)算樣本統(tǒng)計(jì)量的取值作為被估計(jì)參數(shù)的估計(jì)值。
不論社會經(jīng)濟(jì)活動(dòng)還是科學(xué)試驗(yàn),人們作出某種決策之前總是要對許多情況進(jìn)行估計(jì)。例如商品推銷人員要估計(jì)新式時(shí)裝可能為消費(fèi)者所學(xué)好的程度,自選商場經(jīng)理要估計(jì)附近居民的購買能力,民意調(diào)查機(jī)構(gòu)要估計(jì)競選者的得票率,醫(yī)藥生產(chǎn)部門要推廣某種藥品的新配方,必須估計(jì)新藥療效的提高程度等等。這些估計(jì)通常是在信息不完全、結(jié)果不確定的情況下作出。參數(shù)估計(jì)為我們提供一套在滿足一定精確度要求下根據(jù)部分信息來估計(jì)總體參數(shù)的真值,并作出同這個(gè)估計(jì)相適應(yīng)的誤差說明的科學(xué)方法。
科學(xué)的抽樣估計(jì)方法要具備三個(gè)基本條件。
首先是要有合適的統(tǒng)計(jì)量作為估計(jì)量。我們知道統(tǒng)計(jì)量是樣本隨機(jī)變量的函數(shù),根據(jù)樣本隨機(jī)變量可以構(gòu)造許多統(tǒng)計(jì)量,但不是所有的統(tǒng)計(jì)量都能夠充當(dāng)良好的估計(jì)量。例如,從一個(gè)樣本可以計(jì)算平均數(shù)、中位數(shù)、眾數(shù)等等,現(xiàn)在要用來估計(jì)總體平均數(shù),究竟以哪個(gè)樣本統(tǒng)計(jì)量作為估計(jì)量更合適,如果采用樣本平均數(shù)作為估計(jì)量,這就需要回答樣本平均數(shù)和總體平均數(shù)存在什么樣的內(nèi)在聯(lián)系,以樣本平均數(shù)作為良好估計(jì)量的標(biāo)準(zhǔn)是什么等等。只有這些問題解決了,才能通過樣本的實(shí)際觀察確定估計(jì)值,而估計(jì)值是參數(shù)估計(jì)的基礎(chǔ)。
其次,要有合理的允許誤差范圍。允許誤差范圍又稱抽樣極限誤差,指樣本統(tǒng)計(jì)量與被估計(jì)總體參數(shù)離差的絕對值可允許變動(dòng)的上限或下限。離差的絕對值愈小表明抽樣估計(jì)的準(zhǔn)確度愈高,反之,就表明準(zhǔn)確度愈差了。由于統(tǒng)計(jì)量本身也是隨機(jī)變量,所以要使所做的估計(jì)完全沒有誤差是難以實(shí)現(xiàn)的,但估計(jì)誤差也不能太大,估計(jì)誤差如果超過了一定限度參數(shù)估計(jì)本身也就會失去價(jià)值。當(dāng)然也不見得誤差愈小就是愈好的估計(jì),因?yàn)闇p少誤差勢必增加費(fèi)用、時(shí)間,增加人力、物力、財(cái)力的負(fù)擔(dān),這樣甚至?xí)ソM織抽樣調(diào)查的意義。所以在做估計(jì)的時(shí)候應(yīng)該根據(jù)所研究對象的變異程度和分析任務(wù)的要求確定一個(gè)合理的允許誤差范圍,凡估計(jì)值與被估計(jì)值之間的離差不超過允許范圍,這種估計(jì)都算是有效的。例如估計(jì)糧食畝產(chǎn)600公斤,允許誤差范圍6公斤,這意味著如果實(shí)際的糧食畝產(chǎn)在594—606公斤之間都應(yīng)該認(rèn)為估計(jì)是有效的。我們把允許誤差的區(qū)間594—606公斤稱為估計(jì)區(qū)間,允許誤差與估計(jì)值之比稱為誤差率,(1–誤差率)稱為估計(jì)精度,上例誤差率為6/600=1%,估計(jì)精度為1–1%=99%.
再次,要有一個(gè)可接受的置信度。估計(jì)置信度又稱估計(jì)推斷的概率保證程度,這是估計(jì)的可靠性問題。由于抽樣是隨機(jī)抽樣,統(tǒng)計(jì)量是隨機(jī)變量,估計(jì)值所確定的估計(jì)區(qū)間也是隨機(jī)的,在實(shí)際抽樣中并不能做主被估計(jì)的參數(shù)真值都落在允許誤差的范圍內(nèi)。這就產(chǎn)生要冒多大風(fēng)險(xiǎn)相信所作的估計(jì)。如果一種估計(jì)可信度很低,這就意味著所冒的風(fēng)險(xiǎn)很大,這種估計(jì)也就沒有什么價(jià)值。例如我們愿意冒10%的風(fēng)險(xiǎn),這表示如果進(jìn)行多次重復(fù)估計(jì),則平均每100次估計(jì)將10次是錯(cuò)誤,90次估計(jì)正確。90%就稱為置信度或稱概率保證程度。在抽樣估計(jì)中要求達(dá)到100%的置信度是難以做到的,但置信度小了,估計(jì)結(jié)論的可靠性太低,又會影響估計(jì)本身的價(jià)值,所以在做估計(jì)的時(shí)候,也應(yīng)該根據(jù)所研究問題的性質(zhì)和工作的需要確定一個(gè)可接受的估計(jì)置信度。當(dāng)然估計(jì)置信度的要求和準(zhǔn)確度的要求應(yīng)該結(jié)合起來考慮,估計(jì)的準(zhǔn)確度很高而置信度很低或準(zhǔn)確很低而置信度很高都是不合適的。
統(tǒng)計(jì)推斷(Statistical inference)就是根據(jù)樣本的實(shí)際數(shù)據(jù),對總體的數(shù)量特征作出具有一定可靠程度的估計(jì)和判斷。統(tǒng)計(jì)推斷的基本內(nèi)容有參數(shù)估計(jì)和假設(shè)檢驗(yàn)兩方面。概括地說,研究一個(gè)隨機(jī)變量,推斷它具有什么樣的數(shù)量特征,按什么樣的模式來變動(dòng),這屬于估計(jì)理論的內(nèi)容,而推測這些隨機(jī)變量的數(shù)量特征和變動(dòng)模式是否符合我們事先所作的假設(shè),這屬于檢驗(yàn)理論的內(nèi)容。參數(shù)估計(jì)和假設(shè)檢驗(yàn)的共同點(diǎn)是它們都對總體無知或不很了解,都是利用部分觀察值所提供的信息,對總體的數(shù)量特征作出估計(jì)和判斷,但兩者所要解決問題的著重點(diǎn)的所有方法有所不同。本節(jié)先研究總體參數(shù)估計(jì)的問題。
總體參數(shù)估計(jì)是以樣本統(tǒng)計(jì)量(即樣本數(shù)字特征)作為未知總體參數(shù)(即總體數(shù)字特征)的估計(jì)量,并通過對樣本單位的實(shí)際觀察取得樣本數(shù)據(jù),計(jì)算樣本統(tǒng)計(jì)量的取值作為被估計(jì)參數(shù)的估計(jì)值。
不論社會經(jīng)濟(jì)活動(dòng)還是科學(xué)試驗(yàn),人們作出某種決策之前總是要對許多情況進(jìn)行估計(jì)。例如商品推銷人員要估計(jì)新式時(shí)裝可能為消費(fèi)者所學(xué)好的程度,自選商場經(jīng)理要估計(jì)附近居民的購買能力,民意調(diào)查機(jī)構(gòu)要估計(jì)競選者的得票率,醫(yī)藥生產(chǎn)部門要推廣某種藥品的新配方,必須估計(jì)新藥療效的提高程度等等。這些估計(jì)通常是在信息不完全、結(jié)果不確定的情況下作出。參數(shù)估計(jì)為我們提供一套在滿足一定精確度要求下根據(jù)部分信息來估計(jì)總體參數(shù)的真值,并作出同這個(gè)估計(jì)相適應(yīng)的誤差說明的科學(xué)方法。
科學(xué)的抽樣估計(jì)方法要具備三個(gè)基本條件。
首先是要有合適的統(tǒng)計(jì)量作為估計(jì)量。我們知道統(tǒng)計(jì)量是樣本隨機(jī)變量的函數(shù),根據(jù)樣本隨機(jī)變量可以構(gòu)造許多統(tǒng)計(jì)量,但不是所有的統(tǒng)計(jì)量都能夠充當(dāng)良好的估計(jì)量。例如,從一個(gè)樣本可以計(jì)算平均數(shù)、中位數(shù)、眾數(shù)等等,現(xiàn)在要用來估計(jì)總體平均數(shù),究竟以哪個(gè)樣本統(tǒng)計(jì)量作為估計(jì)量更合適,如果采用樣本平均數(shù)作為估計(jì)量,這就需要回答樣本平均數(shù)和總體平均數(shù)存在什么樣的內(nèi)在聯(lián)系,以樣本平均數(shù)作為良好估計(jì)量的標(biāo)準(zhǔn)是什么等等。只有這些問題解決了,才能通過樣本的實(shí)際觀察確定估計(jì)值,而估計(jì)值是參數(shù)估計(jì)的基礎(chǔ)。
其次,要有合理的允許誤差范圍。允許誤差范圍又稱抽樣極限誤差,指樣本統(tǒng)計(jì)量與被估計(jì)總體參數(shù)離差的絕對值可允許變動(dòng)的上限或下限。離差的絕對值愈小表明抽樣估計(jì)的準(zhǔn)確度愈高,反之,就表明準(zhǔn)確度愈差了。由于統(tǒng)計(jì)量本身也是隨機(jī)變量,所以要使所做的估計(jì)完全沒有誤差是難以實(shí)現(xiàn)的,但估計(jì)誤差也不能太大,估計(jì)誤差如果超過了一定限度參數(shù)估計(jì)本身也就會失去價(jià)值。當(dāng)然也不見得誤差愈小就是愈好的估計(jì),因?yàn)闇p少誤差勢必增加費(fèi)用、時(shí)間,增加人力、物力、財(cái)力的負(fù)擔(dān),這樣甚至?xí)ソM織抽樣調(diào)查的意義。所以在做估計(jì)的時(shí)候應(yīng)該根據(jù)所研究對象的變異程度和分析任務(wù)的要求確定一個(gè)合理的允許誤差范圍,凡估計(jì)值與被估計(jì)值之間的離差不超過允許范圍,這種估計(jì)都算是有效的。例如估計(jì)糧食畝產(chǎn)600公斤,允許誤差范圍6公斤,這意味著如果實(shí)際的糧食畝產(chǎn)在594—606公斤之間都應(yīng)該認(rèn)為估計(jì)是有效的。我們把允許誤差的區(qū)間594—606公斤稱為估計(jì)區(qū)間,允許誤差與估計(jì)值之比稱為誤差率,(1–誤差率)稱為估計(jì)精度,上例誤差率為6/600=1%,估計(jì)精度為1–1%=99%.
再次,要有一個(gè)可接受的置信度。估計(jì)置信度又稱估計(jì)推斷的概率保證程度,這是估計(jì)的可靠性問題。由于抽樣是隨機(jī)抽樣,統(tǒng)計(jì)量是隨機(jī)變量,估計(jì)值所確定的估計(jì)區(qū)間也是隨機(jī)的,在實(shí)際抽樣中并不能做主被估計(jì)的參數(shù)真值都落在允許誤差的范圍內(nèi)。這就產(chǎn)生要冒多大風(fēng)險(xiǎn)相信所作的估計(jì)。如果一種估計(jì)可信度很低,這就意味著所冒的風(fēng)險(xiǎn)很大,這種估計(jì)也就沒有什么價(jià)值。例如我們愿意冒10%的風(fēng)險(xiǎn),這表示如果進(jìn)行多次重復(fù)估計(jì),則平均每100次估計(jì)將10次是錯(cuò)誤,90次估計(jì)正確。90%就稱為置信度或稱概率保證程度。在抽樣估計(jì)中要求達(dá)到100%的置信度是難以做到的,但置信度小了,估計(jì)結(jié)論的可靠性太低,又會影響估計(jì)本身的價(jià)值,所以在做估計(jì)的時(shí)候,也應(yīng)該根據(jù)所研究問題的性質(zhì)和工作的需要確定一個(gè)可接受的估計(jì)置信度。當(dāng)然估計(jì)置信度的要求和準(zhǔn)確度的要求應(yīng)該結(jié)合起來考慮,估計(jì)的準(zhǔn)確度很高而置信度很低或準(zhǔn)確很低而置信度很高都是不合適的。