質(zhì)量師初級(jí)理論知識(shí):關(guān)于數(shù)理統(tǒng)計(jì)內(nèi)容詳解(3)

字號(hào):

統(tǒng)計(jì)量與抽樣分布
    樣本來自總體,因此樣本中包含了有關(guān)總體的豐富信息,但是這些信息是零散的,為了把這些零散的信息集中起來反映總體的特征,我們?nèi)〉脴颖局?,并不是直接利用樣本進(jìn)行推斷,而需要對(duì)樣本進(jìn)行一番“加工”和“提煉”,把樣本中所包含的有關(guān)信息盡可能地集中起來,種有效的辦法就是針對(duì)不同的問題,構(gòu)造出樣本的某種函數(shù),這就是統(tǒng)計(jì)量。不同的函數(shù)可以反映總體的不同的特征。
    1統(tǒng)計(jì)量
    把不含未知參數(shù)的樣本函數(shù)稱為統(tǒng)計(jì)量。一個(gè)統(tǒng)計(jì)量也是一個(gè)隨機(jī)變量。
    定義:設(shè)(X1,X2,…,Xn)為取自總體X的一個(gè)樣本,g(X1,X2,…,Xn)為一個(gè)連續(xù)函數(shù),如果這個(gè)函數(shù)中不包含任何未知參數(shù),則稱g(X1,X2,…,Xn)為一個(gè)統(tǒng)計(jì)量。
    例如,設(shè)X~N(m ,s 2),其中m 已知,s 2未知,(X1,X2,…,Xn)為取自X的樣本,則 是統(tǒng)計(jì)量, ­­­不是統(tǒng)計(jì)量。
    統(tǒng)計(jì)量是樣本的函數(shù),因而統(tǒng)計(jì)量是隨機(jī)變量。
    由統(tǒng)計(jì)量進(jìn)行推斷,便可獲得對(duì)總體的認(rèn)識(shí),統(tǒng)計(jì)推斷是數(shù)理統(tǒng)計(jì)的核心內(nèi)容。
    2抽樣分布
    統(tǒng)計(jì)量的分布稱為抽樣分布。
    例5:從均值為 ,方差為 的總體中抽得一個(gè)樣本量為n的樣本 ,其中 與 均未知。
    在此情形, 是統(tǒng)計(jì)量;而 , 都
    不是統(tǒng)計(jì)量,因?yàn)楹笳甙?, 等未知參數(shù)。
    3常用統(tǒng)計(jì)量
    常用統(tǒng)計(jì)量可分為兩類,一類用來描述樣本的中心位置,另一類用來描述樣本的分散程度。為此先介紹有序樣本的概念,再引入幾個(gè)常用統(tǒng)計(jì)量。
    有序樣本
    設(shè) 是從總體X中隨機(jī)抽取的樣本,樣本量為n,將它們的觀測值從小到大排列為: ,這便是有序樣本。其中 是樣本中的最小觀測值, 是樣本中的觀測值。
    例6 從某種合金強(qiáng)度總體中隨機(jī)抽取樣本量為5的樣本,記為 ,樣本觀測值為:140,150,155,130,145
    解析:將它們從小到大排序后為:130,140,145,150,155,這便是有序樣本,其中最小的觀測值為 =30,的觀測值為 =155。
    (1)描述樣本的中心位置的統(tǒng)計(jì)量
    總體中每一個(gè)個(gè)體的取值盡管是有差異的,但是總有一個(gè)中心位置,如樣本均值、樣本中位數(shù)等。描述樣本中心位置的統(tǒng)計(jì)量反映了總體的中心位置,常用的有以下幾種:
    ①樣本均值
    樣本觀測值有大有小,樣本均值大致處于樣本的中間位置,它可以反映總體分布的均值。
    例7 上例數(shù)據(jù): ,樣本觀測值為:140,150,155,130,145。
    樣本均值為 =(140+150+155+130+145)/5=144。
    對(duì)分組數(shù)據(jù),樣本均值的近似值為
    其中 是分組數(shù), 是第 組的組中值, 是第 組的頻數(shù), 。
    例8 下表是經(jīng)過整理的分組數(shù)據(jù)表,給出了110個(gè)電子元件的失效時(shí)間:
    分組區(qū)間[0,400][400,800)[800,1200)[1200,1600)[1600, 2000)[2000,2400)
    組中值xi2006001000140018002200
    頻數(shù)ni628372397
    解析:
    平均失效時(shí)間近似為:
    = 1170.9
    ②樣本中位數(shù)
    中位數(shù)有時(shí)也記為Me。
    當(dāng)n為奇數(shù)
    , 當(dāng)n為偶數(shù)
    例9 現(xiàn)有兩組數(shù)據(jù)(已經(jīng)排序):2,3,4,4,5,5,5,5,6,6,7,7,8
    2,4,4,4,5,6,6,7,7,8,8,8,9,9
    解析:
    第一組共有13個(gè)數(shù)據(jù),處于中間位置的是第7個(gè)數(shù)據(jù),樣本中位數(shù)即為 。
    第二組共有14個(gè)數(shù)據(jù),處于中間位置的是第7,8個(gè)數(shù)據(jù),樣本中位數(shù)即為 。
    (3)描述樣本數(shù)據(jù)分散程度的統(tǒng)計(jì)量
    總體中各個(gè)個(gè)體的取值總是有差別的,因此樣本的觀測值也是有差異的,這種差異有大有小,反映樣本數(shù)據(jù)的分散程度的統(tǒng)計(jì)量實(shí)際上反映了總體取值的分散程度,常用的有如下幾種:
    ①樣本極差:
    例10 數(shù)據(jù)為 ,樣本觀測值為:140,150,155,130,145,那么將它們從小到大排序后為:130,140,145,150,155
    解析:最小值為130,值為155,因此樣本極差R=155-130=25
    ②樣本方差:
    同樣,對(duì)分組數(shù)據(jù)來講,樣本方差的近似值為:
    其中 表示第i組的組中值。
    例11 數(shù)據(jù)為 ,樣本觀測值為:140,150,155,130,145
    解析:
    上式有兩個(gè)簡化的計(jì)算公式:
    樣本極差的計(jì)算十分簡便,但對(duì)樣本中的信息利用得也較少,而樣本方差就能充分利用樣本中的信息,因此在實(shí)際中樣本方差比樣本極差用得更廣。
    ③樣本標(biāo)準(zhǔn)差:
    在上例中 。
    在例8中,
    樣本標(biāo)準(zhǔn)差的意義:
    樣本方差盡管對(duì)數(shù)據(jù)的利用是充分的,但是方差的量綱(即數(shù)據(jù)的單位)是原始量綱的平方,例如樣本觀測值是長度,單位是“毫米”,而方差的單位是“平方毫米”,單位不同就不便于比較,而采用樣本標(biāo)準(zhǔn)差就消除了單位的差異。