質量師輔導---樣本頻數直方圖(2)

字號:

(二)樣本
    從總體中抽取部分個體所組成的集合稱為樣本。樣本中的個體有時也稱為樣品,樣本中所包含的個體的個數稱為樣本量,常用n表示。
    人們從總體中抽取樣本是為了認識總體,即從樣本推斷總體,如推斷總體是什么類型的分布?總體均值為多少? 總體的標準差是多少? 為了使此種統(tǒng)計推斷有所依據,推斷結果有效,對樣本的抽取應有所要求。
    滿足下面兩個條件的樣本稱為簡單隨機樣本,簡稱隨機樣本。
    (1)隨機性??傮w中每個個體都有相同的機會入樣。比如,按隨機性要求抽出5個樣品,記為 ,則其中每一個個體的分布都應與總體分布相同。只要隨機抽樣就可保證此點實施。
    (2)獨立性。從總體中抽取的每個個體對其他個體的抽取無任何影響。假如總體是無限的,獨立性容易實現;若總體很大,特別地,與樣本量n相比是很大時,即使總體是有限的,此種抽樣獨立性也可得到基本保證。
    綜上兩點,隨機樣本 可以看做n個相互獨立的、同分布的隨機變量,每一個個體的分布與總體分布相同。今后討論的樣本都是指滿足這些要求的簡單隨機樣本。在實際中抽樣時,也應按此要求從總體中進行抽樣。這樣獲得的樣本能夠很好地反映實際總體。圖1.3-3顯示兩個不同的總體,圖上用虛線畫出的曲線是兩個未知總體。若是按隨機性和獨立性要求進行抽樣,則機會大的地方 (概率密度值大)被抽出的樣品就多;而機會少的地方 (概率密度值小),被抽出的樣品就少。分布愈分散,樣本也很分散;分布愈集中,樣本也相對集中。
    抽樣切忌受到干擾,特別是人為干擾。某些人為的傾向性會使所得樣本不是簡單隨機樣本,從而使最后的統(tǒng)計推斷失效。
    若 是從總體X中獲得的樣本,那么 是獨立同分布的隨機變量。樣本的觀測值用 表示,這也是我們常說的數據。有時,為了方便起見,不分大寫與小寫,樣本及其觀測值都用 表示,今后將采用這一方法表示。
    [例1.3-2] 樣本的例子及表示方法。
    (1)某食品廠用自動裝罐機生產凈重為345g的午餐罐頭。由于生產中眾多因素的干擾,每只罐頭凈重都有差別,現從生產線上隨機抽10個罐頭,稱其凈重,得:
    344336345342340338344348344346
    這就是樣本量為10的一個樣本,它是來自該生產線上罐頭凈重這個總體的一個樣本。
    (2)某型號的20輛汽車記錄了各自每加侖汽油行駛的里程數(單位:km)如下:
    29.827.628.328.727.930.129.928.028.727.9
    28.529.527.226.928.427.928.030.029.629.1
    這是來自該型號汽車每加侖汽油行駛里程這個總體的一個樣本,樣本量是20。
    (3)(分組樣本)對363個零售商店調查其周零售額(單位:千元)的結果如下表1.3-1所示:
    表1.3-1 周零售額的調查結果(單位:千元)
    零售額(1,5](5,10](10,20](20,30]
    商店數611351104215
    這是一個樣本量為363的樣本,對應的總體是該地區(qū)全部零售商店的周零售額。這個樣本與前兩個樣本不同,它僅給出樣本所在區(qū)間,沒有給出具體的零售額。這樣做雖會失去一些信息,但要準確獲得每個零售店的周零售額并非易事,能做到的是把區(qū)間再縮小一些。這種樣本稱為分組樣本。在樣本量n很大時,比如幾百甚至上千個,羅列所有數據非常不便,且使人眼花繚亂,不得要領,這時可把樣本作初步整理轉化為分組樣本并加以表達,這樣可立即給人一個大致的印象。以后在作頻率直方圖時,也要用到這個方法。
    (4)(有序樣本)設 是從某總體隨機抽取的一個樣本。將它們按從小到大的順序排列為 ,這便是有序樣本。比如,在本例中(1)的樣本量為10的樣本,經排序可得如下的有序樣本:
    , , , , , , , , , 從有序樣本可獲得一些有用信息。比如,樣本中的最小值為 ,值為 ,兩者之差,即樣本極差 。這些量對我們認識生產線都是有幫助的。