質(zhì)量師中級(jí)理論復(fù)習(xí)考點(diǎn):隨機(jī)變量及其分布(2)

字號(hào):

二、隨機(jī)變量的分布
    雖然隨機(jī)變量的取值是隨機(jī)的,但其本質(zhì)上還是有規(guī)律性的,這個(gè)規(guī)律性可以用分布來(lái)描述。認(rèn)識(shí)一個(gè)隨機(jī)變量X的關(guān)鍵就是要知道它的分布,分布包含如下兩方面內(nèi)容:
    (1) X可能取哪些值,或在哪個(gè)區(qū)間上取值。
    (2) X取這些值的概率各是多少,或X在任一區(qū)間上取值的概率是多少?
    下面分離散隨機(jī)變量和連續(xù)隨機(jī)變量來(lái)敘述它們的分布,因?yàn)檫@兩類(lèi)隨機(jī)變量是重要的兩類(lèi)隨機(jī)變量,而它們的分布形式是有差別的。
    (一) 離散隨機(jī)變量的分布
    離散隨機(jī)變量的分布可用分布列來(lái)表示, 比如,隨機(jī)變量X僅取n個(gè)值: x1,x2, …,xn,
    隨機(jī)變量X取x1的概率為p1,取x2的概率為p2 ,…,取xn的概率為pn。這些可用一張表清楚地表示:
    Xx1 x2 … xn
    p p1 p2 … pn
    或用一個(gè)簡(jiǎn)明的數(shù)學(xué)式子表示:
    作為一個(gè)分布, 滿(mǎn)足以下兩個(gè)條件:
    , 滿(mǎn)足這兩個(gè)條件的分布稱(chēng)為離散分布,這一組 也稱(chēng)為分布的概率函數(shù)。
    [例1.2-2 ] 擲兩顆股子,其樣本空間為:
    考察與這個(gè)隨機(jī)現(xiàn)象有關(guān)的一些隨機(jī)變量:
    設(shè)X表示“擲兩顆子骰子,6點(diǎn)出現(xiàn)的個(gè)數(shù)”,它的分布列為:
    X0 1 2
    p25/36 10/36 1/36
    (2)設(shè)Y表示“擲兩顆子,出現(xiàn)的點(diǎn)數(shù)之和”
    X2 3 4 5 6 7 8 9 10 11 12
    p1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36
    這些隨機(jī)變量X, Y都是各從一個(gè)側(cè)面表示隨機(jī)現(xiàn)象的一種結(jié)果,每個(gè)隨機(jī)變量的取值都是隨機(jī)的,但其分布告訴我們?cè)撾S機(jī)變量取每個(gè)值的概率,使人們不僅對(duì)全局做到心中有數(shù),而且還看到了取哪些值的可能性大,X取哪些值的可能性小,比如:
    X取0可能性大,X取2的可能性小;
    Y取7的可能性大,Y取2或12的可能性小;
    這些分布中的概率都可用古典方法獲得,每個(gè)概率都是非負(fù)的,其和均為1。
    [例1.2-3] 設(shè)在10個(gè)產(chǎn)品中有2個(gè)不合格品,從中隨機(jī)取出4個(gè),其中不合格品數(shù)X是離散隨機(jī)變量,它僅可取0,1,2等三個(gè)值。X取這些值的概率為 (詳見(jiàn)例1.1-4):
    具體計(jì)算后可得如下分布列:
    X0 1 2
    P0.3333 0.5333 0.1334
    從表中可見(jiàn),事件 "X=l"出現(xiàn)的機(jī)會(huì)大。
    對(duì)同樣的問(wèn)題,若用放回抽樣,則從10個(gè)產(chǎn)品(其中有2個(gè)不合格品)中隨機(jī)取出4個(gè),其中不合格品數(shù)Y是另一個(gè)隨機(jī)變量,它可取0,1,2,3,4等五個(gè)值。Y取這些值的概率為(詳見(jiàn)例1.1-5):
    m=0,1,2,3,4
    具體計(jì)算后可得如下分布列:
    X0 1 2 3 4
    p0.4096 0.4096 0.1536 0.0256 0.0016
    這個(gè)分布顯示了Y取哪些值概率大,哪些值概率小。還可計(jì)算有關(guān)事件的概率,比如:
    例[1.2-4],略,見(jiàn)書(shū)第27頁(yè)
    (二) 連續(xù)隨機(jī)變量的分布
    連續(xù)隨機(jī)變量X的分布可用概率密度函數(shù)p(x)表示,有些書(shū)上也記為f(x)。下面以產(chǎn)品的質(zhì)量特性X,(如加工機(jī)械軸的直徑)為例來(lái)說(shuō)明p(x)的由來(lái)。
    假定我們一個(gè)接一個(gè)地測(cè)量產(chǎn)品的某個(gè)質(zhì)量特性值X, 把測(cè)量得到的x值一個(gè)接一個(gè)地放在數(shù)軸上。當(dāng)累積到很多x值時(shí),就形成一定的圖形,為了使這個(gè)圖形得以穩(wěn)定,把縱軸改為單位長(zhǎng)度上的頻率,由于頻率的穩(wěn)定性,隨著被測(cè)質(zhì)量特性值x的數(shù)量愈多,這個(gè)圖形就愈穩(wěn)定,其外形顯現(xiàn)出一條光滑曲線。這條曲線就是概率密度曲線,相應(yīng)的函數(shù)表達(dá)式p(x)稱(chēng)為概率密度函數(shù),它就是一種表示質(zhì)量特性X隨機(jī)取值的內(nèi)在統(tǒng)計(jì)規(guī)律性的函數(shù)。
    概率密度函數(shù)p(x)有多種形式,有的位置不同,有的散布不同,有的形狀不同。這些不同的分布形式反映了質(zhì)量特性總體上的差別,這種差別正是管理層應(yīng)該特別關(guān)注之處。
    這里應(yīng)強(qiáng)調(diào)的是:圖上的縱軸原是“單位長(zhǎng)度上的頻率”,由于頻率的穩(wěn)定性,可用概率代替頻率,從而縱軸就成為 "單位長(zhǎng)度上的概率",這就是概率密度的概念,故后形成的曲線稱(chēng)為概率密度曲線。概率密度函數(shù)p(x)是連續(xù)隨機(jī)變量特有的概念,它有如下性質(zhì)。
    (1)p(x)一定位于x軸上方,即p(x) 0。
    (2)p(x)與x軸所夾的面積恰好為1,即 。
    (3)連續(xù)隨機(jī)變量x在區(qū)間 [a, b] 上的取值的概率 為概率密度曲線下,在區(qū)間 [a, b] 上所夾的曲邊梯形面積 (見(jiàn)圖1.2-3)。
    (4)連續(xù)隨機(jī)變量X取一點(diǎn)的概率為零,即P(X=a)=0,因?yàn)樵谝稽c(diǎn)上的積分永遠(yuǎn)為零。
    (5) ,這是因?yàn)?, 后者為零即得。
    (6)連續(xù)隨機(jī)變量X 的分布函數(shù)F(x)可用其密度函數(shù)算得,即
    F(x)=P(X x)= 注:所謂分布函數(shù)F(x)就是概率密度函數(shù)從 到x的積分,它表示隨機(jī)變量取值從 到x的概率,或 [例1.2-5 ] 考試得分是一個(gè)隨機(jī)變量,下面是三個(gè)不同地區(qū)同一課程考試得分的概率密度函數(shù) (見(jiàn)圖1.2-4)。得分可以取0到100分中的任意值,及格是50分,對(duì)每一地區(qū),及格率大約是0.5呢?還是大大超過(guò)0.5?還是大大低于0.5?
    解:在圖1.2-4上的50分處引一條垂線,則及格概率是:
    從50到100之間的面積
    從圖1.2-4上可以看出:
    地區(qū)(a)的及格概率大大超過(guò)0.5。
    圖1.2-4 三個(gè)地區(qū)考試得分的概率密度函數(shù)
    地區(qū)(b)的及格概率大大低于0.5。
    地區(qū)(c)的及格概率約為0.5。